Export iten: EndNote BibTex

Please use this identifier to cite or link to this item: https://tede.unioeste.br/handle/tede/6656
Tipo do documento: Dissertação
Title: Engenharia e extração de recursos em séries temporais de índice de vegetação para mapeamento de área com culturas anuais
Other Titles: FEATURE ENGINEERING AND FEATURE EXTRACTION IN TIME SERIES VEGETATION INDEX FOR MAPPING AREAS WITH ANNUAL CROPS
Autor: Almeida, Luiz 
Primeiro orientador: Mercante, Erivelto
Primeiro coorientador: Johann, Jerry Adriani
Primeiro membro da banca: Mercante, Erivelto
Segundo membro da banca: Antunes, João Francisco Gonçalves
Terceiro membro da banca: Maggi, Marcio Furlan
Resumo: No Brasil, as operações financeiras de crédito, custeio e seguro agrícola são as principais políticas de incentivo ao desenvolvimento da agricultura. De acordo com o Manual de Crédito Rural (MCR), a instituição financeira concedente é responsável pelo monitoramento e pela fiscalização das operações de crédito rural, autorizando a utilização de técnicas de geoprocessamento e sensoriamento remoto para essa finalidade. A aferição e validação da área agricultável do imóvel é uma das informações necessárias ao cumprimento do MCR. Essa demanda pode ser atendida com a utilização de técnicas de mineração de dados em séries temporais de índices de vegetação (STIV) para classificação de culturas anuais. O objetivo deste trabalho foi mapear e estimar áreas com culturas agrícolas anuais, utilizando mineração de dados e técnicas de engenharia e extração de recursos em séries temporais de índice de vegetação. A área de estudo compreende a região oeste do estado da Bahia, Nordeste do Brasil, devido à disponibilidade do Dataset LEM+ com classes de uso e cobertura da terra para a região. A metodologia geral segue o processo descoberta de conhecimento em banco de dados (KDD). O processo de KDD contém 5 etapas, sendo: 1ª etapa - seleção de dados com 48 imagens de índice de vegetação do sensor MODIS dos satélites Terra e Aqua, entre o período de 22/09/2019 e 21/09/2020; 2ª etapa - pré-processamento: divisão dos valores das STIV por 10.000 e empilhamento em cubo temporal de STIV; 3ª etapa - transformação: geração de 2 grupos de imagens, um com suavização da STIV com filtro Savitzky-Golay (SG) e o outro com simplificação da STIV, extraindo sua componente de tendência (TD) com o algoritmo de Decomposição Sazonal Baseado em Perda (STL), utilizando de técnicas de engenharia e extração de recursos para construção de 25 imagens de atributos derivados (AD) em cada tratamento; 4ª etapa - mineração de dados, foram utilizadas 73 imagens (STIV + AD) de cada tratamento SG e TD e criadas 10 combinações de atributos contendo STIV, AD básicos e AD polares. O algoritmo Boruta foi utilizado para seleção de atributos com maior importância para a tarefa de classificação das culturas anuais e o classificador Random forest (RF) otimizado com Grid search cross validation, para encontrar o melhor modelo de classificação; 5ª etapa - avaliação e interpretação, foram extraídas estatísticas das 10 combinações de atributos para aferição de acurácia, Kappa e precisão do mapeamento. Os resultados mais promissores foram identificados na combinação 8, que possuía 73 atributos, sendo eles a STIV gerada com o componente de tendência, 15 AD extraídos com métricas básicas e 10 AD gerados com métricas polares, em que, com o Boruta, foram selecionados apenas 60 atributos. A máscara construída com RF mapeou 2,53 milhões de hectares com culturas anuais na região do estudo. Com superestimativa de 12,5%, em relação aos dados oficiais do IBGE a máscara obteve acurácia de 92%, Kappa de 86% e precisão aproximada de 92,2%. Do Cadastro Ambiental Rural (CAR), foi selecionado um imóvel rural e realizada uma simulação de um processo na fiscalização de crédito agrícola. Foi comparada a área de uso consolidado do imóvel, de 852,82 hectares, com casos de mapeamento da área com culturas anuais. Um dos casos obteve área mapeada de 848,145 hectares com acurácia de 99,22%, Kappa de 98,32% e precisão aproximada de 100%. Esse caso de mapeamento foi realizado aplicando-se o modelo RF treinado em imagens de STIV e AD recortadas para o imóvel rural. As técnicas aplicadas no mapeamento de áreas com culturas anuais utilizando mineração de dados, engenharia e extração de atributos em STIV permitem agilidade em processos de gestão territorial e para validação de informações sobre imóveis rurais no crédito agrícola realizado por instituições financeiras.
Abstract: In Brazil, financial credit operations, costing and agricultural insurance are the main policies to encourage the development of agriculture. According to the Manual de Crédito Rural [Rural Credit Manual] (MCR), the granting financial institution is responsible for monitoring and inspecting rural credit operations, authorizing the use of geoprocessing and remote sensing techniques for this purpose. The measurement and validation of the farmable area of the property is one of the information necessary for compliance with the MCR. This demand can be met with the use of data mining techniques in time series vegetation index (STIV) for the classification of annual crops. With this panorama in mind, the objective of this research was to map and estimate areas with annual agricultural crops using data mining and engineering techniques and resource extraction in time series vegetation index. The study area comprises the western region of the state of Bahia, Northeastern Brazil, due to the availability of the LEM+ Dataset with land use and land cover classes for the region. The general methodology is based on the process known as Knowledge Discovery in Databases (KDD). The KDD process contains 5 steps, as follows: 1st stage - data selection with 48 vegetation index images from the MODIS sensor of the Terra and Aqua satellites, between the period of 09/22/2019 and 09/21/2020; 2nd stage - pre-processing: division of STIV values by 10,000 and stacking in STIV temporal cube; 3rd stage - transformation: generation of 2 groups of images, one with STIV smoothing which utilized the Savitzky-Golay filter (SG), and the other with STIV simplification by extracting its trend component (TD) with the Seasonal-Trend Decomposition Procedure Based on Loess algorithm (STL), applying feature engineering and feature extraction techniques in order to build 25 images of derived attributes (AD) in each treatment; 4th stage - data mining: 73 images (STIV + AD) of each SG and TD treatment were employed, and 10 combinations of attributes were created containing STIV, basic ADs and polar ADs. The Boruta algorithm was used to select attributes with greater importance for the annual crops classification task and the Random Forest (RF) classifier was optimized with Grid Search Cross Validation, with the purpose of finding the best classification model; 5 th stage - evaluation and interpretation, statistics were extracted from the 10 combinations of attributes to measure Accuracy, Kappa and Mapping Precision. The most promising results were identified in combination 8, which had 73 attributes, namely the STIV generated with the trend component, 15 AD extracted with basic metrics and 10 AD generated with polar metrics, in which, with the Boruta algorithm, only 60 attributes were selected. The mask built with RF mapped 2.53 million hectares with annual crops in the study region. With an overestimation of 12.5% in relation to official Brazilian Institute of Geography and Statistics (IBGE) data, the mask obtained an Accuracy of 92%, Kappa of 86% and Precision of approximately 92.2%. From the Cadastro Ambiental Rural [Rural Environmental Registry] (CAR), a rural property was selected, and a simulation of an agricultural credit inspection process was carried out. The area of consolidated use of the property, which had 852.82 hectares, was compared with cases of mapping the area with annual crops. One of the cases obtained a mapped area of 848.145 hectares with an Accuracy of 99.22%, Kappa of 98.32% and an approximate Precision of 100%. This mapping case was performed by applying the RF model trained on STIV and AD images cropped for said rural property. In conclusion, the techniques applied in mapping areas with annual crops using data mining, feature engineering and feature extraction in STIV allow agility in territorial management processes and for the validation of information on rural properties in agricultural credit carried out by financial institutions.
Keywords: Aprendizagem de máquina
Mineração de dados
Sensoriamento remoto
Machine learning
Rata mining
Remote sensing
CNPq areas: SISTEMAS BIOLÓGICOS E AGROINDUSTRIAIS
Idioma: por
País: Brasil
Publisher: Universidade Estadual do Oeste do Paraná
Sigla da instituição: UNIOESTE
Departamento: Centro de Ciências Exatas e Tecnológicas
Program: Programa de Pós-Graduação em Engenharia Agrícola
Campun: Cascavel
Citation: Almeida, Luiz. Engenharia e extração de recursos em séries temporais de índice de vegetação para mapeamento de área com culturas anuais. 2023. 79 f. Dissertação(Mestrado em Engenharia Agrícola) - Universidade Estadual do Oeste do Paraná, Cascavel.
Tipo de acesso: Acesso Aberto
Endereço da licença: http://creativecommons.org/licenses/by/4.0/
URI: https://tede.unioeste.br/handle/tede/6656
Issue Date: 17-Feb-2023
Appears in Collections:Mestrado em Engenharia Agrícola (CVL)

Files in This Item:
File Description SizeFormat 
Luiz_Almeida.2023.pdfArquivo completo4.17 MBAdobe PDFView/Open Preview


This item is licensed under a Creative Commons License Creative Commons