Export iten: EndNote BibTex

Please use this identifier to cite or link to this item: https://tede.unioeste.br/handle/tede/7468
Tipo do documento: Tese
Title: Modelagem preditiva da produtividade da soja utilizando aprendizado de máquina
Other Titles: Predictive modeling of soybean productivity using machine learning
Autor: Pereira, Roney Peterson 
Primeiro orientador: Guedes, Luciana Pagliosa Carvalho
Primeiro coorientador: Opazo, Miguel Angel Uribe
Primeiro membro da banca: Guedes, Luciana Pagliosa Carvalho
Segundo membro da banca: Opazo, Miguel Angel Uribe
Terceiro membro da banca: Brun, André Luiz
Quarto membro da banca: Dalposso, Gustavo Henrique
Quinto membro da banca: Ló, Thiago Berticelli
Resumo: Esta tese explora a aplicação de algoritmos de aprendizado de máquina para prever a produtividade da soja em uma área comercial no estado do Paraná, Brasil. A produtividade da soja é influenciada por fatores como condições climáticas e atributos químicos do solo. Foram utilizados dados históricos de produtividade, informações meteorológicas e análises químicas do solo para desenvolver modelos preditivos. No primeiro artigo, algoritmos de aprendizado de máquina, como Random Forest, Gradient Boosting Machine (GBM), Support Vector Regression (SVR), K-Nearest Neighbors (KNN) e Multi-Layer Perceptron (MLP), foram testados. O Random Forest apresentou o melhor desempenho, com a raiz do erro quadrático médio igual a 0,446 e um coeficiente de determinação R2 igual a 0,824. As variáveis mais influentes foram teor de ferro (Fe), teor de potássio (K), preciptação no mês de outubro e preciptação no mês de fevereiro. No segundo artigo, a análise foi expandida para incluir variáveis meteorológicas. Foram aplicadas técnicas de pré-processamento, como correlação linear de Pearson, fator de inflação da variância (FIV) e o método Boruta, para remover a multicolinearidade. Algoritmos de aprendizado de máquina, foram ajustados e comparados, incluindo Random Forest, Extra Trees Regressor, CatBoost, AdaBoost e LightGBM. Após melhorias, o modelo de Random Forest refinado se destacou com uma raiz do erro quadrático médio igual de 0,407 e um R2 de 0,837. A análise SHAP (SHapley Additive exPlanations) revelou que variáveis meteorológicas têm um impacto significativo na produtividade da soja, com influências variadas dos atributos químicos restantes. Por fim, em ambos os artigos, foram construídos Post-Plots para comparar a produtividade real e a predita.
Abstract: This thesis explores the application of machine learning algorithms to predict soybean productivity in a commercial area in the state of Paraná, Brazil. Soybean productivity is influenced by factors such as climatic conditions and chemical attributes of the soil. Historical productivity data, meteorological information, and soil chemical analyses were used to develop predictive models. In the first article, machine learning algorithms such as Random Forest, Gradient Boosting Machine (GBM), Support Vector Regression (SVR), K-Nearest Neighbors (KNN), and Multi-Layer Perceptron (MLP) were tested. The Random Forest algorithm achieved the best performance, with a root mean square error of 0.446 and a coefficient of determination R2 of 0.824. The most influential variables were iron content (Fe), potassium content (K), precipitation in the month of October, and precipitation in the month of February. In the second article, the analysis was expanded to include meteorological variables. Preprocessing techniques such as Pearson’s linear correlation, variance inflation factor (VIF), and the Boruta method were applied to remove multicollinearity. Machine learning algorithms were tuned and compared, including Random Forest, Extra Trees Regressor, CatBoost, AdaBoost, and LightGBM. After refinements, the Random Forest model stood out with a root mean square error of 0.407 and an R2 of 0.837. The SHAP (SHapley Additive exPlanations) analysis revealed that meteorological variables have a significant impact on soybean productivity, with varying influences from the remaining chemical attributes. Finally, in both articles, Post-Plots were constructed to compare actual and predicted productivity.
Keywords: Modelos de previsão
Agricultura de precisão
Análise de dados agrícolas
CNPq areas: CIENCIAS AGRARIAS::ENGENHARIA AGRICOLA
Idioma: por
País: Brasil
Publisher: Universidade Estadual do Oeste do Paraná
Sigla da instituição: UNIOESTE
Departamento: Centro de Ciências Exatas e Tecnológicas
Program: Programa de Pós-Graduação em Engenharia Agrícola
Campun: Cascavel
Citation: PEREIRA, Roney Peterson. Modelagem preditiva da produtividade da soja utilizando aprendizado de máquina. 2024. 88 f. Tese (Programa de Pós-Graduação em Engenharia Agrícola) - Universidade Estadual do Oeste do Paraná, Cascavel - Paraná.
Tipo de acesso: Acesso Aberto
Endereço da licença: http://creativecommons.org/licenses/by-nc-nd/4.0/
URI: https://tede.unioeste.br/handle/tede/7468
Issue Date: 8-Aug-2024
Appears in Collections:Doutorado em Engenharia Agrícola (CVL)

Files in This Item:
File Description SizeFormat 
Roney_Pereira2024.pdf1.66 MBAdobe PDFView/Open Preview


Items in TEDE are protected by copyright, with all rights reserved, unless otherwise indicated.