Share |
![]() ![]() |
Please use this identifier to cite or link to this item:
https://tede.unioeste.br/handle/tede/7468
Tipo do documento: | Tese |
Title: | Modelagem preditiva da produtividade da soja utilizando aprendizado de máquina |
Other Titles: | Predictive modeling of soybean productivity using machine learning |
Autor: | Pereira, Roney Peterson ![]() |
Primeiro orientador: | Guedes, Luciana Pagliosa Carvalho |
Primeiro coorientador: | Opazo, Miguel Angel Uribe |
Primeiro membro da banca: | Guedes, Luciana Pagliosa Carvalho |
Segundo membro da banca: | Opazo, Miguel Angel Uribe |
Terceiro membro da banca: | Brun, André Luiz |
Quarto membro da banca: | Dalposso, Gustavo Henrique |
Quinto membro da banca: | Ló, Thiago Berticelli |
Resumo: | Esta tese explora a aplicação de algoritmos de aprendizado de máquina para prever a produtividade da soja em uma área comercial no estado do Paraná, Brasil. A produtividade da soja é influenciada por fatores como condições climáticas e atributos químicos do solo. Foram utilizados dados históricos de produtividade, informações meteorológicas e análises químicas do solo para desenvolver modelos preditivos. No primeiro artigo, algoritmos de aprendizado de máquina, como Random Forest, Gradient Boosting Machine (GBM), Support Vector Regression (SVR), K-Nearest Neighbors (KNN) e Multi-Layer Perceptron (MLP), foram testados. O Random Forest apresentou o melhor desempenho, com a raiz do erro quadrático médio igual a 0,446 e um coeficiente de determinação R2 igual a 0,824. As variáveis mais influentes foram teor de ferro (Fe), teor de potássio (K), preciptação no mês de outubro e preciptação no mês de fevereiro. No segundo artigo, a análise foi expandida para incluir variáveis meteorológicas. Foram aplicadas técnicas de pré-processamento, como correlação linear de Pearson, fator de inflação da variância (FIV) e o método Boruta, para remover a multicolinearidade. Algoritmos de aprendizado de máquina, foram ajustados e comparados, incluindo Random Forest, Extra Trees Regressor, CatBoost, AdaBoost e LightGBM. Após melhorias, o modelo de Random Forest refinado se destacou com uma raiz do erro quadrático médio igual de 0,407 e um R2 de 0,837. A análise SHAP (SHapley Additive exPlanations) revelou que variáveis meteorológicas têm um impacto significativo na produtividade da soja, com influências variadas dos atributos químicos restantes. Por fim, em ambos os artigos, foram construídos Post-Plots para comparar a produtividade real e a predita. |
Abstract: | This thesis explores the application of machine learning algorithms to predict soybean productivity in a commercial area in the state of Paraná, Brazil. Soybean productivity is influenced by factors such as climatic conditions and chemical attributes of the soil. Historical productivity data, meteorological information, and soil chemical analyses were used to develop predictive models. In the first article, machine learning algorithms such as Random Forest, Gradient Boosting Machine (GBM), Support Vector Regression (SVR), K-Nearest Neighbors (KNN), and Multi-Layer Perceptron (MLP) were tested. The Random Forest algorithm achieved the best performance, with a root mean square error of 0.446 and a coefficient of determination R2 of 0.824. The most influential variables were iron content (Fe), potassium content (K), precipitation in the month of October, and precipitation in the month of February. In the second article, the analysis was expanded to include meteorological variables. Preprocessing techniques such as Pearson’s linear correlation, variance inflation factor (VIF), and the Boruta method were applied to remove multicollinearity. Machine learning algorithms were tuned and compared, including Random Forest, Extra Trees Regressor, CatBoost, AdaBoost, and LightGBM. After refinements, the Random Forest model stood out with a root mean square error of 0.407 and an R2 of 0.837. The SHAP (SHapley Additive exPlanations) analysis revealed that meteorological variables have a significant impact on soybean productivity, with varying influences from the remaining chemical attributes. Finally, in both articles, Post-Plots were constructed to compare actual and predicted productivity. |
Keywords: | Modelos de previsão Agricultura de precisão Análise de dados agrícolas |
CNPq areas: | CIENCIAS AGRARIAS::ENGENHARIA AGRICOLA |
Idioma: | por |
País: | Brasil |
Publisher: | Universidade Estadual do Oeste do Paraná |
Sigla da instituição: | UNIOESTE |
Departamento: | Centro de Ciências Exatas e Tecnológicas |
Program: | Programa de Pós-Graduação em Engenharia Agrícola |
Campun: | Cascavel |
Citation: | PEREIRA, Roney Peterson. Modelagem preditiva da produtividade da soja utilizando aprendizado de máquina. 2024. 88 f. Tese (Programa de Pós-Graduação em Engenharia Agrícola) - Universidade Estadual do Oeste do Paraná, Cascavel - Paraná. |
Tipo de acesso: | Acesso Aberto |
Endereço da licença: | http://creativecommons.org/licenses/by-nc-nd/4.0/ |
URI: | https://tede.unioeste.br/handle/tede/7468 |
Issue Date: | 8-Aug-2024 |
Appears in Collections: | Doutorado em Engenharia Agrícola (CVL) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Roney_Pereira2024.pdf | 1.66 MB | Adobe PDF | View/Open Preview |
Items in TEDE are protected by copyright, with all rights reserved, unless otherwise indicated.