Métodos clássicos e baseados em aprendizado de máquina para previsão de preço de tomate in natura

Almeida, João Paulo Mendes de

Please use this identifier to cite or link to this item: http://tede2.uepg.br/jspui/handle/prefix/4094

metadata.dc.type:	Dissertação
Title:	Métodos clássicos e baseados em aprendizado de máquina para previsão de preço de tomate in natura
metadata.dc.creator:	Almeida, João Paulo Mendes de
metadata.dc.contributor.advisor1:	Guimarães, Alaine Margarete
metadata.dc.contributor.advisor-co1:	Caires, Eduardo Fávero
metadata.dc.contributor.referee1:	Campos Júnior, Arion de
metadata.dc.contributor.referee2:	Pellini, Tiago
metadata.dc.description.resumo:	Prever os preços agrícolas é crucial para a tomada de decisões e impacta a renda dos agricultores, os preços dos alimentos e a economia como um todo. O tomate é uma das principais olerícolas produzidas e comercializadas no Brasil, com um mercado dinâmico afetado por fatores como variações climáticas e sazonalidade. Este estudo tem como objetivo comparar o desempenho de diferentes métodos clássicos e baseados em aprendizado de máquina na previsão dos preços do tomate nos mercados atacadistas Ceagesp e Ceasa/PR. Os métodos de previsão ARIMA, SARIMA, ARIMAX, SVR, LSTM e CNN foram utilizados, e dados de séries temporais sobre os preços do tomate e outras variáveis correlacionadas foram coletados entre 2010 e 2021. O teste ADF foi utilizado para determinar a ordem de diferenciação necessária para tornar a série estacionária. A análise de componentes principais foi usada para reduzir a dimensionalidade dos dados, extraindo um número menor de componentes que representam a maior parte da variação observada nos dados. O teste de Ljung-Box foi aplicado para analisar os resíduos e verificar a adequação do modelo aos dados observados. O desempenho dos diferentes modelos foi analisado utilizando as métricas RMSE e MAPE. A análise da importância das variáveis é uma etapa importante nos modelos de aprendizado de máquina e foi aplicada para identificar as variáveis preditoras mais influentes sobre a variável de resposta. O teste estatístico não paramétrico de Wilcoxon foi usado para avaliar a diferença entre os modelos candidatos. Os resultados mostraram que algumas variáveis estavam altamente correlacionadas entre si. Este estudo concluiu que o modelo SVR teve uma precisão maior em comparação com outros modelos. A escolha do método mais adequado pode variar de acordo com o objetivo da previsão, o período, a disponibilidade e a qualidade dos dados, entre outros fatores.
Abstract:	Predicting agricultural prices is crucial for decision-making in the agribusiness sector, impacting farmers’ income, food prices, and the economy as a whole. Tomatoes are one of the main vegetables produced and traded in Brazil, with a dynamic market affected by factors such as climatic variations and seasonality. This study aims to compare the performance of different classical and machine learning-based methods in predicting tomato prices in the Ceagesp and Ceasa/PR wholesale markets. The ARIMA, SARIMA, ARIMAX, SVR, LSTM, and CNN forecasting methods were used, and time series data on tomato prices and other correlated variables were collected between 2010 and 2021. The ADF test was used to determine the order of difference required to make the series stationary. Principal component analysis was used to reduce data dimensionality by extracting a smaller number of components that represent most of the variation observed in the data. The Ljung-Box test was applied to analyze residuals and verify model adequacy to observed data. The performance of different models was analyzed using RMSE and MAPE metrics. Variable importance analysis is an important step in machine learning models and was applied to identify the most influential predictor variables on the response variable. The non-parametric Wilcoxon statistical test was used to evaluate the difference between candidate models. Results showed that some variables were highly correlated with each other. This study concluded that the SVR model had higher accuracy compared to other models. The choice of the most suitable method may vary according to the objective of the forecast, period, availability, and quality of data, among other factors.
Keywords:	agricultura mercado atacadista variáveis preditoras análise de variáveis agriculture wholesale market predictor variables variable analysis
metadata.dc.subject.cnpq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
metadata.dc.language:	por
metadata.dc.publisher.country:	Brasil
Publisher:	Universidade Estadual de Ponta Grossa
metadata.dc.publisher.initials:	UEPG
metadata.dc.publisher.department:	Departamento de Informática
metadata.dc.publisher.program:	Programa de Pós Graduação Computação Aplicada
Citation:	ALMEIDA, João Paulo Mendes de. Métodos clássicos e baseados em aprendizado de máquina para previsão de preço de tomate in natura. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2023.
metadata.dc.rights:	Acesso Aberto Attribution-NonCommercial-NoDerivs 3.0 Brazil
metadata.dc.rights.uri:	http://creativecommons.org/licenses/by-nc-nd/3.0/br/
URI:	http://tede2.uepg.br/jspui/handle/prefix/4094
Issue Date:	28-Sep-2023
Appears in Collections:	Programa de Pós Graduação Computação Aplicada

Files in This Item:

File	Description	Size	Format
João Paulo Mendes de Almeida.pdf	dissertação completa em pdf	1.89 MB	Adobe PDF	View/Open

Show full item record Recommend this item

This item is licensed under a Creative Commons License