Please use this identifier to cite or link to this item: http://tede2.uepg.br/jspui/handle/prefix/151
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Pozo, Aurora Trinidad Ramirez
dc.contributor.advisor1Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4728283P4por
dc.contributor.advisor-co1Guimarães, Alaine Margarete
dc.contributor.advisor-co1Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4705808J570608040991por
dc.contributor.referee1Jaccoud Filho, David de Souza
dc.contributor.referee1Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4786438E1por
dc.contributor.referee2Mathias, Ivo Mario
dc.contributor.referee2Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4705808H0por
dc.creatorWeber, Alison Roger Hajo
dc.creator.Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4297686A1por
dc.date.accessioned2017-07-21T14:19:33Z-
dc.date.available2012-10-15
dc.date.available2017-07-21T14:19:33Z-
dc.date.issued2012-08-01
dc.identifier.citationWEBER, Alison Roger Hajo. PROGRAMAÇÃO GENÉTICA, REDES NEURAIS ARTIFICIAIS E TÉCNICAS DE BALANCEAMENTO NA MODELAGEM DE DADOS AGRÍCOLAS: ESTUDO DA DOENÇA MOFO BRANCO. 2012. 75 f. Dissertação (Mestrado em Computação para Tecnologias em Agricultura) - UNIVERSIDADE ESTADUAL DE PONTA GROSSA, Ponta Grossa, 2012.por
dc.identifier.urihttp://tede2.uepg.br/jspui/handle/prefix/151-
dc.description.abstractData regression problems are common in the literature, therein it is desired to infer the relationship between the dependent (output) and independent variable (input) from a dataset. Infer the relationship between variables is not a simple task, many times there is a high non-linearity and noise in the data inside them. Two machine learning techniques that are able to work with this type of information are investigated, the Genetic Programming and Artificial Neural Networks. Still, in many cases the machine learning technique cannot find a satisfactory solution due to the unbalance of the database. Therefore, the aim of this study was to apply machine learning techniques in regression of unbalanced data, evaluating and comparing the results obtained with different approaches. The balancing method used is summarized in constructing weights to the data set, one for each sample, which represents the importance of example during the learning process model. This problem of unbalanced data modeling applies in a real agronomic data modeling, specifically in the study of white mold disease caused by the fungus Sclerotinia sclerotiorum (Lib.) de Bary. Due to the high destructive power of the disease to crops, knowledge of the presence of resistance structures called sclerotia in an area is of paramount importance so that appropriate actions are taken to treat the disease. In this case study, the task is to use learning techniques to build a predictive model of sclerotia from meteorological characteristics and location of the sample to the state of Paraná, using a set of unbalanced data. Different approaches to the techniques and the balancing method was employed for constructing the model. The Artificial Neural Networks with resilient propagation learning algorithm achieved better performance in creating the model for prediction of sclerotia able to predict the actual outcome with a correlation of 0.763 and a mean absolute error of 24.35. To identify if the employee balancing method improved the results we applied the Kruskal-Wallis test. The test showed that there is a statistically significant improvement between genetic programming with and without balancing technique. However the technique that showed the best results was the neural network with resilient propagation learning algorithm, the data set of white mold and in some cases experimental.eng
dc.description.resumoProblemas de regressão de dados são comuns na literatura, neles deseja-se inferir a relação entre variáveis dependentes (saída) e variáveis independentes (entrada) a partir de um conjunto de dados. Inferir esta relação entre as variáveis não é uma tarefa simples, por muitas vezes existirem uma alta não linearidade nos dados e pelo ruído existente neles. Duas técnicas de aprendizagem de máquina que são capazes de trabalhar com este tipo de informação são investigadas, a Programação Genética e as Redes Neurais Artificiais. Ainda assim, em muitos casos a técnica de aprendizado de máquina não consegue encontrar uma solução satisfatória, devido ao desbalanceamento da base de dados. Portanto, o objetivo deste trabalho foi aplicar técnicas de aprendizagem de máquina na regressão de dados desbalanceados, avaliando e comparando os resultados obtidos com diferentes abordagens. O método de balanceamento empregado resume-se em construir pesos para o conjunto de dados, um para cada exemplo, que representa a importância do exemplo durante o processo de aprendizagem do modelo. Este problema de modelagem em dados desbalanceados aplica-se em um caso real de modelagem de dados agronômicos, mais especificamente no estudo da doença mofo branco, causada pelo fungo Sclerotinia sclerotiorum (Lib.) de Bary. Devido ao alto poder destrutivo da doença para as culturas, o conhecimento da presença das estruturas de resistência chamadas de escleródios em uma área é de suma importância para que se tomem atitudes adequadas para o tratamento da doença. Neste estudo de caso, a tarefa é utilizar as técnicas de aprendizagem para a construção de um modelo de previsão de escleródios a partir de características meteorológicas e do local da amostra para o estado do Paraná, utilizando um conjunto de dados desbalanceados. Diferentes abordagens com as técnicas e com o método de balanceamento foram empregadas na construção do modelo. As Redes Neurais Artificiais com o algoritmo de aprendizagem resilient propagation obtiveram um melhor desempenho na criação do modelo para previsão de escleródios, conseguindo prever o resultado real com uma correlação de 0,763 e um erro médio absoluto de 24,35. Para identificar se o método de balanceamento empregado melhorou os resultados obtidos foi aplicado o teste de Kruskal-Wallis. O teste mostrou que existe uma melhora estatisticamente significativa entre a programação genética com e sem a técnica de balanceamento. Porem a técnica que apresentou melhores resultados foi a Rede Neural com o algoritmo de aprendizagem resilient propagation, no conjunto de dados do mofo branco e em alguns casos experimentais.por
dc.description.provenanceMade available in DSpace on 2017-07-21T14:19:33Z (GMT). No. of bitstreams: 1 AlisonWeber.pdf: 1901250 bytes, checksum: c554c4802feb0647c03048f60b92b2a9 (MD5) Previous issue date: 2012-08-01en
dc.formatapplication/pdfpor
dc.languageporpor
dc.publisherUNIVERSIDADE ESTADUAL DE PONTA GROSSApor
dc.publisher.countryBRpor
dc.publisher.departmentComputação para Tecnologias em Agriculturapor
dc.publisher.programPrograma de Pós Graduação Computação Aplicadapor
dc.publisher.initialsUEPGpor
dc.rightsAcesso Abertopor
dc.subjectmodelagempor
dc.subjectescleródiopor
dc.subjectcomputaçãopor
dc.subjectregressãopor
dc.subjectdesbalanceadospor
dc.subjectmodelingeng
dc.subjectsclerotiaeng
dc.subjectcomputingeng
dc.subjectregressioneng
dc.subjectunbalancedeng
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpor
dc.titlePROGRAMAÇÃO GENÉTICA, REDES NEURAIS ARTIFICIAIS E TÉCNICAS DE BALANCEAMENTO NA MODELAGEM DE DADOS AGRÍCOLAS: ESTUDO DA DOENÇA MOFO BRANCOpor
dc.typeDissertaçãopor
Appears in Collections:Programa de Pós Graduação Computação Aplicada

Files in This Item:
File SizeFormat 
AlisonWeber.pdf1.86 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.