Please use this identifier to cite or link to this item: http://tede2.uepg.br/jspui/handle/prefix/121
metadata.dc.type: Dissertação
Title: INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS
metadata.dc.creator: Estevam Junior, Valter Luís
metadata.dc.contributor.advisor1: Guimarães, Alaine Margarete
metadata.dc.contributor.advisor-co1: Caires, Eduardo Fávero
metadata.dc.contributor.referee1: Pozo, Aurora Trinidad Ramirez
metadata.dc.contributor.referee2: Garbuio, Fernando José
metadata.dc.description.resumo: A interessabilidade de regras é uma área da mineração de dados que tem por objetivo reduzir a quantidade de modelos a serem analisados por especialistas na etapa de interpretação do conhecimento descoberto em bases de dados. Embora existam várias medidas de interesse de regras voltadas para as tarefas de associação e classificação, observa-se uma falta de métodos consolidados para análise de interessabilidade de modelos de regressão. Neste trabalho foi desenvolvido um método para analisar a interessabilidade de modelos de regressão, o qual combina um filtro baseado em modelos probabilísticos multivariados com filtros baseados em testes estatísticos de correlação de Pearson e de postos de sinais de Wilcoxon, resultando em uma nova medida de interessabilidade denominada Impacto. O método desenvolvido foi aplicado sobre modelos de regressão encontrados no processo de mineração de dados para estimativa de gesso agrícola. Estes dados resultam de três experimentos sob Sistema Plantio Direto realizados na Região dos Campos Gerais, PR, nos quais foram medidos, em diferentes épocas, os teores dos nutrientes do solo após a aplicação de doses de gesso. Os resultados mostraram que o filtro probabilístico multivariado foi capaz de filtrar os melhores modelos segundo uma visão de utilidade, ou seja, de potencial de aplicação agronômica. Foram selecionados seis modelos com score de Impacto > 0,5, ou seja, considerados interessantes, e destes apenas um foi considerado incorretamente classificado. Por outro lado, os filtros baseados em testes estatísticos foram capazes de filtrar seis modelos sendo que dois deles podem ser considerados incorretamente classificados. Os atributos identificados como mais relevantes para o problema do gesso agrícola foram a época, o teor de Ca e a concentração de Ca em relação à capacidade de troca catiônica efetiva (CTCe), especialmente em camadas superficiais do solo.
Abstract: The interestingness area of data mining process aiming to reduce the amount of models to be analyzed for experts in the interpretation step of the knowledge discovery in databases. In this work, a method for analysis the interestingness of regression models was developed. This method combine probabilistic multivariate models with Pearson correlation test and Wilcoxon signed-rank test resulting in a new interestingness measure, named Impact. The developed method was applied over regression models found during a data mining process for estimating agricultural gypsum requirements. The results showed that the probabilistic multivariate filter was able to filter the best models according to a utility-based approach, in this case, for practical application on agriculture. Six models were considered interesting, with Impact score > 0.5, and only one was miscategorized. On the other hand, the combined statistical test filters were able to filter six models two of them were miscategorized. The attributes identified as most relevant to estimate gypsum rate were: time, Ca and its concentration on effective cation exchange capacity (CaCTCe), mainly in superficial layers.
Keywords: gesso agrícola
redes bayesianas
sensitividade
impacto
gypsum
bayesian networks
sensitivity
impact
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
metadata.dc.language: por
metadata.dc.publisher.country: BR
Publisher: UNIVERSIDADE ESTADUAL DE PONTA GROSSA
metadata.dc.publisher.initials: UEPG
metadata.dc.publisher.department: Computação para Tecnologias em Agricultura
metadata.dc.publisher.program: Programa de Pós Graduação Computação Aplicada
Citation: ESTEVAM JUNIOR, Valter Luís. INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS. 2015. 82 f. Dissertação (Mestrado em Computação para Tecnologias em Agricultura) - UNIVERSIDADE ESTADUAL DE PONTA GROSSA, Ponta Grossa, 2015.
metadata.dc.rights: Acesso Aberto
URI: http://tede2.uepg.br/jspui/handle/prefix/121
Issue Date: 26-Feb-2015
Appears in Collections:Programa de Pós Graduação Computação Aplicada

Files in This Item:
File SizeFormat 
Valter Luis.pdf3.43 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.