Please use this identifier to cite or link to this item: http://tede2.uepg.br/jspui/handle/prefix/162
metadata.dc.type: Dissertação
Title: Computação paralela para reduzir o tempo de resposta da mineração de dados agrícolas
metadata.dc.creator: Abreu, Cristian Cosmoski Rangel de
metadata.dc.contributor.advisor1: Senger, Luciano José
metadata.dc.contributor.referee1: Vaz, Maria Salete Marcon Gomes
metadata.dc.contributor.referee2: Góis, Lourival Aparecido de
metadata.dc.description.resumo: O objetivo deste trabalho foi investigar a utilização da computação paralela para reduzir o tempo de resposta da mineração de dados na agricultura. Para esse fim, uma ferramenta, chamada Fast Weka foi definida e implementada. Essa ferramenta permite executar algoritmos de mineração de dados e explorar o paralelismo em computadores multi-núcleos com uso de threads em sistemas distribuídos empregando redes peer-to-peer. A exploração do paralelismo ocorre por meio do paralelismo de dados inerente ao processo de validação cruzada (folds). A ferramenta foi avaliada por meio de experimentos de mineração de dados utilizando algoritmos de redes neurais artificiais aplicados em um conjunto de dados de tipos de coberturas florestais. A computação multi-thread e a computação em redes peer-to-peer permitiram reduzir o tempo de resposta das atividades de mineração de dados. Os melhores resultados foram obtidos quando empregados um número múltiplo de threads ou pares em relação ao número de folds da validação cruzada. Observou-se uma eficiência de 87% quando utilizadas 4 threads para 24 folds e 86% de eficiência, também, com 2 folds utilizando redes peer-to-peer co 11 pares.
Abstract: The objective of this study was investigate the use of parallel computing to reduce the response time of data mining in agriculture. For this purpose, a tool, called Fast Weka been defined and implemented. This tool allows running data mining algorithms and explore parallelism in multi-core computers with the use of threads and distributed systems employing peer-to-peer networks. The exploration of parallelism occurs through the data parallelism inherent to the process of cross-validation (folds). The tool was evaluated through experiments using artificial neural networks data mining algorithms applied to a data set of forest cover types. The multi-thread computing and computing on peer-to-peer networks allowed to reduce the response time of data mining activities. The best results were achieved when employed a multiple number of threads or pairs in the number of folds of cross validation. It was observed and efficiency of 87% when used 4 threads to 24 folds and 86% efficiency also in peer-to-peer networks using 24 folds with 11 pairs.
Keywords: computação paralela
mineração de dados
peer-to-peer
tipos de coberturas florestais
parallel computing
data mining
peer-to-peer
forest cover types
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
metadata.dc.language: por
metadata.dc.publisher.country: BR
Publisher: UNIVERSIDADE ESTADUAL DE PONTA GROSSA
metadata.dc.publisher.initials: UEPG
metadata.dc.publisher.department: Computação para Tecnologias em Agricultura
metadata.dc.publisher.program: Programa de Pós Graduação Computação Aplicada
Citation: ABREU, Cristian Cosmoski Rangel de. Computação paralela para reduzir o tempo de resposta da mineração de dados agrícolas. 2013. 66 f. Dissertação (Mestrado em Computação para Tecnologias em Agricultura) - UNIVERSIDADE ESTADUAL DE PONTA GROSSA, Ponta Grossa, 2013.
metadata.dc.rights: Acesso Aberto
URI: http://tede2.uepg.br/jspui/handle/prefix/162
Issue Date: 30-Apr-2013
Appears in Collections:Programa de Pós Graduação Computação Aplicada

Files in This Item:
File SizeFormat 
Cristian Abreu.pdf2.17 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.