Please use this identifier to cite or link to this item: http://tede2.uepg.br/jspui/handle/prefix/2665
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Rocha, José Carlos Ferreira da-
dc.contributor.advisor1Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4703018J8pt_BR
dc.contributor.referee1Borges, André Pinz-
dc.contributor.referee2Galvão, Carolina Weigert-
dc.creatorSantos, Fábio dos-
dc.creator.Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?metodo=apresentar&id=K4074615Y8pt_BR
dc.date.accessioned2018-11-06T17:08:39Z-
dc.date.available2018-11-06-
dc.date.available2018-11-06T17:08:39Z-
dc.date.issued2018-09-14-
dc.identifier.citationSANTOS, Fabio dos. Algoritmo kNN na imputação de dados de espectros de massa do tipo MALDI-TOF: uma análise da influência da imputação com kNN sobre o desempenho de classificadores logísticos para identificação de bactérias. 2018. 82 f. Dissertação (Mestrado em Computação Aplicada)- Universidade Estadual de Ponta Grossa, Ponta Grossa, 2018.pt_BR
dc.identifier.urihttp://tede2.uepg.br/jspui/handle/prefix/2665-
dc.description.abstractIt is subject of several studies in bioinformatics area the plant growth promoting bacteria identification process. An approach to performing it is to process sample’s ribosomal proteins data obtained by MALDI-TOF mass spectrometry through a classifier and select the highest probability label. However, at the time of mass spectra generation, it is common not detecting some ribosomal proteins related peaks data. With this in mind, this work presents a study about data imputation through the kNN algorithm. Logistic classifiers were applied to identify bacteria of the Bacillus genus and the Staphylococcus aureus species while three data imputation techniques were tested: with zero, with the average of the missing attribute, and with kNN algorithm. From this latter imputation technique, two approaches were considered: average aggregation function and median aggregation function. The adopted experimental protocol investigated the imputation influence on classification results under different scenarios regarding missing variablesnumber.TheresultsshowthatbothkNN’sapproachesdidnotpromotesignificantreduction on classifiers’ performance when compared with complete data approach and that the classification of imputed data by kNN presented superior performance to that of other considered methods.pt_BR
dc.description.resumoO processo de identificação de bactérias relacionadas ao crescimento vegetal,é alvo de diversos estudos na área de bioinformática. Uma das formas para realizar esta identificação é utilizar dados de espectrometria de massa do tipo MALDI-TOF para detectar a presença de proteínas ribossomaisemumaamostra,eentão,usarclassificadoresparaprocessarestesdadoseselecionar o rótulo com a maior probabilidade. Durante o processo de geração dos espectros de massa paraclassificaçãoécomumanãodetecçãodealgumdospicosrelacionadosaproteínasribossomais. Considerando isto, este trabalho apresenta um estudo sobre o uso do algoritmo kNN para imputação desses casos. O estudo foi desenvolvido com o uso de classificadores logísticos para identificação de bactérias da espécie Staphylococcus aureus e do gênero Bacillus. Durante os experimentos foram testados três técnicas para imputar dados: imputação com zero, imputação com a média do atributo faltante, e a imputação com kNN. Desta última foram usadas duas abordagens: função de agregação de média e função de agregação de mediana. O protocolo experimental implementado possibilitou avaliar a influência da imputação sobre os resultados de classificação sob diferentes cenários no que se refere ao número de variáveis faltantes. Os resultadosobtidosmostramqueoempregodokNNnãolevouàumareduçãododesempenhodos classificadores, em relação àquele observado quando do uso de dados completos. Além disto, a classificação de dados submetidos a imputação pelo kNN apresentou desempenho superior àquele verificado quando do uso dos demais métodos.pt_BR
dc.description.provenanceSubmitted by Angela Maria de Oliveira (amolivei@uepg.br) on 2018-11-06T17:08:39Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Fábio dos Santos.pdf: 1456053 bytes, checksum: 5ee15a88a68aaef87a46a8f42f816e32 (MD5)en
dc.description.provenanceMade available in DSpace on 2018-11-06T17:08:39Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Fábio dos Santos.pdf: 1456053 bytes, checksum: 5ee15a88a68aaef87a46a8f42f816e32 (MD5) Previous issue date: 2018-09-14en
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superiorpt_BR
dc.languageporpt_BR
dc.publisherUniversidade Estadual de Ponta Grossapt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentDepartamento de Informáticapt_BR
dc.publisher.programPrograma de Pós Graduação Computação Aplicadapt_BR
dc.publisher.initialsUEPGpt_BR
dc.rightsAcesso Abertopt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectImputação com kNNpt_BR
dc.subjectEspectrometria de Massapt_BR
dc.subjectRegressão Logísticapt_BR
dc.subjectClassificação de Bactériaspt_BR
dc.subjectImputation with kNNpt_BR
dc.subjectMass Spectrometrypt_BR
dc.subjectLogistic Regressionpt_BR
dc.subjectBacterial Classificationpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.titleAlgoritmo kNN na imputação de dados de espectros de massa do tipo MALDI-TOF: uma análise da influência da imputação com kNN sobre o desempenho de classificadores logísticos para identificação de bactériaspt_BR
dc.typeDissertaçãopt_BR
Appears in Collections:Programa de Pós Graduação Computação Aplicada

Files in This Item:
File Description SizeFormat 
Fabio dos Santos.pdf1.38 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons