Please use this identifier to cite or link to this item: http://tede2.uepg.br/jspui/handle/prefix/3320
metadata.dc.type: Dissertação
Title: Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos
metadata.dc.creator: Silva, Renann Rodrigues da
metadata.dc.contributor.advisor1: Etto, Rafael Mazer
metadata.dc.contributor.referee1: Stets, Maria Isabel
metadata.dc.contributor.referee2: Rocha, Jose Carlos Ferreira da
metadata.dc.description.resumo: Nas áreas da saúde e agricultura, a identificação bacteriana é essencial para compreender a composição da comunidade microbiana e a sua ecologia. As técnicas de identificação de microrganismos buscam maior precisão, rapidez e menos custo. Uma técnica que vem sendo estudada e amplamente utilizada para a identificação de microrganismos é a identificação através de espectros de massa. Por meio de picos referentes às mais abundantes massas moleculares registradas no espectro, é possível gerar um perfil para reconhecimento de um microrganismo. Outra forma de identificar um espectro de massa, é por meio de picos que são esperados que apareçam no espectro, modelo cujo qual este trabalho fez uso. Para presumir os picos esperados no espectro, foram calculados os pesos moleculares estimados de proteínas ribossomais. Essas proteínas são denominadas house keeping, isto é, são onipresentes e responsáveis pelo funcionamento celular básico. Além de apresentarem em grande abundância no conteúdo procariótico, as proteínas ribossomais são altamente conservadas, não possuindo alteração em sua fisiologia para diferentes meios ou estágios celulares. Os pesos estimados formaram uma base de dados presumida, contendo todas as informações obtidas do repositório do NCBI e foram utilizados somente dados notados como completo, a base de dados criada recebeu o nome de Puchuy e possui 14689 registro. Esta base de dados presumida foi gerada para taxonomia a nível de Domínio, Filo, Classe, Ordem, Família, Gênero e Espécie, e posteriormente submetida à um aprendizado de máquina. Dessa forma, foi possível obter modelos classificatórios de microrganismos baseado em valores de proteínas ribossomais. Foram gerados modelos para cada nível taxonômico, os quais foram utilizados somente os que possuíram melhor desempenho para cada nível. Ainda foi adicionado um algoritmo de agrupamento para o auxílio da classificação. Com os modelos gerados pelo aprendizado de máquina, foi desenvolvido um software, capaz classificar os microrganismos a nível de Filo, Classe, Ordem, Família, Gênero e Espécie. Por fim, foram comparados diferentes classificadores para cada nível taxonômico, com e sem a utilização de um método de agrupamento.
Abstract: In health and agriculture, bacterial identification is essential to understand the composition of the microbial community and its ecology. Microorganism identification techniques seek greater accuracy, speed, and less cost. One technique that has been studied and widely used for the identification of microorganisms is the identification through mass spectra. Through peaks referring to the most abundant molecular masses recorded in the spectrum, it is possible to generate a profile for the recognition of a microorganism. Another way to identify a mass spectrum is through peaks that are expected to appear in the spectrum, the model which this work has made use of. To assume the expected peaks in the spectrum, estimated molecular weights of ribosomal proteins were calculated. These proteins are called housekeeping, that is, they are ubiquitous and responsible for the basic cellular functioning. In addition to their abundant prokaryotic content, ribosomal proteins are highly conserved and do not change their physiology for different cell media or stages. The estimated weights formed a presumed database containing all information obtained from the NCBI repository and only data noted as complete were used, the database created was named Puchuy and has 14689 records. This presumed database was generated for taxonomy at Domain, Phylum, Class, Order, Family, Genus, and Species level, and then subjected to machine learning. Thus, it was possible to obtain classification models of microorganisms based on ribosomal protein values. Models were generated for each taxonomic level, which was used only for those that had better performance for each level. A clustering algorithm was also added to aid classification. With the models generated by the machine learning, the software was developed, able to classify the microorganisms in the Phylum, Class, Order, Family, Genus and Species level. Finally, different classifiers were compared for each taxonomic level, with and without the use of a clustering method.
Keywords: Proteínas Ribossomais
Espectrometria de Massa
Pesos moleculares
Aprendizado de Máquina
Ribosomal Proteins
Mass spectrometry
Molecular Weights
Machine Learning
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
metadata.dc.language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Estadual de Ponta Grossa
metadata.dc.publisher.initials: UEPG
metadata.dc.publisher.department: Departamento de Informática
metadata.dc.publisher.program: Programa de Pós Graduação Computação Aplicada
Citation: SILVA, Renann Rodrigues da. Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos. 2021. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2021.
metadata.dc.rights: Acesso Aberto
Attribution-NonCommercial-NoDerivs 3.0 Brazil
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/br/
URI: http://tede2.uepg.br/jspui/handle/prefix/3320
Issue Date: 4-Dec-2020
Appears in Collections:Programa de Pós Graduação Computação Aplicada

Files in This Item:
File Description SizeFormat 
Renann Rodrigues da Silva.pdfdissertação completa em pdf2.36 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons