Please use this identifier to cite or link to this item: http://tede2.uepg.br/jspui/handle/prefix/4059
metadata.dc.type: Dissertação
Title: Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF
metadata.dc.creator: Oyama, Luiz Otávio
metadata.dc.contributor.advisor1: Etto, Rafael Mazer
metadata.dc.contributor.referee1: Rocha, José Carlos Ferreira da
metadata.dc.contributor.referee2: Leite, Wellington Claiton
metadata.dc.description.resumo: A identificação bacteriana é um tema de grande relevância no campo da agricultura para a compreensão da microbiologia do solo, sobretudo, a rizosfera. Entre as técnicas de identificação de microrganismos, a Espectrometria de Massa do tipo MALDI-TOF, do inglês Matrix-Assisted Laser Desorption/Ionization Time-of-Flight, tem sido extensivamente adotada como alternativa mais econômica e eficaz do que os métodos tradicionais, baseados em características fenotípicas. Este método permite a identificação de um microrganismo, pois cada microrganismo terá um perfil de espectro de massa único. No espectro de massa gerado, biomarcadores podem ser assinalados e utilizados como critério de classificação das amostras. Proteínas ribossomais são exemplos de biomarcadores confiáveis para a identificação bacteriana, pois desempenham funções vitais da célula e são altamente conservadas em sua sequência de aminoácidos. O classificador bacteriano Ribopeaks usa dados de massas moleculares dessas proteínas para a identificação do organismo. No entanto, espectros de bactérias inteiras podem conter picos correspondentes a proteínas não-ribossomais, peptídeos, metabólitos e lipídios em sua assinatura, o que dificulta a correta classificação. Diante disso, este trabalho utilizou da abordagem de agrupamento, por meio do algoritmo DBSCAN, do inglês Density-Based Spatial Clustering of Applications with Noise, para encontrar grupos de proteínas ribossomais sem distinção dos tipos, de modo a obter um filtro que identifique a partir da massa de uma macromolécula sua compatibilidade com uma proteína ribossomal. Para desenvolver os modelos, a base de dados Puchuy contendo as massas estimadas das proteínas ribossomais foi empregada. Essa base passou por uma fase de pré-processamento antes de ser submetida ao processo de aprendizado de máquina. Um automatizador para múltiplas classificações bacterianas no Ribopeaks foi construído para viabilizar a validação dos modelos gerados, enviando os organismos da base de dados reais SpectraBank ao classificador antes e após a filtragem dos picos. O filtro conseguiu aumentar discretamente a precisão do classificador bacteriano, ao mesmo tempo em que reduziu em média 40,1% do número de picos presentes na amostra bacteriana. Além disso, houve uma diminuição de 35,66% no tempo necessário para classificar esses mesmos organismos.
Abstract: Bacterial identification is a topic of great standard in the field of agriculture for the understanding of soil microbiology, especially the rhizosphere. Among all techniques for identifying microorganisms, Mass Spectrometry MALDI-TOF type has been extensively adopted as a more economical and effective alternative than traditional methods, due to its phenotypic characteristics. This method facilitates microorganism identification, as each microorganism possesses a distinct mass spectrum profile. Within the produced mass spectrum, specific biomarkers can be assigned and utilized as criteria for sample classification. Ribosomal proteins are examples of biomarkers poised for bacterial identification, given their roles in cellular maintenance and their remarkable conservation in amino acid sequences. The Ribopeaks bacterial classifier uses molecular mass data from ribosomal proteins for organism identification. However, mass spectra data obtained from whole bacterial might include peaks associated with non-ribosomal proteins, peptides, metabolites, and lipids within their distinctive patterns, creating challenges for accurate classification. In this study, a clustering approach was employed, utilizing the DBSCAN algorithm, to cluster ribosomal proteins regardless of their specific types. This approach aimed to create a filter capable of determining the compatibility of a given macromolecule mass with a ribosomal protein. For construction of the models, the Puchuy base of presumed masses of ribosomal proteins was used, which went through a pre-processing step before being submitted to machine learning. A controller for multiple bacterial classifications in Ribopeaks was built to enable the validation of the generated models, sending the organisms from the real SpectraBank database to the classifier before and after filtering the peaks. In the best case, the filter was able to subtly increase the assertiveness of the bacterial classifier, with an average reduction of 40.1% in the peak volume of the bacterial sample and a reduction of 35.66% in the processing time for classification of the same organisms.
Keywords: Aprendizado de Máquina
Bioinformática
Biotecnologia
Espectrometria de Massa
Machine Learning
Bioinformatics
Biotechnology
Mass Spectrometry
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
metadata.dc.language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Estadual de Ponta Grossa
metadata.dc.publisher.initials: UEPG
metadata.dc.publisher.department: Departamento de Informática
metadata.dc.publisher.program: Programa de Pós Graduação Computação Aplicada
Citation: OYAMA, Luiz Otávio. Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2023.
metadata.dc.rights: Acesso Aberto
Attribution-NonCommercial-NoDerivs 3.0 Brazil
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/br/
URI: http://tede2.uepg.br/jspui/handle/prefix/4059
Issue Date: 30-Aug-2023
Appears in Collections:Programa de Pós Graduação Computação Aplicada

Files in This Item:
File Description SizeFormat 
Luiz Otávio Oyama .pdfdissertação completa em pdf3.36 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons