Please use this identifier to cite or link to this item: http://tede2.uepg.br/jspui/handle/prefix/3013
metadata.dc.type: Dissertação
Title: Identificação de proteínas ribossomais em espectro de massa do tipo Maldi-Tof
metadata.dc.creator: Nascimento, Rodrigo da Silva do
metadata.dc.contributor.advisor1: Campos Junior, Arion
metadata.dc.contributor.advisor-co1: Etto, Rafael Mazer
metadata.dc.contributor.referee1: Cruz, Leonardo Magalhães
metadata.dc.contributor.referee2: Senger, Luciano José
metadata.dc.contributor.referee3: Siqueira, Hugo Valadares
metadata.dc.contributor.referee4: Rocha, José Carlos Ferreira da
metadata.dc.description.resumo: As proteínas ribossomais são utilizadas como biomarcadores na identificação taxonômica das bactérias encontradas nas subunidades 50S e 30S, a partir de sua expressão proteica no espectro de massa do tipo MALDI-TOF. É possível determinar o táxon bacteriano, com o confronto entre os espectros conhecidos e os desconhecidos. Possuindo aplicações em diversas áreas, como por exemplo, na agronomia na qual demandam da identificação de novos microrganismos que auxiliem no crescimento vegetal. Desta forma a identificação das proteínas ribossomais a partir das distribuições estatísticas se fez necessária. Para assim obter um modelo de reconhecimento probabilístico das possíveis proteínas ribossomais. Adiante foi necessário construir um Modelo Linear Generalizado - GLM, acompanhado do Algoritmo Genético, que se destaca pela simplicidade, robustez em solucionar problemas binários complexos e na seleção das variáveis para treinamento. Para a distinção dos melhores modelos classificatórios, foi levado em consideração o menor critério de informação de akaike - AIC. Os resultados foram 59 histogramas de proteínas ribossomais. Assim foram selecionadas oito distribuições estatísticas para o teste e um modelo mistura Laplaciano, algumas distribuições foram promissoras quando analisados pelos testes estatísticos e ainda assim, alguns dados se mostraram com diversos picos. O algoritmo genético mostrou-se favorável na busca de combinações de proteínas para o treinamento do modelo classificatório. Estas combinações geraram dois modelos, o primeiro com uma melhor acurácia e o outro mais específico com uma menor acurácia. A metodologia elaborada neste estudo apresentou como alternativa a discriminação de proteínas ribossomais a partir do classificador GLM. Palavras-chave:Algori Classificador GLM; tmo Genético; Proteínas Ribossomais; Espectros de Massa; Histogramas de proteínas; Modelos Estatísticos
Abstract: Ribosomal proteins are used as biomarkers in the taxonomic identification of bacteria found in the 50S and 30S subunits based on their protein expression in the MALDI-TOF mass spectrum. It is possible to determine the bacterial taxon, with the clash between known and unknown spectra. Having applications in several areas, such as agronomy in which they require the identification of new microorganisms that assist in plant growth. Thus the identification of ribosomal proteins from the statistical distributions was necessary. To obtain a probabilistic recognition model of possible ribosomal proteins. Ahead it was necessary to build a Generalized Linear Model - GLM, accompanied by the Genetic Algorithm, which stands out for its simplicity, robustness in solving complex binary problems and in the selection of variables for training. For the distinction of the best classification models, the lowest information criterion of Akaike - AIC was taken into account. The results were 59 histograms of ribosomal proteins. Thus eight statistical distributions were selected for the test and one Laplacian mixture model, some distributions were promising when analysed by the statistical tests and yet some data showed with several peaks. The genetic algorithm was favourable in the search of protein combinations for the training of the classificatory model. These combinations generated two models, the first with better accuracy and the other more specific with lower accuracy. The methodology elaborated in this study presented as an alternative to the discrimination of ribosomal proteins from the GLM classifier.
Keywords: Classificador GLM
Algoritmo Genético
Proteínas Ribossomais
Espectros de Massa
Histogramas de proteínas
Modelos Estatísticos
GLM Classifier
Genetic Algorithm
Ribosomal proteins
Mass spectra
Protein histograms
Statistical Models
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
metadata.dc.language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Estadual de Ponta Grossa
metadata.dc.publisher.initials: UEPG
metadata.dc.publisher.department: Departamento de Jornalismo
metadata.dc.publisher.program: Programa de Pós Graduação Computação Aplicada
Citation: NASCIMENTO, R. S. Identificação de proteínas ribossomais em espectro de massa do tipo Maldi-Tof. 2019. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2019.
metadata.dc.rights: Acesso Aberto
Attribution-NonCommercial-NoDerivs 3.0 Brazil
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/br/
URI: http://tede2.uepg.br/jspui/handle/prefix/3013
Issue Date: 11-Sep-2019
Appears in Collections:Programa de Pós Graduação Computação Aplicada

Files in This Item:
File Description SizeFormat 
Rodrigo Nascimento.pdf2.78 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons