Please use this identifier to cite or link to this item:
http://tede2.uepg.br/jspui/handle/prefix/3013
metadata.dc.type: | Dissertação |
Title: | Identificação de proteínas ribossomais em espectro de massa do tipo Maldi-Tof |
metadata.dc.creator: | Nascimento, Rodrigo da Silva do |
metadata.dc.contributor.advisor1: | Campos Junior, Arion |
metadata.dc.contributor.advisor-co1: | Etto, Rafael Mazer |
metadata.dc.contributor.referee1: | Cruz, Leonardo Magalhães |
metadata.dc.contributor.referee2: | Senger, Luciano José |
metadata.dc.contributor.referee3: | Siqueira, Hugo Valadares |
metadata.dc.contributor.referee4: | Rocha, José Carlos Ferreira da |
metadata.dc.description.resumo: | As proteínas ribossomais são utilizadas como biomarcadores na identificação taxonômica das bactérias encontradas nas subunidades 50S e 30S, a partir de sua expressão proteica no espectro de massa do tipo MALDI-TOF. É possível determinar o táxon bacteriano, com o confronto entre os espectros conhecidos e os desconhecidos. Possuindo aplicações em diversas áreas, como por exemplo, na agronomia na qual demandam da identificação de novos microrganismos que auxiliem no crescimento vegetal. Desta forma a identificação das proteínas ribossomais a partir das distribuições estatísticas se fez necessária. Para assim obter um modelo de reconhecimento probabilístico das possíveis proteínas ribossomais. Adiante foi necessário construir um Modelo Linear Generalizado - GLM, acompanhado do Algoritmo Genético, que se destaca pela simplicidade, robustez em solucionar problemas binários complexos e na seleção das variáveis para treinamento. Para a distinção dos melhores modelos classificatórios, foi levado em consideração o menor critério de informação de akaike - AIC. Os resultados foram 59 histogramas de proteínas ribossomais. Assim foram selecionadas oito distribuições estatísticas para o teste e um modelo mistura Laplaciano, algumas distribuições foram promissoras quando analisados pelos testes estatísticos e ainda assim, alguns dados se mostraram com diversos picos. O algoritmo genético mostrou-se favorável na busca de combinações de proteínas para o treinamento do modelo classificatório. Estas combinações geraram dois modelos, o primeiro com uma melhor acurácia e o outro mais específico com uma menor acurácia. A metodologia elaborada neste estudo apresentou como alternativa a discriminação de proteínas ribossomais a partir do classificador GLM. Palavras-chave:Algori Classificador GLM; tmo Genético; Proteínas Ribossomais; Espectros de Massa; Histogramas de proteínas; Modelos Estatísticos |
Abstract: | Ribosomal proteins are used as biomarkers in the taxonomic identification of bacteria found in the 50S and 30S subunits based on their protein expression in the MALDI-TOF mass spectrum. It is possible to determine the bacterial taxon, with the clash between known and unknown spectra. Having applications in several areas, such as agronomy in which they require the identification of new microorganisms that assist in plant growth. Thus the identification of ribosomal proteins from the statistical distributions was necessary. To obtain a probabilistic recognition model of possible ribosomal proteins. Ahead it was necessary to build a Generalized Linear Model - GLM, accompanied by the Genetic Algorithm, which stands out for its simplicity, robustness in solving complex binary problems and in the selection of variables for training. For the distinction of the best classification models, the lowest information criterion of Akaike - AIC was taken into account. The results were 59 histograms of ribosomal proteins. Thus eight statistical distributions were selected for the test and one Laplacian mixture model, some distributions were promising when analysed by the statistical tests and yet some data showed with several peaks. The genetic algorithm was favourable in the search of protein combinations for the training of the classificatory model. These combinations generated two models, the first with better accuracy and the other more specific with lower accuracy. The methodology elaborated in this study presented as an alternative to the discrimination of ribosomal proteins from the GLM classifier. |
Keywords: | Classificador GLM Algoritmo Genético Proteínas Ribossomais Espectros de Massa Histogramas de proteínas Modelos Estatísticos GLM Classifier Genetic Algorithm Ribosomal proteins Mass spectra Protein histograms Statistical Models |
metadata.dc.subject.cnpq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
metadata.dc.language: | por |
metadata.dc.publisher.country: | Brasil |
Publisher: | Universidade Estadual de Ponta Grossa |
metadata.dc.publisher.initials: | UEPG |
metadata.dc.publisher.department: | Departamento de Jornalismo |
metadata.dc.publisher.program: | Programa de Pós Graduação Computação Aplicada |
Citation: | NASCIMENTO, R. S. Identificação de proteínas ribossomais em espectro de massa do tipo Maldi-Tof. 2019. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2019. |
metadata.dc.rights: | Acesso Aberto Attribution-NonCommercial-NoDerivs 3.0 Brazil |
metadata.dc.rights.uri: | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
URI: | http://tede2.uepg.br/jspui/handle/prefix/3013 |
Issue Date: | 11-Sep-2019 |
Appears in Collections: | Programa de Pós Graduação Computação Aplicada |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Rodrigo Nascimento.pdf | 2.78 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License