Please use this identifier to cite or link to this item: http://tede2.uepg.br/jspui/handle/prefix/2409
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Guimarães, Alaine Margarete-
dc.contributor.advisor1Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4705808J5pt_BR
dc.contributor.advisor-co1Caires, Eduardo Fávero-
dc.contributor.referee1Rautenberg, Sandro-
dc.creatorFerreira, Pablo Henrique-
dc.creator.Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4312290H9pt_BR
dc.date.accessioned2017-11-30T19:05:51Z-
dc.date.available2017-11-30-
dc.date.available2017-11-30T19:05:51Z-
dc.date.issued2017-04-27-
dc.identifier.citationFERREIRA, Pablo Henrique. Redução da dimensionalidade para estimativa de teores de nutrientes em folhas e grãos de soja com espectroscopia no infravermelho. 2017, 93f. Dissertação (Mestrado em Computação Aplicada), Universidade Estadual de Ponta Grossa, Ponta Grossa, 2017.pt_BR
dc.identifier.urihttp://tede2.uepg.br/jspui/handle/prefix/2409-
dc.description.abstractThe high dimensionality in databases is a problem that can occur in several fields, including the plants nutrients state analysis. These analyses are currently based on methodologies that spend time and reagents. (NIR-NearInfrared) and (MIR-MiddleInfrared) spectroscopy have been shown to be a faster and clean alternative to simultaneous quantification of compounds. Since reading occurs at wavelengths generating hundreds attributes for the NIR and thousands to the MIR the data obtained by such equipment have a high dimensionality. One of the difficulties is to identify which attributes are more relevant for the nutrient analysis. This work aimed to verify the correlation gain obtained with the use of dimensionality reduction techniques with data obtained by NIR and MIR spectroscopy. The goal is to estimated levels of 11 nutrients in grains and leaves of soybean: Nitrogen (N), Phosphorus (P), Potassium (K), Calcium (Ca), Magnesium (Mg), Sulfur (S), Copper (Cu), Manganese (Mn), Iron (Fe), Zinc (Zn) and Boron (B). For that, 231 soybean leaves and 285 soybeans samples were analysed by spectroscopy in the mid-infrared and nearinfrared region. The regression models were generated by machine learning algorithms: SMOReg which implements the support vector machine for regression; M5Rules that is based on decision trees with regression functions; and LinearRegression algorithm for linear regression. The results were evaluated by correlation coefficient (r) and the quadratic error (RRSE). Estimating leaf nutrients was satisfactory for both NIR and MIR spectroscopy, where correlations of 0.80 above were obtained for P, K, Mg, S, Mn, Cu, Fe and Zn. There were no correlations for B and Ca in soybean leaves. Estimating nutrient was also satisfactory for soybeans, but only in NIR spectroscopy data, where correlations above 0.7 were obtained for N, P, K, Ca, and S. Using dimensionality reduction techniques provided the high values for correlation of P, K, and S in soybean leaves, making use of the LinearRegression algorithm. For soybeans, the dimensionality reduction was essential in obtaining satisfactory correlations, except for N, always using the LinearRegression algorithm. When reducing the dimensionality was not used, satisfactory results were obtained by the SMOREg algorithm from foliar data to N, Mg, Cu, Mn, Fe, and Zn. Reducing dimensionality associated to the use of LinearRegression algorithm resulted in better correlations for three nutrients in leaves and satisfactory rates of grain. The observed results demonstrate a greater efficiency in the use of the NIR for foliar analysis than for grain analysis. SMOReg computational techniques and LinearRegression algorithm presented the best results, being the SMOReg indicated for large quantities of attributes and Linear- Regression for smaller quantitiespt_BR
dc.description.resumoA alta dimensionalidade em bases de dados é um problema que pode estar presente em diversos segmentos, inclusive nas análises do estado de nutrientes em plantas. Atualmente essas análises são baseadas em metodologias que demandam tempo e reagentes. A espectroscopia do infravermelho próximo (NIR – NearInfrared) e médio (MIR – MiddleInfrared) têm se mostrado uma alternativa mais rápida e limpa em relação a quantificação simultânea de compostos. Os dados obtidos por esses equipamentos apresentam alta dimensão. A leitura ocorre em comprimentos de onda gerando centenas atributos para o NIR e milhares para o MIR. Uma das dificuldades está em identificar quais atributos são mais relevantes para análise dos nutrientes. Este trabalho teve como objetivo verificar o ganho de correlação obtido com o emprego de redução de dimensionalidade em dados obtidos por espectroscopia NIR e MIR, para estimativa de teores de 11 nutrientes em grãos e folhas de soja, sendo eles: Nitrogênio (N), Fósforo (P), Potássio (K), Cálcio (Ca), Magnésio (Mg), Enxofre (S), Cobre (Cu), Manganês (Mn), Ferro (Fe), Zinco (Zn) e Boro (B). Para isto, 231 amostras de folhas de soja e 285 de grãos de soja foram utilizadas para geração de modelos de regressão, sendo os espectros obtidos através dos espectrofotômetros NIR e MIR. Os modelos de regressão foram gerados pelos algoritmos de aprendizado de máquina SMOReg que implementa a máquina de vetor de suporte para regressão, o algoritmo baseado em árvores de decisão com funções de regressão M5Rules e o algoritmo LinearRegression. Os resultados foram avaliados através do coeficiente de correlação (r) e o erro quadrático (RRSE). A estimativa de nutrientes para folhas foi satisfatória tanto para espectroscopia NIR e MIR, onde correlações acima de 0,80 foram obtidas para os nutrientes P, K, Mg, S, Mn, Cu, Fe e Zn. Não houve correlações para B e Ca em folhas de soja. A estimativa de teores de nutrientes foi também satisfatória para grãos de soja, mas apenas em dados de espectroscopia NIR, onde correlações acima de 0,7 foram obtidas para N, P, K, Ca e S. O uso da redução de dimensionalidade proporcionou os altos valores para correlação de P, K e S em folhas de soja, fazendo uso do algoritmo LinearRegression. Para os grãos de soja, a redução de dimensionalidade foi imprescindível na obtenção de correlações satisfatórias, exceto para N, sempre utilizando o algoritmo LinearRegression. Quando a redução da dimensionalidade não foi usada, os resultados satisfatórios foram obtidos pelo algoritmo SMOREg a partir de dados foliares para os nutrientes N, Mg, Cu, Mn, Fe e Zn. A utilização da redução de dimensionalidade junto ao algoritmo LinearRegression auxiliou na obtenção de melhores correlações para três nutrientes em folhas e para os índices satisfatórios de grãos. Os resultados observados demonstram uma maior eficiência no uso do NIR para análises foliares do que para análises de grãos. As técnicas computacionais SMOReg e LinearRegression obtiveram os melhores resultados, sendo a SMOReg indicada para grandes quantidades de atributos e LinearRegression para quantidades menores de atributos.pt_BR
dc.description.provenanceSubmitted by Angela Maria de Oliveira (amolivei@uepg.br) on 2017-11-30T19:05:51Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Pablo Henrique Ferreira.pdf: 12205608 bytes, checksum: a2f75e7cec618577bfd7fddda3302b17 (MD5)en
dc.description.provenanceMade available in DSpace on 2017-11-30T19:05:51Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Pablo Henrique Ferreira.pdf: 12205608 bytes, checksum: a2f75e7cec618577bfd7fddda3302b17 (MD5) Previous issue date: 2017-04-27en
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superiorpt_BR
dc.languageporpt_BR
dc.publisherUniversidade Estadual de Ponta Grossapt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentDepartamento de Informáticapt_BR
dc.publisher.programPrograma de Pós Graduação Computação Aplicadapt_BR
dc.publisher.initialsUEPGpt_BR
dc.rightsAcesso Abertopt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectRefletância espectralpt_BR
dc.subjectMineração de dadospt_BR
dc.subjectSeleção de variáveispt_BR
dc.subjectModelos de regressãopt_BR
dc.subjectSpectral reflectancept_BR
dc.subjectData miningpt_BR
dc.subjectSelection of variablespt_BR
dc.subjectRegression Modelspt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.titleRedução da dimensionalidade para estimativa de teores de nutrientes em folhas e grãos de soja com espectroscopia no infravermelhopt_BR
dc.typeDissertaçãopt_BR
Appears in Collections:Programa de Pós Graduação Computação Aplicada

Files in This Item:
File Description SizeFormat 
Pablo Henrique Ferreira.pdfdissertação completa em pdf11.92 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons