Please use this identifier to cite or link to this item:
http://hdl.handle.net/1843/34608
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor1 | Vinícius Diniz Mayrink | pt_BR |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/8460573638694827 | pt_BR |
dc.contributor.referee1 | Vinícius Diniz Mayrink | pt_BR |
dc.contributor.referee2 | Rosangela Helena Loschi | pt_BR |
dc.contributor.referee3 | Flávio Bambirra Gonçalves | pt_BR |
dc.contributor.referee4 | Rafael izbicki | pt_BR |
dc.contributor.referee5 | Florencia Graciela Leonardi | pt_BR |
dc.creator | Erick da Conceição Amorim | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/3225417947229827 | pt_BR |
dc.date.accessioned | 2021-01-04T13:07:07Z | - |
dc.date.available | 2021-01-04T13:07:07Z | - |
dc.date.issued | 2020-02-19 | - |
dc.identifier.uri | http://hdl.handle.net/1843/34608 | - |
dc.description.abstract | Factor analysis is a powerful tool for dimension reduction in a multivariate statistical study. This Thesis is dedicated to extend the factor model with non-linear interactions proposed in 2013. The main contribution of our work is to present two approaches to cluster the non-linear interactions and thus develop new models that are not restricted to the extreme scenarios where all non-null interactions are different or all are the same. The first strategy to handle the clusters involves a finite mixture of degenerated components. The second option is especified via the Dirichlet process. A comprehensive simulation study is developed to explore the proposals and it shows their good performances. A sentitivity analysis is carried out to evaluate advantages of estimating a smoothness parameter defined in a covariance function of the Gaussian process establishing the non-linearity of the interactions. In terms of application, the methodology is illustrated with the analysis of gene expression related to four breast cancer data sets. Here, the genes belonging to disjoint genome regions, with copy number alteration, are connected to the main factors and their non-linear interactions are estimated and clustered. The mutual investigation and comparison of these four breast cancer data sets is rarely found in the literature. | pt_BR |
dc.description.resumo | A análise fatorial é uma ferramenta poderosa para a redução da dimensão nos estudos de estatística multivariada. Esta tese é dedicada a estender o modelo fatorial com interações não lineares proposto em 2013. A principal contribuição do trabalho é apresentar duas abordagens para agrupar as interações não lineares, e assim desenvolver novos modelos que não são restritos à cenários extremos onde todas as interações não nulas são diferentes ou todas iguais. A primeira estratégia para lidar com os grupos envolve uma mistura finita de componentes degeneradas. A segunda opção é especificada por um processo Dirichlet. Um estudo simulado abrangente é desenvolvido para explorar as propostas e mostrar seus bons desempenhos. Uma análise de sensibilidade é realizada para avaliar as vantagens de estimar o parâmetro de suavização definido na função de covariância do processo Gaussiano que estabelece a não linearidade das interações. Em termos de aplicação, a metodologia é apresentada em análise de expressão de genes relacionados a quatro conjuntos de dados referente ao câncer de mama. Aqui, os genes pertencentes a regiões disjuntas do genoma, com alteração do número de cópias, estão conectados aos fatores principais e suas interações não lineares são estimadas e agrupadas. A investigação conjunta e a comparação desses quatro conjuntos de dados sobre câncer de mama raramente são encontradas na literatura. | pt_BR |
dc.description.sponsorship | FAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais | pt_BR |
dc.description.sponsorship | CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Minas Gerais | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | ICX - DEPARTAMENTO DE ESTATÍSTICA | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Estatística | pt_BR |
dc.publisher.initials | UFMG | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Mistura | pt_BR |
dc.subject | Processo Dirichlet | pt_BR |
dc.subject | Expressão de genes | pt_BR |
dc.subject | Câncer de mama | pt_BR |
dc.subject.other | Estatística. – Teses. | pt_BR |
dc.subject.other | Análise multivariada – Teses. | pt_BR |
dc.subject.other | Análise fatorial – Teses. | pt_BR |
dc.subject.other | Mamas - Câncer. – Teses. | pt_BR |
dc.title | Agrupamento de interações não lineares em análise fatorial | pt_BR |
dc.type | Tese | pt_BR |
Appears in Collections: | Teses de Doutorado |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.