Discriminant analysis in stationary time series based on robust cepstral coefficients

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Tese de doutorado

Título alternativo

Análise discriminante em séries temporais estacionárias baseada em coeficientes cepstrais robustos

Primeiro orientador

Membros da banca

Glaura da Conceição Franco
Pascal Thierry Bondon
Marton Spany
Maria Helena Mouriño Silva Nunes
Ta-Hsin Li

Resumo

A análise de séries temporais é crucial em áreas como finanças, economia, meio ambiente e engenharia biomédica para entender mecanismos internos, fazer previsões e identificar padrões. Métodos tradicionais no domínio do tempo, focados em tendências, sazonalidade e ruído, muitas vezes não consideram periodicidades e estruturas harmônicas, que são melhor capturadas no domínio da frequência. Analisar séries temporais nesse domínio permite identificar propriedades espectrais, oferecendo insights mais profundos sobre os comportamentos das séries temporais. Tais insights ajudam a diferenciar processos geradores de dados de diferentes populações, auxiliando na discriminação e classificação de séries temporais. A literatura geralmente utiliza estimadores suavizados, como o periodograma suavizado, para minimizar o viés, obtendo um espectro médio a partir de réplicas dentro de uma população. No entanto, variabilidade espectral dentro de cada população e valores abruptos podem comprometer esses métodos, dificultando a classificação prática. Há uma lacuna na literatura sobre métodos que considerem essa variabilidade, separem o efeito do ruído branco das autocorrelações e usem estimadores robustos na presença de valores extremos. Este artigo aborda essa lacuna, apresentando uma estrutura robusta para classificar grupos de réplicas de séries temporais, transformando-as no domínio da frequência usando a Transformada de Fourier para calcular o \textit{power spectra}, o \textit{log spectra} e o \textit{cepstra}. Para calcular o \textit{cepstra}, toma-se o logaritmo do espectro para separar a contribuição do ruído branco das autocorrelações, aplicando a Transformada de Fourier inversa ao espectro logarítmico. Para mitigar os efeitos de outliers e melhorar a consistência das estimativas espectrais, utilizamos o periodograma multitaper junto com o M-periodograma. Essas características espectrais são então usadas na Análise Discriminante Linear (LDA) para aumentar a precisão e a interpretabilidade da classificação. Esta abordagem integrada é promissora para aplicações que requerem distinção temporal precisa e resiliência a anomalias nos dados.

Abstract

Time series analysis is essential in fields such as finance, economics, environmental science, and biomedical engineering for understanding underlying mechanisms, forecasting, and identifying patterns. Traditional time-domain methods, which focus on trends, seasonality, and noise, often overlook periodicities and harmonic structures that are better captured in the frequency domain. Analyzing time series in the frequency domain enables the identification of these spectral properties, providing deeper insights into the underlying processes. These insights can help differentiate data-generating processes of different populations and assist in the discrimination and classification of time series. The literature commonly uses smoothed estimators like the smoothed periodogram to minimize bias, obtaining an average spectrum from individual replicates within a population to classify new time series. However, if there is spectral variability among replicates within each population, such methods become unfeasible. Moreover, abrupt values can significantly impact spectrum estimators, complicating practical discrimination and classification. There is a gap in the literature for methods that consider within-population spectral variability, separate white noise effects from autocorrelations, and use robust estimators in the presence of outliers. This paper addresses this gap by presenting a robust framework for classifying replicate groups of time series by transforming them into the frequency domain using the Fourier Transform to compute the power spectrum. Then, after taking the logarithm of the spectra, the inverse Fourier Transform is used to achieve the cepstrum. To mitigate the effects of outliers and improve the consistency of spectral estimates, we employ the multitaper periodogram alongside the M-periodogram. These spectral features are then utilized in Linear Discriminant Analysis (LDA) to enhance classification accuracy and interpretability. This integrated approach offers significant potential for applications requiring precise temporal pattern distinction and resilience to data anomalies.

Assunto

Estatística – Teses, Análise de séries temporais – Teses, Análise discriminatória – Teses, Fourier, Transformações de - Teses, Seqüências espectrais (Matemática) - Teses

Palavras-chave

Séries temporais, análise discriminante linear, Classificação, Cepstral, Domínio da frequência, Multitaper

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por