Sunday 27 August 2017

Função De Autocorrelação De Modelo Médio Móvel


Objetivo: Verificar os lotes de Autocorrelação de aleatoriedade (Box e Jenkins, pp. 28-32) são uma ferramenta comumente usada para verificar a aleatoriedade em um conjunto de dados. Essa aleatoriedade é verificada pela computação de autocorrelações para valores de dados em diferentes intervalos de tempo. Se aleatório, tais autocorrelações devem estar próximas de zero para separações de tempo e intervalo. Se não aleatório, uma ou mais das autocorrelações serão significativamente diferentes de zero. Além disso, os gráficos de autocorrelação são usados ​​na fase de identificação do modelo para os modelos de séries temporais médias autorregressivas Box-Jenkins. Autocorrelação é apenas uma medida da aleatoriedade Observe que não corretamente não significa aleatoriamente. Os dados que possuem autocorrelação significativa não são aleatórios. No entanto, dados que não mostram autocorrelação significativa ainda podem exibir aleatoriedade de outras maneiras. A autocorrelação é apenas uma medida de aleatoriedade. No contexto da validação do modelo (que é o principal tipo de aleatoriedade que discutimos no Manual), a verificação da autocorrelação é geralmente um teste suficiente de aleatoriedade, uma vez que os resíduos de modelos de montagem pobres tendem a exibir aleatoriedade não sutil. No entanto, algumas aplicações exigem uma determinação mais rigorosa da aleatoriedade. Nestes casos, uma série de testes, que podem incluir verificação de autocorrelação, são aplicados, pois os dados podem ser não-aleatórios de muitas formas diferentes e muitas vezes sutis. Um exemplo de onde uma verificação mais rigorosa da aleatoriedade é necessária seria testar geradores de números aleatórios. Lote de amostra: as correções automáticas devem ser próximas de zero para a aleatoriedade. Tal não é o caso neste exemplo e, portanto, a suposição de aleatoriedade falha. Esse gráfico de autocorrelação de amostra mostra que a série de tempo não é aleatória, mas sim um alto grau de autocorrelação entre observações adjacentes e adjacentes. Definição: r (h) versus h As tramas de autocorrelação são formadas por eixo vertical: coeficiente de autocorrelação onde C h é a função de autocovariância e C 0 é a função de variância Observe que R h está entre -1 e 1. Observe que algumas fontes podem usar o Seguinte fórmula para a função de autocovariância Embora esta definição tenha menor preconceito, a formulação (1 N) possui algumas propriedades estatísticas desejáveis ​​e é a forma mais utilizada na literatura estatística. Veja as páginas 20 e 49-50 em Chatfield para obter detalhes. Eixo horizontal: intervalo de tempo h (h 1, 2, 3.) A linha acima também contém várias linhas de referência horizontais. A linha do meio está em zero. As outras quatro linhas são 95 e 99 bandas de confiança. Observe que existem duas fórmulas distintas para gerar as faixas de confiança. Se o gráfico de autocorrelação estiver sendo usado para testar aleatoriedade (ou seja, não há dependência de tempo nos dados), recomenda-se a seguinte fórmula: onde N é o tamanho da amostra, z é a função de distribuição cumulativa da distribuição normal padrão e (alfa ) É o nível de significância. Nesse caso, as bandas de confiança possuem uma largura fixa que depende do tamanho da amostra. Esta é a fórmula que foi usada para gerar as faixas de confiança na trama acima. Os gráficos de autocorrelação também são usados ​​no estágio de identificação do modelo para montagem de modelos ARIMA. Neste caso, um modelo de média móvel é assumido para os dados e as seguintes faixas de confiança devem ser geradas: onde k é o atraso, N é o tamanho da amostra, z é a função de distribuição cumulativa da distribuição normal padrão e (alfa) é O nível de significância. Nesse caso, as bandas de confiança aumentam à medida que o atraso aumenta. O gráfico de autocorrelação pode fornecer respostas para as seguintes questões: Os dados são aleatórios É uma observação relacionada a uma observação adjacente É uma observação relacionada a uma observação duas vezes removida (etc.) É a série de tempo observada ruído branco É a série temporal observada sinusoidal A série temporal observada é autorregressiva. O que é um modelo adequado para as séries temporais observadas. O modelo é válido e suficiente. A ssqrt da fórmula é válida. Importância: Garantir a validade das conclusões da engenharia. A aleatoriedade (juntamente com o modelo fixo, a variação fixa e a distribuição fixa) é Um dos quatro pressupostos que geralmente dependem de todos os processos de medição. A suposição de aleatoriedade é extremamente importante para os seguintes três motivos: a maioria dos testes estatísticos padrão depende da aleatoriedade. A validade das conclusões do teste está diretamente relacionada à validade do pressuposto de aleatoriedade. Muitas fórmulas estatísticas comumente usadas dependem da suposição de aleatoriedade, sendo a fórmula mais comum a fórmula para determinar o desvio padrão da amostra: onde s é o desvio padrão dos dados. Embora fortemente utilizados, os resultados da utilização desta fórmula não têm valor a menos que a suposição de aleatoriedade seja válida. Para dados univariados, o modelo padrão é Se os dados não são aleatórios, este modelo é incorreto e inválido, e as estimativas para os parâmetros (como a constante) tornam-se absurdas e não válidas. Em suma, se o analista não verificar aleatoriedade, a validade de muitas das conclusões estatísticas torna-se suspeita. O gráfico de autocorrelação é uma excelente maneira de verificar essa aleatoriedade. Análise da série Tsa statsmodels. tsa contém classes e funções modelo que são úteis para análise de séries temporais. Isso atualmente inclui modelos autoregressivos univariados (AR), modelos vetoriais vetoriais (VAR) e modelos de média móvel auto-regressiva univariada (ARMA). Também inclui estatística descritiva para séries temporais, por exemplo, autocorrelação, função de autocorrelação parcial e periodograma, bem como as propriedades teóricas correspondentes de ARMA ou processos relacionados. Também inclui métodos para trabalhar com atraso médio-aleatório e polinômios. Além disso, estão disponíveis testes estatísticos relacionados e algumas funções auxiliares úteis. A estimativa é feita por uma Probabilidade Máxima exata ou condicional ou por mínimos quadrados condicionais, usando Filtro Kalman ou filtros diretos. Atualmente, as funções e as classes devem ser importadas do módulo correspondente, mas as classes principais estarão disponíveis no namespace statsmodels. tsa. A estrutura do módulo está dentro statsmodels. tsa é stattools. Propriedades empíricas e testes, acf, pacf, granger-causality, teste de raiz da unidade adf, teste de caixa de jj e outros. Armadilho. Processo auto-regressivo univariante, estimativa com probabilidade máxima condicional e exata e aleatorização de mínimos quadrados condicionais. Processo ARMA univariante, estimativa com probabilidade máxima condicional e exata e vetorar de mínimos quadrados condicionais, var. Modelos de estimativa de processo de autorregressão de vetores (VAR), análise de resposta de impulso, decomposição de variância de erro de previsão e ferramentas de visualização de dados kalmanf. Classes de estimativa para ARMA e outros modelos com MLE exato usando o Kalman Filter armaprocess. Propriedades de processos de arma com parâmetros determinados, isto inclui ferramentas para converter entre ARMA, MA e representação de AR, bem como acf, pacf, densidade espectral, função de resposta de impulso e sandbox. tsa. fftarma semelhante. Semelhante ao armaprocess, mas trabalhando em tsatools de domínio de freqüência. Funções auxiliares adicionais, para criar matrizes de variáveis ​​atrasadas, construir regressores para tendências, desvios e similares. Filtros. Função auxiliar para filtrar séries temporais Algumas funções adicionais que também são úteis para a análise de séries temporais estão em outras partes dos modelos de estatísticas, por exemplo, testes estatísticos adicionais. Algumas funções relacionadas também estão disponíveis em matplotlib, nitime e scikits. talkbox. Essas funções são projetadas mais para o uso no processamento de sinais onde séries temporais mais longas estão disponíveis e funcionam com mais frequência no domínio da frequência. Estatística descritiva e testes stattools. acovf (x, imparcial, degradante, fft)

No comments:

Post a Comment