Friday, 15 September 2017

Mudança Média Variação Sazonal


Movendo médias. Se esta informação é traçada em um gráfico, olha como isto. Isto mostra que há uma variação larga no número de visitantes dependendo da estação. Há muito menos no outono e no inverno do que a mola eo verão. Entretanto, Se quiséssemos ver uma tendência no número de visitantes, poderíamos calcular uma média móvel de 4 pontos. Fazemos isso encontrando o número médio de visitantes nos quatro trimestres de 2005. Então encontramos o número médio de visitantes no Os três últimos trimestres de 2005 e primeiro trimestre de 2006.Então os dois últimos trimestres de 2005 e os dois primeiros trimestres de 2006.Note que a última média que podemos encontrar é para os dois últimos trimestres de 2006 e os dois primeiros trimestres de 2007. Nós traçamos as médias móveis em um gráfico, certificando-se de que cada média é plotada no centro dos quatro trimestres que cobre. Podemos agora ver que há uma tendência muito baixa para baixo em visitors. Spreadsheet implementação de ajuste sazonal e suavização exponencial. É correto Orward para executar o ajuste sazonal e ajustar os modelos de suavização exponencial usando o Excel As imagens de tela e gráficos abaixo são tiradas de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e suavização exponencial linear nos seguintes dados de vendas trimestrais do Outboard Marine. Cópia do arquivo de planilha propriamente dito, clique aqui A versão de suavização exponencial linear que será usada aqui para fins de demonstração é a versão de Brown, simplesmente porque ela pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar Geralmente, é melhor usar a versão de Holt que tem constantes de suavização separadas para nível e tendência. O processo de previsão segue como segue i primeiro os dados são ajustados sazonalmente ii então as previsões são geradas para os dados ajustados sazonalmente via suavização exponencial linear e iii finalmente a Sazonalmente ajustadas são reseasonalized para obter previsões para o origi Nal O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é computar uma média móvel centrada realizada aqui na coluna D Isso pode ser feito tomando a média de duas médias anuais que São compensados ​​por um período em relação ao outro Uma combinação de duas médias de desvio em vez de uma única média é necessária para fins de centralização quando o número de estações é mesmo O próximo passo é calcular a relação com a média móvel --e os dados originais divididos Pela média móvel em cada período - o que é realizado aqui na coluna E. Também é chamado de componente tendência-ciclo do padrão, na medida em que os efeitos da tendência e do ciclo de negócios podem ser considerados como sendo tudo o que resta após a média em um todo Ano de dados É claro, as mudanças mês a mês que não são devido à sazonalidade poderia ser determinada por muitos outros fatores, mas a média de 12 meses suaviza sobre eles em grande medida O estimado sazonal inde X para cada estação é calculada pela primeira média de todas as razões para aquela estação particular, que é feita nas células G3-G6 usando uma fórmula AVERAGEIF As proporções médias são então redimensionadas de modo que somam exatamente 100 vezes o número de períodos em uma estação , Ou 400 neste caso, o que é feito nas células H3-H6 Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em cada linha da tabela de dados, de acordo com o trimestre do ano que representa. A média móvel e os dados ajustados sazonalmente acabam parecidos com isto. Observe que a média móvel normalmente se parece com uma versão mais lisa da série ajustada sazonalmente, e é mais curta em ambas as extremidades. Outra planilha no mesmo arquivo do Excel mostra a aplicação da O modelo de suavização exponencial linear aos dados sazonalmente ajustados, começando no valor da coluna GA para a alfa constante de alisamento é inserido acima da coluna de previsão aqui, na célula H9 e por conveniência é atribuído o ran Ge name Alpha O nome é atribuído usando o comando Insert Name Create O modelo LES é inicializado ao definir as duas primeiras previsões iguais ao primeiro valor real da série ajustada sazonalmente A fórmula usada aqui para a previsão LES é a forma recursiva de equação única Do modelo Brown s. Esta fórmula é inserida na célula correspondente ao terceiro período aqui, célula H15 e copiada para baixo a partir de lá Observe que a previsão LES para o período atual refere-se às duas observações precedentes e os dois erros de previsão precedentes, bem como Assim, a fórmula de previsão na linha 15 refere-se apenas aos dados que estavam disponíveis na linha 14 e anteriores. Naturalmente, se desejássemos usar o alisamento exponencial linear simples, em vez disso, poderíamos substituir a fórmula SES aqui em vez de Poderia também usar Holt s em vez de Brown s LES modelo, o que exigiria mais duas colunas de fórmulas para calcular o nível ea tendência que são utilizados na previsão. Os erros são calculados Na coluna seguinte, coluna J, subtraindo as previsões dos valores reais. O erro quadrático médio é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. Isto decorre da identidade matemática. VARIANCE MSE VARIANCE erros MÉDIOS erros 2 No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo não começa realmente a previsão até o terceiro período fila 15 na planilha. O valor ótimo de alfa pode ser encontrado alterando manualmente o alfa Até que o RMSE mínimo seja encontrado, ou então você pode usar o Solver para executar uma minimização exata O valor de alfa que o Solver encontrado é mostrado aqui alfa 0 471. É geralmente uma boa idéia traçar os erros do modelo em unidades transformadas E também para calcular e traçar suas autocorrelações em defasagens de até uma estação. Aqui está um gráfico de séries temporais dos erros ajustados sazonalmente. As autocorrelações de erro são calculadas usando a Função CORREL para calcular as correlações dos erros com eles mesmos retardados por um ou mais períodos - detalhes são mostrados no modelo de planilha Aqui está um gráfico das autocorrelações dos erros nos primeiros cinco lags. As autocorrelações nos intervalos 1 a 3 são Muito próximo de zero, mas o pico no intervalo 4 cujo valor é 0 35 é ligeiramente problemático - sugere que o processo de ajuste sazonal não foi completamente bem sucedido No entanto, é realmente apenas marginalmente significativo 95 faixas de significância para testar se as autocorrelações são significativamente Diferente de zero são mais ou menos 2 SQRT nk, onde n é o tamanho da amostra e k é o retardo Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada de - n-menos-k É de cerca de 6 para todos eles e, portanto, os limites para testar a significância estatística de desvios de zero são aproximadamente mais ou menos 2 6, ou 0 33 Se você variar o valor de alfa à mão neste modelo do Excel, Observar o efeito sobre as séries temporais E os gráficos de autocorrelação dos erros, bem como sobre o erro quadrático médio-raiz, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é bootstrapped no futuro, simplesmente substituindo as previsões para os valores reais no ponto Onde os dados reais se esgotam - isto é, onde começa o futuro Em outras palavras, em cada célula onde um valor de dados futuro ocorreria, uma referência de célula é inserida que aponta para a previsão feita para esse período Todas as outras fórmulas são simplesmente copiadas para baixo De cima. Observe que os erros para as previsões do futuro são todos computados como sendo zero. Isso não significa que os erros reais serão zero, mas sim apenas reflete o fato de que para fins de previsão estamos assumindo que os dados futuros serão iguais As previsões em média As previsões LES resultantes para os dados ajustados sazonalmente se parecem com isso. Com este valor especial de alfa, que é ideal para um período de previsões à frente, a tendência projetada é sligh Para outros valores de alfa, uma projeção de tendência muito diferente pode ser obtida. Geralmente, é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando o alfa É variada, porque o valor que é melhor para previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado que é obtido se o valor de alfa é manualmente definido como 0 25. A tendência de longo prazo projetada é agora negativa em vez de positiva Com um valor menor de alfa, o modelo está colocando mais peso em dados mais antigos em sua estimativa do nível e tendência atual e suas previsões de longo prazo refletem a tendência de queda observada durante o período Últimos 5 anos em vez da tendência ascendente mais recente Este gráfico também ilustra claramente como o modelo com um menor valor de alfa é mais lento para responder a pontos de viragem nos dados e, portanto, tende a fazer um erro do mesmo s Ign para muitos períodos em uma linha Seus erros de previsão de 1 passo à frente são maiores em média do que aqueles obtidos antes RMSE de 34 4 em vez de 27 4 e fortemente positivamente autocorrelated A autocorrelação lag-1 de 0 56 excede em muito o valor de 0 33 Calculado acima para um desvio estatisticamente significativo de zero Como uma alternativa a cranking para baixo o valor de alfa, a fim de introduzir mais conservadorismo em previsões de longo prazo, um fator de amortecimento de tendência às vezes é adicionado ao modelo, a fim de fazer a tendência projetada aplanar Depois de alguns períodos. O passo final na construção do modelo de previsão é racionalizar as previsões de LES, multiplicando-as pelos índices sazonais apropriados. Assim, as previsões reseasonalized na coluna I são simplesmente o produto dos índices sazonais na coluna F e os dados dessazonalizados LES na coluna H. É relativamente fácil calcular os intervalos de confiança para as previsões de um passo à frente feitas por este modelo primeiro calcular o RMSE raiz - Quadrado, que é apenas a raiz quadrada do MSE e, em seguida, calcular um intervalo de confiança para a previsão ajustada sazonalmente, adicionando e subtraindo duas vezes o RMSE Em geral, um intervalo de confiança de 95 para uma previsão de um período antecipado é aproximadamente igual ao Ponto mais ou menos duas vezes o desvio padrão estimado dos erros de previsão, assumindo que a distribuição de erro é aproximadamente normal eo tamanho da amostra é grande o suficiente, digamos, 20 ou mais Aqui, o RMSE em vez do desvio padrão da amostra de Os erros são a melhor estimativa do desvio-padrão dos futuros erros de previsão porque leva em consideração o viés e as variações aleatórias. Os limites de confiança para a previsão ajustada sazonalmente são então reseasonalized junto com a previsão, multiplicando-os pelos índices sazonais apropriados. Caso o RMSE é igual a 27 4 e a previsão ajustada sazonalmente para o primeiro período futuro Dec-93 é 273 2 assim que o ajustado sazonal 95 confie Nce intervalo é de 273 2-2 27 4 218 4 a 273 2 2 27 4 328 0 Multiplicando esses limites pelo índice sazonal de dezembro de 68 61 obtemos limites de confiança inferior e superior de 149 8 e 225 0 em torno do ponto Dec-93 Previsão de 187 4. Os limites de confiança para as previsões de mais de um período de tempo em geral irão aumentar à medida que o horizonte de previsão aumentar, devido à incerteza quanto ao nível e à tendência, bem como aos factores sazonais, mas é difícil calculá-los em geral por métodos analíticos A maneira apropriada de calcular os limites de confiança para a previsão LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão. Se você quer um intervalo de confiança realista para uma previsão mais de um período à frente, tendo todas as fontes de erro em conta , Sua melhor aposta é usar métodos empíricos, por exemplo, para obter um intervalo de confiança para uma previsão de duas etapas à frente, você poderia criar outra coluna na planilha para calcular uma previsão de duas etapas para cada período por b Ootstrapping a previsão one-step-ahead Em seguida, calcular o RMSE dos erros de previsão 2-ahead-ahead e usar isso como a base para um intervalo de confiança 2-ahead-ahead. moving average. Mean de observações de dados de série de tempo igualmente espaçados no tempo De vários períodos consecutivos Chamado de movimento porque é continuamente recalculado à medida que novos dados se tornam disponíveis, ele progride caindo o valor mais antigo e adicionando o valor mais recente Por exemplo, a média móvel das vendas de seis meses pode ser calculada tomando a média das vendas de Janeiro a junho, então a média das vendas de fevereiro a julho, em seguida, de março a agosto, e assim por diante As médias móveis 1 reduzir o efeito de variações temporárias nos dados, 2 melhorar o ajuste de dados para uma linha de um processo chamado suavização para mostrar A tendência dos dados mais claramente e 3 destacar qualquer valor acima ou abaixo da tendência. Se você está calculando algo com variação muito alta o melhor que você pode ser fazer é descobrir a média móvel. Eu queria saber o que o A média móvel era dos dados, assim que eu teria uma compreensão melhor de como nós estávamos fazendo. Quando você está tentando figurar para fora alguns números que mudam frequentemente o melhor que você pode fazer é calcular a média movente.

No comments:

Post a Comment