Friday 25 August 2017

Autoregressive Moving Average Model In R


Os processos de erro em média móvel (Erros ARMA) autoregressivos e outros modelos que envolvem atrasos de erros podem ser estimados usando instruções FIT e simuladas ou previstas usando instruções SOLVE. Os modelos ARMA para o processo de erro são freqüentemente usados ​​para modelos com resíduos auto-correlacionados. A macro AR pode ser usada para especificar modelos com processos de erro autorregressivo. A macro MA pode ser usada para especificar modelos com processos de erro em média móvel. Erros Autoregressivos Um modelo com erros autoregressivos de primeira ordem, AR (1), tem a forma enquanto um processo de erro AR (2) tem a forma e assim por diante para processos de ordem superior. Note-se que os s são independentes e distribuídos de forma idêntica e têm um valor esperado de 0. Um exemplo de um modelo com um componente AR (2) é e assim por diante para processos de ordem superior. Por exemplo, você pode escrever um modelo de regressão linear simples com MA (2) erros de média móvel como onde MA1 e MA2 são os parâmetros de média móvel. Observe que RESID. Y é definido automaticamente pelo PROC MODELE, pois a função ZLAG deve ser usada para modelos MA para truncar a recursão dos atrasos. Isso garante que os erros atrasados ​​começam em zero na fase de inicialização e não propagam os valores faltantes quando faltam variáveis ​​do período de inicialização e garante que os futuros erros sejam zero em vez de perder durante a simulação ou a previsão. Para obter detalhes sobre as funções de atraso, consulte a seção Lag Logic. Este modelo escrito usando a macro MA é o seguinte: Formulário geral para modelos ARMA O processo geral ARMA (p, q) tem a seguinte forma Um modelo ARMA (p, q) pode ser especificado da seguinte forma: onde AR i e MA j representam Os parâmetros da média autorregressiva e móvel para os vários atrasos. Você pode usar qualquer nome que você deseja para essas variáveis, e há muitas maneiras equivalentes de que a especificação possa ser escrita. Os processos ARMA vetoriais também podem ser estimados com PROC MODELO. Por exemplo, um processo AR (1) de duas variáveis ​​para os erros das duas variáveis ​​endógenas Y1 e Y2 pode ser especificado da seguinte forma: Problemas de convergência com modelos ARMA Os modelos ARMA podem ser difíceis de estimar. Se as estimativas dos parâmetros não estiverem dentro do intervalo apropriado, os termos residuais dos modelos médios em movimento crescem exponencialmente. Os resíduos calculados para observações posteriores podem ser muito grandes ou podem transbordar. Isso pode acontecer porque os valores iniciais inadequados foram usados ​​ou porque as iterações se afastaram de valores razoáveis. O cuidado deve ser usado na escolha dos valores iniciais para os parâmetros ARMA. Os valores iniciais de 0,001 para parâmetros ARMA geralmente funcionam se o modelo se adequar bem aos dados e o problema está bem condicionado. Note-se que um modelo de MA geralmente pode ser aproximado por um modelo AR de alta ordem e vice-versa. Isso pode resultar em colinearidade elevada em modelos mistos de ARMA, o que, por sua vez, pode causar um mau condicionamento grave nos cálculos e instabilidade das estimativas dos parâmetros. Se você tiver problemas de convergência ao estimar um modelo com processos de erro ARMA, tente estimar em etapas. Primeiro, use uma instrução FIT para estimar apenas os parâmetros estruturais com os parâmetros ARMA mantidos em zero (ou para estimativas anteriores razoáveis ​​se disponíveis). Em seguida, use outra instrução FIT para estimar apenas os parâmetros ARMA, usando os valores dos parâmetros estruturais da primeira execução. Como os valores dos parâmetros estruturais provavelmente estarão próximos de suas estimativas finais, as estimativas dos parâmetros ARMA podem agora convergir. Finalmente, use outra instrução FIT para produzir estimativas simultâneas de todos os parâmetros. Uma vez que os valores iniciais dos parâmetros agora são provavelmente muito próximos das suas estimativas conjuntas finais, as estimativas devem convergir rapidamente se o modelo for apropriado para os dados. AR Condições iniciais Os atrasos iniciais dos termos de erro dos modelos AR (p) podem ser modelados de diferentes maneiras. Os métodos de inicialização de erros autorregressivos suportados pelos procedimentos SAS / ETS são os seguintes: mínimos quadrados condicionais (procedimentos ARIMA e MODELO) mínimos quadrados incondicionais (procedimentos AUTOREG, ARIMA e MODELO) probabilidade máxima (procedimentos AUTOREG, ARIMA e MODELO) Yule-Walker (Apenas o procedimento AUTHORG) Hildreth-Lu, que exclui as primeiras observações p (somente procedimento MODEL) Veja o Capítulo 8, Procedimento AUTOREG, para uma explicação e discussão dos méritos de vários métodos de inicialização AR (p). As iniciais CLS, ULS, ML e HL podem ser realizadas pelo PROC MODELO. Para erros AR (1), essas iniciais podem ser produzidas como mostrado na Tabela 18.2. Esses métodos são equivalentes em grandes amostras. Tabela 18.2 Inicializações realizadas pelo PROC MODELO: AR (1) ERROS Os atrasos iniciais dos termos de erro dos modelos MA (q) também podem ser modelados de diferentes maneiras. Os procedimentos de ARIMA e MODELO seguintes são suportados pelos seguintes procedimentos: mínimos quadrados incondicionais mínimos quadrados condicionais O método dos mínimos quadrados condicionais para estimar termos de erro em média móvel não é otimizado porque ignora o problema de inicialização. Isso reduz a eficiência das estimativas, embora permaneçam imparciais. Os resíduos remanescentes iniciais, que se estendem antes do início dos dados, são assumidos como 0, seu valor esperado incondicional. Isso introduz uma diferença entre esses resíduos e os resíduos de mínimos quadrados generalizados para a covariância média móvel, que, ao contrário do modelo autorregressivo, persiste através do conjunto de dados. Normalmente, esta diferença converge rapidamente para 0, mas para processos em média móveis quase não-reversíveis, a convergência é bastante lenta. Para minimizar esse problema, você deve ter muitos dados e as estimativas dos parâmetros da média móvel devem estar bem dentro do intervalo invertido. Este problema pode ser corrigido à custa de escrever um programa mais complexo. As estimativas de mínimos quadrados incondicionais para o processo MA (1) podem ser produzidas especificando o modelo da seguinte maneira: os erros médios em movimento podem ser difíceis de estimar. Você deve considerar usar uma aproximação AR (p) ao processo de média móvel. Um processo de média móvel geralmente pode ser bem-aproximado por um processo autorregressivo se os dados não tiverem sido suavizados ou diferenciados. A Macro AR A macro AR SAS gera declarações de programação para PROC MODEL para modelos autoregressivos. A macro AR faz parte do software SAS / ETS, e nenhuma opção especial precisa ser configurada para usar a macro. O processo autorregressivo pode ser aplicado aos erros de equação estrutural ou às próprias séries endógenas. A macro AR pode ser usada para os seguintes tipos de autorregressão: Autoregência vectorial irrestrita Autoregresão vetorial restrita Univariada Autoregresso Para modelar o termo de erro de uma equação como processo auto-regressivo, use a seguinte declaração após a equação: Por exemplo, suponha que Y é um Função linear de X1, X2 e um erro AR (2). Você escreveria esse modelo da seguinte maneira: as chamadas para AR devem vir após todas as equações que o processo se aplica. A invocação de macro anterior, AR (y, 2), produz as instruções mostradas na saída LIST na Figura 18.58. Figura 18.58 Saída da opção LIST para um modelo AR (2) As variáveis ​​prefixadas PRED são variáveis ​​de programa temporárias usadas para que os atrasos dos resíduos sejam os resíduos corretos e não os redefinidos por esta equação. Observe que isso é equivalente às declarações explicitamente escritas na seção Formulário geral para modelos ARMA. Você também pode restringir os parâmetros autorregressivos a zero em atrasos selecionados. Por exemplo, se você quisesse parâmetros autoregressivos nos intervalos 1, 12 e 13, você pode usar as seguintes instruções: Essas instruções geram a saída mostrada na Figura 18.59. Figura 18.59 Saída da opção LIST para um modelo AR com Lags em 1, 12 e 13 O MODELO Lista de Procedimentos da Declaração de Código do Programa Compilado como Pareded PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. E - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - REAL. y ERROR. y PRED. y - y Existem Variações no método dos mínimos quadrados condicionais, dependendo se as observações no início da série são usadas para aquecer o processo AR. Por padrão, o método de mínimos quadrados condicionais AR usa todas as observações e assume zeros para os atrasos iniciais de termos autorregressivos. Ao usar a opção M, você pode solicitar que o AR use o método de mínimos quadrados incondicionais (ULS) ou máximo (ML). Por exemplo, as discussões desses métodos são fornecidas na seção AR Condições iniciais. Ao usar a opção MCLS n, você pode solicitar que as primeiras n observações sejam usadas para calcular estimativas dos atrasos de autorregressão iniciais. Neste caso, a análise começa com a observação n 1. Por exemplo: você pode usar a macro AR para aplicar um modelo auto - gressivo à variável endógena, em vez do termo de erro, usando a opção TYPEV. Por exemplo, se você deseja adicionar os últimos atrasos de Y para a equação no exemplo anterior, você poderia usar AR para gerar os parâmetros e atrasos usando as seguintes instruções: As instruções anteriores geram a saída mostrada na Figura 18.60. Figura 18.60 LIST Opção Saída para um modelo AR de Y Este modelo prediz Y como uma combinação linear de X1, X2, uma intercepção e os valores de Y nos cinco períodos mais recentes. Autoregression vetorial sem restrições Para modelar os termos de erro de um conjunto de equações como um processo autoregressivo vetorial, use a seguinte forma da macro AR após as equações: O nome do nome do processo é qualquer nome que você fornece para que AR use na criação de nomes para o autorregressivo Parâmetros. Você pode usar a macro AR para modelar vários processos AR diferentes para diferentes conjuntos de equações usando diferentes nomes de processos para cada conjunto. O nome do processo garante que os nomes das variáveis ​​usados ​​sejam exclusivos. Use um valor curto do nome do processo para o processo se as estimativas dos parâmetros forem gravadas em um conjunto de dados de saída. A macro AR tenta construir nomes de parâmetros menores ou iguais a oito caracteres, mas isso é limitado pelo comprimento do nome do processo. Que é usado como um prefixo para os nomes dos parâmetros AR. O valor da lista variável é a lista de variáveis ​​endógenas para as equações. Por exemplo, suponha que os erros das equações Y1, Y2 e Y3 sejam gerados por um processo auto-regressivo de vetor de segunda ordem. Você pode usar as seguintes instruções: que geram o seguinte para Y1 e código semelhante para Y2 e Y3: Somente o método de mínimos quadrados condicionais (MCLS ou MCLS n) pode ser usado para processos vetoriais. Você também pode usar o mesmo formulário com restrições que a matriz de coeficientes seja 0 em atrasos selecionados. Por exemplo, as seguintes afirmações aplicam um processo vetorial de terceira ordem aos erros de equação com todos os coeficientes no intervalo 2 restrito a 0 e com os coeficientes nos intervalos 1 e 3 sem restrições: você pode modelar as três séries Y1Y3 como um processo auto-regressivo vetorial Nas variáveis ​​em vez de nos erros usando a opção TYPEV. Se você deseja modelar Y1Y3 como uma função dos valores passados ​​de Y1Y3 e algumas variáveis ​​ou constantes exógenas, você pode usar AR para gerar as declarações para os termos de atraso. Escreva uma equação para cada variável para a parte não autorregente do modelo e, em seguida, chame AR com a opção TYPEV. Por exemplo, a parte não autorregente do modelo pode ser uma função de variáveis ​​exógenas, ou pode ser parâmetros de interceptação. Se não houver componentes exógenos para o modelo de autoregressão vetorial, incluindo sem interceptações, atribua zero a cada uma das variáveis. Deve haver uma atribuição para cada uma das variáveis ​​antes de chamar AR. Este exemplo modela o vetor Y (Y1 Y2 Y3) como uma função linear apenas do seu valor nos dois períodos anteriores e um vetor de erro de ruído branco. O modelo possui 18 (3 3 3 3) parâmetros. Sintaxe da AR Macro Existem dois casos da sintaxe da macro AR. Quando as restrições em um processo AR vetorial não são necessárias, a sintaxe da macro AR tem o formulário geral especifica um prefixo para AR para usar na construção de nomes de variáveis ​​necessárias para definir o processo AR. Se o endolista não for especificado, a lista endógena padrão nomeará. Que deve ser o nome da equação em que o processo de erro AR deve ser aplicado. O valor do nome não pode exceder 32 caracteres. É a ordem do processo AR. Especifica a lista de equações a que o processo AR deve ser aplicado. Se mais de um nome for dado, um processo vetorial irrestrito é criado com os resíduos estruturais de todas as equações incluídas como regressores em cada uma das equações. Se não for especificado, o endolista padrão nomeará. Especifica a lista de atrasos em que os termos AR devem ser adicionados. Os coeficientes dos termos em atrasos não listados são definidos como 0. Todos os atrasos listados devem ser menores ou iguais a nlag. E não deve haver duplicatas. Se não for especificado, o laglista é padrão para todos os atrasos 1 até nlag. Especifica o método de estimação para implementar. Os valores válidos de M são CLS (estimativas de mínimos quadrados condicionais), ULS (estimativas de mínimos quadrados incondicionais) e ML (estimativas de máxima verossimilhança). O MCLS é o padrão. Somente o MCLS é permitido quando mais de uma equação é especificada. Os métodos ULS e ML não são suportados para modelos vetoriais AR por AR. Especifica que o processo AR deve ser aplicado às próprias variáveis ​​endógenas em vez dos resíduos estruturais das equações. Autoregression vetorial restrita Você pode controlar quais parâmetros estão incluídos no processo, restringindo a 0 os parâmetros que você não inclui. Primeiro, use AR com a opção DEFER para declarar a lista de variáveis ​​e definir a dimensão do processo. Em seguida, use chamadas AR adicionais para gerar termos para equações selecionadas com variáveis ​​selecionadas em atrasos selecionados. Por exemplo, as equações de erro produzidas são as seguintes: Este modelo afirma que os erros para Y1 dependem dos erros de Y1 e Y2 (mas não de Y3) nos dois laços 1 e 2 e que os erros para Y2 e Y3 dependem de Os erros anteriores para todas as três variáveis, mas apenas no intervalo 1. Sintaxe de Macro AR para Vector AR Restrivo. Um uso alternativo de AR pode impor restrições sobre um processo AR vetorial, chamando AR várias vezes para especificar diferentes termos AR e atrasos para diferentes Equações. A primeira chamada tem o formulário geral especifica um prefixo para AR para usar na construção de nomes de variáveis ​​necessárias para definir o processo vetorial AR. Especifica a ordem do processo AR. Especifica a lista de equações a que o processo AR deve ser aplicado. Especifica que AR não é para gerar o processo AR, mas é esperar por informações adicionais especificadas em chamadas AR mais recentes para o mesmo valor de nome. As chamadas subseqüentes têm a forma geral é a mesma que na primeira chamada. Especifica a lista de equações a que as especificações nesta chamada AR devem ser aplicadas. Somente os nomes especificados no valor endolista da primeira chamada para o valor do nome podem aparecer na lista de equações na eqlist. Especifica a lista de equações cujos resíduos estruturais atrasados ​​devem ser incluídos como regressores nas equações em eqlist. Somente nomes no endolista da primeira chamada para o valor do nome podem aparecer na varlist. Se não for especificado, varlist é padrão para endolista. Especifica a lista de atrasos em que os termos AR devem ser adicionados. Os coeficientes dos termos em atrasos não listados são definidos como 0. Todos os atrasos listados devem ser inferiores ou iguais ao valor de nlag. E não deve haver duplicatas. Se não for especificado, o laglist é padrão para todos os atrasos 1 através do nlag. A MA Macro A macro macro SAS gera declarações de programação para PROC MODEL para modelos em média móveis. A macro MA faz parte do software SAS / ETS e nenhuma opção especial é necessária para usar a macro. O processo de erro em média móvel pode ser aplicado aos erros de equação estrutural. A sintaxe da macro MA é a mesma que a macro AR, exceto que não existe um argumento TYPE. Quando você está usando as macros MA e AR combinadas, a macro MA deve seguir a macro AR. As seguintes instruções SAS / IML produzem um processo de erro ARMA (1, (1 3)) e salve-o no conjunto de dados MADAT2. As seguintes instruções PROC MODEL são usadas para estimar os parâmetros deste modelo usando a estrutura de erro de máxima verossimilhança: as estimativas dos parâmetros produzidos por esta execução são mostradas na Figura 18.61. Figura 18.61 Estimativas de um ARMA (1, (1 3)) Processo Existem dois casos da sintaxe para a macro MA. Quando as restrições em um processo de vetor MA não são necessárias, a sintaxe da macro MA tem o formulário geral especifica um prefixo para MA para usar na construção de nomes de variáveis ​​necessárias para definir o processo MA e é o endolista padrão. É a ordem do processo MA. Especifica as equações para as quais o processo MA deve ser aplicado. Se mais de um nome for dado, a estimativa de CLS é usada para o processo vetorial. Especifica os atrasos nos quais os termos MA devem ser adicionados. Todos os atrasos listados devem ser inferiores ou iguais a nlag. E não deve haver duplicatas. Se não for especificado, o laglista é padrão para todos os atrasos 1 até nlag. Especifica o método de estimação para implementar. Os valores válidos de M são CLS (estimativas de mínimos quadrados condicionais), ULS (estimativas de mínimos quadrados incondicionais) e ML (estimativas de máxima verossimilhança). O MCLS é o padrão. Somente o MCLS é permitido quando mais de uma equação é especificada no endolista. MA Macro Sintaxe para Média de Movimento de Vetor Restrito Um uso alternativo de MA é permitido para impor restrições em um processo de MA vetorial, ligando MA várias vezes para especificar diferentes termos e atrasos de MA para diferentes equações. A primeira chamada tem o formulário geral especifica um prefixo para MA para usar na construção de nomes de variáveis ​​necessárias para definir o processo de vetor MA. Especifica a ordem do processo MA. Especifica a lista de equações para as quais o processo MA deve ser aplicado. Especifica que MA não é para gerar o processo de MA, mas é esperar por informações adicionais especificadas em chamadas de MA mais recentes para o mesmo valor de nome. As chamadas subseqüentes têm a forma geral é a mesma que na primeira chamada. Especifica a lista de equações às quais as especificações nesta chamada MA devem ser aplicadas. Especifica a lista de equações cujos resíduos estruturais atrasados ​​devem ser incluídos como regressores nas equações em eqlist. Especifica a lista de atrasos em que os termos MA devem ser adicionados. Previsão de ARIMA com o Excel e R Olá hoje, vou encaminhá-lo através de uma introdução ao modelo ARIMA e seus componentes, bem como uma breve explicação do Box - Método Jenkins de como os modelos ARIMA são especificados. Por fim, criei uma implementação do Excel usando R, que I8217ll mostra como configurar e usar. Modelos de média móvel auto-agressiva (ARMA) O modelo de média móvel autoregressiva é usado para modelar e prever processos estacionários, estocásticos em séries temporais. É a combinação de duas técnicas estatísticas previamente desenvolvidas, os modelos Autoregressivo (AR) e Média Mover (MA) e foi descrita originalmente por Peter Whittle em 1951. George E. P. Box e Gwilym Jenkins popularizaram o modelo em 1971, especificando etapas discretas para identificação, estimativa e verificação do modelo. Este processo será descrito posteriormente para referência. Começaremos por apresentar o modelo ARMA por seus vários componentes, os modelos AR e MA e, em seguida, apresentaremos uma popular generalização do modelo ARMA, ARIMA (Promover a Mudança Integrada Autoregressiva) e as etapas de previsão e especificação do modelo. Por fim, vou explicar uma implementação do Excel que eu criei e como usá-la para fazer suas previsões da série temporal. Modelos Autoregressivos O modelo Autoregressivo é usado para descrever processos aleatórios e processos variáveis ​​no tempo e especifica que a variável de saída depende linearmente de seus valores anteriores. O modelo é descrito como: Onde estão os parâmetros do modelo, C é constante e é um termo de ruído branco. Essencialmente, o que o modelo descreve é ​​para qualquer valor determinado. Isso pode ser explicado por funções de seu valor anterior. Para um modelo com um parâmetro. É explicado pelo seu valor passado e erro aleatório. Para um modelo com mais de um parâmetro, por exemplo. É dado por. E erro aleatório. Modelo de média móvel O modelo de média móvel (MA) é usado frequentemente para modelar séries temporais univariadas e é definido como: é a média das séries temporais. São os parâmetros do modelo. São os termos de erro de ruído branco. É a ordem do modelo de média móvel. O modelo de média móvel é uma regressão linear do valor atual da série em comparação com os termos no período anterior. Por exemplo, um modelo MA de. É explicado pelo erro atual no mesmo período e o valor do erro passado. Para um modelo de ordem 2 (), é explicado pelos dois últimos valores de erro, e. Os termos AR () e MA () são usados ​​no modelo ARMA, que agora será introduzido. Modelo Médio Autoregressivo Os modelos Modelos Autoregressivos Motivos usam dois polinômios, AR () e MA () e descrevem um processo estocástico estacionário. Um processo estacionário não muda quando deslocado no tempo ou no espaço, portanto, um processo estacionário tem média e variância constantes. O modelo ARMA é frequentemente referido em termos de seus polinômios, ARMA (). A notação do modelo está escrita: Selecionar, estimar e verificar o modelo é descrito pelo processo Box-Jenkins. Método Box-Jenkins para identificação de modelo A seguir, é mais um esboço do método Box-Jenkins, pois o processo real de encontrar esses valores pode ser bastante irresistível sem um pacote estatístico. A folha Excel incluída nesta página determina automaticamente o modelo de melhor ajuste. O primeiro passo do método Box-Jenkins é a identificação do modelo. O passo inclui a identificação da sazonalidade, a diferenciação, se necessário, e a determinação da ordem e do traçado das funções de autocorrelação e autocorrelação parcial. Após o modelo ser identificado, o próximo passo é estimar os parâmetros. A estimativa de parâmetros usa pacotes estatísticos e algoritmos de computação para encontrar os melhores parâmetros de ajuste. Uma vez escolhidos os parâmetros, o último passo é verificar o modelo. A verificação do modelo é feita testando para ver se o modelo está em conformidade com uma série temporária univariada estacionária. Deve-se também confirmar que os resíduos são independentes uns dos outros e exibem média e variância constantes ao longo do tempo, o que pode ser feito através da realização de um teste de Ljung-Box ou novamente planejando a autocorrelação e autocorrelação parcial dos resíduos. Observe que o primeiro passo envolve verificar a sazonalidade. Se os dados com os quais você trabalha contiverem tendências sazonais, você 8220differência8221 para tornar os dados estacionários. Este passo de diferenciação generaliza o modelo ARMA para um modelo ARIMA ou Média Mover Integrada Autoregressiva, onde 8216Integrated8217 corresponde ao passo de diferenciação. Modelos de média móvel integrada autoregressiva O modelo ARIMA possui três parâmetros. Para definir o modelo ARMA para incluir o termo de diferenciação, começamos por rearranjar o modelo ARMA padrão para separar do somatório. Onde está o operador de atraso e. São parâmetros de média autorregressiva e móvel, e os termos de erro, respectivamente. Agora fazemos o pressuposto do primeiro polinômio da função, tem uma raiz unitária de multiplicidade. Podemos então reescrevê-lo para o seguinte: O modelo ARIMA expressa a factorização polinomial com e nos dá: Por fim, generalizamos o modelo adicionalmente, adicionando um termo de deriva, que define o modelo ARIMA como ARIMA () com deriva. Com o modelo agora definido, podemos visualizar o modelo ARIMA como duas partes separadas, uma não estacionária e a outra estacionada de sentido largo (a distribuição de probabilidade conjunta não muda quando deslocada no tempo ou no espaço). O modelo não estacionário: o modelo estacionário de sentido amplo: as previsões podem agora ser feitas com o uso de um método de previsão autoregressivo generalizado. Agora que discutimos os modelos ARMA e ARIMA, passamos agora a como podemos usá-los em aplicativos práticos para fornecer previsões. Criei uma implementação com o Excel usando R para fazer previsões ARIMA, bem como uma opção para executar a simulação Monte Carlo no modelo para determinar a probabilidade das previsões. Implementação do Excel e como usar Antes de usar a folha, você deve baixar o R ​​e o RExcel no site Statconn. Se você já tiver instalado R, você pode simplesmente fazer o download do RExcel. Se você não tiver instalado o R, você pode baixar o RAndFriends, que contém a versão mais recente do R e do RExcel. Por favor note, o RExcel funciona apenas no Excel de 32 bits por sua licença não comercial. Se você tiver 64bit Excel instalado, você terá que obter uma licença comercial da Statconn. Recomenda-se baixar o RAndFriends, pois faz a instalação mais rápida e fácil, no entanto, se você já possui R e gostaria de instalá-lo manualmente, siga estas próximas etapas. Instalando manualmente o RExcel Para instalar o RExcel e os outros pacotes para fazer com que o R funcione no Excel, primeiro abra R como um Administrador clicando com o botão direito do mouse no. exe. No console R, instale o RExcel digitando as seguintes instruções: Os comandos acima irão instalar o RExcel em sua máquina. O próximo passo é instalar o rcom, que é outro pacote do Statconn para o pacote RExcel. Para instalar isso, digite os seguintes comandos, que também instalará automaticamente rscproxy a partir da versão R 2.8.0. Com estes pacotes instalados, você pode passar para definir a conexão entre R e Excel. Embora não seja necessário para a instalação, um pacote acessível para download é Rcmdr, desenvolvido por John Fox. O Rcmdr cria menus R que podem se tornar menus no Excel. Esse recurso vem por padrão com a instalação do RAndFriends e disponibiliza vários comandos R no Excel. Digite os seguintes comandos em R para instalar o Rcmdr. Podemos criar o link para R e Excel. Nota nas versões recentes do RExcel, esta conexão é feita com um duplo clique simples do arquivo. bat. at ativadoRExcel2010, então você só precisa seguir estas etapas se você instalou R e RExcel manualmente ou se, por algum motivo, a conexão não for feita durante A instalação do RAndFriends. Criar a conexão entre R e Excel Abra um novo livro no Excel e navegue até a tela de opções. Clique em Opções e em Add-Ins. Você deve ver uma lista de todos os complementos ativos e inativos que você possui atualmente. Clique no botão Ir na parte inferior. Na caixa de diálogo Complemento, você verá todas as referências de complemento que você fez. Clique em Procurar. Navegue até a pasta RExcel, geralmente localizada em C: Program FilesRExcelxls ou algo semelhante. Encontre o suplemento RExcel. xla e clique nele. O próximo passo é criar uma referência para que as macros usando o R funcionem corretamente. No seu documento do Excel, digite Alt F11. Isso abrirá o editor Excels VBA. Vá para Tools - gt References e encontre a referência RExcel, RExcelVBAlib. RExcel agora deveria estar pronto para usar Usando a Folha de Excel Agora que R e RExcel estão devidamente configurados, é hora de fazer algumas previsões. Abra a planilha de previsão e clique em Carregar Servidor. Isto é para iniciar o servidor RCom e também carregar as funções necessárias para fazer a previsão. Uma caixa de diálogo será aberta. Selecione o arquivo itall. R incluído na folha. Este arquivo contém as funções que a ferramenta de previsão usa. A maioria das funções contidas foi desenvolvida pelo Professor Stoffer na Universidade de Pittsburgh. Eles estendem as capacidades de R e nos fornecem alguns gráficos de diagnóstico úteis, juntamente com a nossa saída de previsão. Há também uma função para determinar automaticamente os melhores parâmetros de ajuste do modelo ARIMA. Após o servidor carregar, insira seus dados na coluna Dados. Selecione o alcance dos dados, clique com o botão direito do mouse e selecione Gama de nomes. Nomeie o intervalo como Dados. Em seguida, defina a frequência dos seus dados na célula C6. A frequência refere-se aos períodos de tempo de seus dados. Se for semanal, a frequência seria de 7. O número mensal seria de 12, enquanto que o trimestre seria de 4, e assim por diante. Insira os períodos adiante para prever. Note-se que os modelos ARIMA tornam-se bastante imprecisos após várias sucessivas previsões de freqüência. Uma boa regra de ouro não deve exceder 30 passos, já que qualquer coisa pode ser bastante confiável. Isso também depende do tamanho do seu conjunto de dados. Se você tiver dados limitados disponíveis, recomenda-se escolher um número menor para a frente. Depois de inserir seus dados, nomeá-lo e definir a freqüência desejada e avançar para prever, clique em Executar. Pode demorar um pouco para que a previsão seja processada. Uma vez concluído, você receberá os valores previstos para o número que você especificou, o erro padrão dos resultados e dois gráficos. A esquerda é o valor previsto traçado com os dados, enquanto o direito contém diagnósticos úteis com resíduos padronizados, a autocorrelação dos resíduos, um gráfico gg dos resíduos e um gráfico de estatísticas Ljung-Box para determinar se o modelo está bem instalado. Eu não vou entrar em detalhes demais sobre como você procura um modelo bem equipado, mas no gráfico da ACF você não quer nenhum (ou muito) dos espetos de atraso que atravessam a linha azul pontilhada. No gráfico de gg, quanto mais círculos atravessarem a linha, mais normalizado e melhor ajustado é o modelo. Para conjuntos de dados maiores, isso pode atrair muitos círculos. Por fim, o teste de Ljung-Box é um artigo em si, no entanto, quanto mais círculos estão acima da linha azul pontilhada, melhor será o modelo. Se o resultado do diagnóstico não se parecer bem, você pode tentar adicionar mais dados ou começar em um ponto diferente do alcance que deseja prever. Você pode facilmente limpar os resultados gerados clicando nos botões Limpar valores previstos. E é isso. Atualmente, a coluna de data não faz nada além da sua referência, mas não é necessário para a ferramenta. Se eu encontrar tempo, eu vou voltar e adicione isso para que o gráfico exibido mostre a hora correta. Você também pode receber um erro ao executar a previsão. Isso geralmente é devido à função que encontra os melhores parâmetros é incapaz de determinar a ordem correta. Você pode seguir as etapas acima para tentar organizar seus dados melhor para que a função funcione. Espero que você se aproveite da ferramenta. Isso me salvou muito tempo no trabalho, já que agora eu tenho que fazer é inserir os dados, carregar o servidor e executá-lo. Eu também espero que isso mostre o quão incrível R pode ser, especialmente quando usado com um front-end como o Excel. Código, folha de cálculo do Excel e arquivo. bas também estão no GitHub aqui.

No comments:

Post a Comment