Friday 27 January 2017

Moyenne Mobile Centrée Sur La Saisonnalité

Lors du calcul d'une moyenne mobile courante, placer la moyenne dans la période de temps moyenne a un sens Dans l'exemple précédent, nous avons calculé la moyenne des 3 premières périodes et l'avons placé à côté de la période 3. Nous aurions pu placer la moyenne au milieu de la Intervalle de temps de trois périodes, c'est-à-dire, à côté de période 2. Cela fonctionne bien avec des périodes de temps impaires, mais pas aussi bien pour des périodes de temps même. Alors, où placer la première moyenne mobile lorsque M 4 Techniquement, la moyenne mobile tomberait à t 2,5, 3,5. Pour éviter ce problème, nous lisser les MA en utilisant M 2. Ainsi, nous lisser les valeurs lissées Si nous avons un nombre moyen pair de termes, nous devons lisser les valeurs lissées Le tableau suivant montre les résultats en utilisant M 4.Formulation feuille Lissage exponentiel Il est facile d'effectuer un ajustement saisonnier et d'ajuster des modèles de lissage exponentiels à l'aide d'Excel. Les images et diagrammes d'écran ci-dessous sont tirés d'une feuille de calcul qui a été configurée pour illustrer l'ajustement saisonnier multiplicatif et le lissage exponentiel linéaire sur les données de ventes trimestrielles suivantes de Outboard Marine: Pour obtenir une copie du fichier de feuille de calcul lui-même, cliquez ici. La version de lissage linéaire exponentielle qui sera utilisée ici à des fins de démonstration est la version Brown8217s, simplement parce qu'elle peut être implémentée avec une seule colonne de formules et qu'il n'y a qu'une seule constante de lissage à optimiser. Habituellement, il est préférable d'utiliser la version Holt8217s qui dispose de constantes de lissage distinctes pour le niveau et la tendance. Le processus de prévision se déroule comme suit: (i) d'abord les données sont désaisonnalisées (ii) ensuite les prévisions sont générées pour les données désaisonnalisées par lissage exponentiel linéaire et (iii) enfin les prévisions désaisonnalisées sont quasiment saisonnalisées pour obtenir des prévisions pour la série originale . Le processus d'ajustement saisonnier est effectué dans les colonnes D à G. La première étape de l'ajustement saisonnier est de calculer une moyenne mobile centrée (effectuée ici dans la colonne D). Cela peut se faire en prenant la moyenne de deux moyennes sur une année qui sont compensées par une période l'une par rapport à l'autre. (Une combinaison de deux moyennes de décalage plutôt qu'une moyenne simple est nécessaire pour des fins de centrage lorsque le nombre de saisons est pair.) L'étape suivante consiste à calculer le rapport à la moyenne mobile - ie. Les données originales sont divisées par la moyenne mobile dans chaque période - ce qui est réalisé ici dans la colonne E. (On appelle également cette composante du cycle quottrend-cycle, dans la mesure où les effets de tendance et de cycle d'affaires peuvent être considérés comme étant tout ce que Il est évident que les variations mensuelles qui ne sont pas dues à la saisonnalité pourraient être déterminées par de nombreux autres facteurs, mais la moyenne sur douze mois les lisse dans une large mesure. L'indice saisonnier estimé pour chaque saison est calculé en faisant la moyenne d'abord de tous les ratios pour cette saison particulière, qui est effectuée dans les cellules G3-G6 en utilisant une formule AVERAGEIF. Les ratios moyens sont alors redimensionnés de sorte qu'ils totalisent exactement 100 fois le nombre de périodes dans une saison, ou 400 dans ce cas, ce qui est fait dans les cellules H3-H6. Dans la colonne F, les formules VLOOKUP sont utilisées pour insérer la valeur d'indice saisonnier appropriée dans chaque ligne du tableau de données, en fonction du trimestre de l'année où il est représenté. La moyenne mobile centrée et les données désaisonnalisées se terminent comme suit: Notez que la moyenne mobile ressemble généralement à une version plus lisse de la série désaisonnalisée et qu'elle est plus courte aux deux extrémités. Une autre feuille de calcul dans le même fichier Excel montre l'application du modèle de lissage exponentiel linéaire aux données désaisonnalisées, commençant dans la colonne G. Une valeur pour la constante de lissage (alpha) est entrée au-dessus de la colonne de prévision (ici, dans la cellule H9) et Pour plus de commodité, on lui attribue le nom de la plage quotAlpha. quot (Le nom est attribué à l'aide de la commande quotInsertNameCreatequot). Le modèle LES est initialisé en définissant les deux premières prévisions égales à la première valeur réelle de la série désaisonnalisée. La formule utilisée ici pour la prévision des LES est la forme récursive à une seule équation du modèle Brown8217s: Cette formule est entrée dans la cellule correspondant à la troisième période (ici, cellule H15) et copiée à partir de là. On remarque que les prévisions ERP pour la période courante se réfèrent aux deux observations précédentes et aux deux erreurs de prévision précédentes, ainsi qu'à la valeur de alpha. Ainsi, la formule de prévision de la rangée 15 se réfère uniquement aux données qui étaient disponibles dans la rangée 14 et antérieures. (Bien sûr, si on voulait utiliser le lissage exponentiel linéaire plutôt que linéaire, nous pourrions remplacer la formule SES ici.) On pourrait aussi utiliser Holt8217s plutôt que le modèle LES de Brown8217, ce qui nécessiterait deux colonnes supplémentaires de formules pour calculer le niveau et la tendance Qui sont utilisés dans la prévision.) Les erreurs sont calculées dans la colonne suivante (ici, colonne J) en soustrayant les prévisions des valeurs réelles. L'erreur quadratique moyenne est calculée comme étant la racine carrée de la variance des erreurs plus le carré de la moyenne. (Cela résulte de l'identité mathématique: VARIANCE MSE (erreurs) (AVERAGE (erreurs)) 2). Dans le calcul de la moyenne et de la variance des erreurs dans cette formule, les deux premières périodes sont exclues parce que le modèle ne commence pas réellement à prévoir jusqu'à La troisième période (ligne 15 sur le tableur). La valeur optimale de alpha peut être trouvée soit en changeant manuellement alpha jusqu'à ce que le RMSE minimum soit trouvé, soit vous pouvez utiliser le quotSolverquot pour effectuer une minimisation exacte. La valeur de alpha que le Solver a trouvée est affichée ici (alpha0.471). C'est généralement une bonne idée de tracer les erreurs du modèle (en unités transformées) et aussi de calculer et de tracer leurs autocorrélations à des décalages de jusqu'à une saison. Voici une courbe chronologique des erreurs (désaisonnalisées): Les autocorrélations d'erreur sont calculées à l'aide de la fonction CORREL () pour calculer les corrélations des erreurs avec elles-mêmes retardées par une ou plusieurs périodes - les détails sont indiqués dans le modèle de feuille de calcul . Voici une trame des autocorrélations des erreurs aux cinq premiers décalages: Les autocorrélations aux intervalles 1 à 3 sont très proches de zéro, mais la pointe au retard 4 (dont la valeur est 0,35) est légèrement gênante - elle suggère que la Le processus d'ajustement saisonnier n'a pas été complètement réussi. Cependant, il n'est en fait que marginalement significatif. 95 pour déterminer si les autocorrélations sont significativement différentes de zéro sont approximativement plus-ou-moins 2SQRT (n-k), où n est la taille de l'échantillon et k le retard. Ici n est 38 et k varie de 1 à 5, donc la racine carrée de - n-moins-k est d'environ 6 pour tous, et donc les limites pour tester la signification statistique des écarts à partir de zéro sont plus ou moins plus - Ou-moins 26 ou 0,33. Si vous modifiez la valeur de l'alpha à la main dans ce modèle Excel, vous pouvez observer l'effet sur la série temporelle et les diagrammes d'autocorrélation des erreurs, ainsi que sur l'erreur quadratique moyenne qui sera illustrée ci-dessous. Au bas de la feuille de calcul, la formule de prévision est quotbootstrappée à l'avenir en substituant simplement les prévisions aux valeurs réelles au point où les données réelles s'épuisent, c'est-à-dire. Où l'avenir commence. (En d'autres termes, dans chaque cellule où une future valeur de données se produirait, une référence de cellule est insérée qui pointe vers la prévision faite pour cette période.) Toutes les autres formules sont simplement copiées vers le bas depuis le dessus: Notez que les erreurs pour les prévisions de L'avenir sont tous calculés à zéro. Cela ne signifie pas que les erreurs réelles seront nulles, mais plutôt que cela reflète simplement le fait qu'à des fins de prédiction, nous supposons que les données futures seront égales aux prévisions en moyenne. Les prévisions des ERP résultant pour les données désaisonnalisées ressemblent à ceci: Avec cette valeur particulière de alpha, qui est optimale pour les prévisions à une période d'avance, la tendance projetée est légèrement à la hausse, reflétant la tendance locale qui a été observée au cours des 2 dernières années Ou plus. Pour d'autres valeurs d'alpha, une projection de tendance très différente pourrait être obtenue. C'est généralement une bonne idée de voir ce qui arrive à la projection de tendance à long terme lorsque alpha est varié, car la valeur qui est la meilleure pour la prévision à court terme ne sera pas nécessairement la meilleure valeur pour prédire l'avenir plus lointain. Par exemple, voici le résultat obtenu si la valeur de alpha est réglée manuellement à 0.25: La tendance à long terme projetée est maintenant négative plutôt que positive Avec une plus petite valeur d'alpha, le modèle place plus de poids sur les données plus anciennes Son estimation du niveau et de la tendance actuels et ses prévisions à long terme reflètent la tendance à la baisse observée au cours des cinq dernières années plutôt que la tendance à la hausse plus récente. Ce diagramme illustre également clairement comment le modèle avec une plus petite valeur d'alpha est plus lent à répondre aux points de quotturning dans les données et tend donc à faire une erreur du même signe pendant de nombreuses périodes d'affilée. Ses erreurs de prévision à 1 pas sont plus élevées en moyenne que celles obtenues avant (RMSE de 34,4 plutôt que 27,4) et fortement positivement autocorrélées. L'autocorrélation lag-1 de 0,56 dépasse de beaucoup la valeur de 0,33 calculée ci-dessus pour un écart statistiquement significatif par rapport à zéro. Comme alternative à la réduction de la valeur de l'alpha afin d'introduire plus de conservatisme dans les prévisions à long terme, un facteur quottrend d'amortissement est parfois ajouté au modèle afin de rendre la tendance projetée aplatir après quelques périodes. La dernière étape de la construction du modèle de prévision consiste à quantifier les prévisions ERP en les multipliant par les indices saisonniers appropriés. Ainsi, les prévisions saisonnières de la colonne I ne sont que le produit des indices saisonniers de la colonne F et des prévisions des prévisions saisonnières corrigées des variations saisonnières dans la colonne H. Il est relativement facile de calculer les intervalles de confiance pour les prévisions à une étape de ce modèle: Calculer le RMSE (erreur quadratique moyenne équivaut à la racine carrée du MSE), puis calculer un intervalle de confiance pour la prévision désaisonnalisée en ajoutant et en soustrayant deux fois le RMSE. (En général, un intervalle de confiance de 95 pour une prévision à une période d'avance est approximativement égal à la prévision de point plus ou moins deux fois l'écart type estimé des erreurs de prévision, en supposant que la distribution des erreurs est approximativement normale et que la taille de l'échantillon Est assez grand, disons, 20 ou plus. Ceci, le RMSE plutôt que l'écart type de l'échantillon des erreurs est la meilleure estimation de l'écart-type des erreurs de prévisions futures car il prend le biais ainsi que les variations aléatoires en compte.) Les limites de confiance Pour les prévisions corrigées des variations saisonnières sont ensuite recalées. Ainsi que les prévisions, en les multipliant par les indices saisonniers appropriés. Dans ce cas, le RMSE est égal à 27,4 et la prévision désaisonnalisée pour la première période future (décembre 93) est de 273,2. De sorte que l'intervalle de confiance corrigé des variations saisonnières est de 273,2-227,4 218,4 à 273,227,4 328,0. Multipliant ces limites par Decembers indice saisonnier de 68,61. Nous obtenons des limites de confiance inférieures et supérieures de 149,8 et 225,0 autour de la prévision ponctuelle de 187,4 déc-93. Les limites de confiance pour les prévisions plus d'une période à venir s'élargiront généralement à mesure que l'horizon de prévision augmente, en raison de l'incertitude concernant le niveau et la tendance ainsi que les facteurs saisonniers, mais il est difficile de les calculer en général par des méthodes analytiques. (La méthode appropriée pour calculer les limites de confiance pour la prévision des ERI est en utilisant la théorie ARIMA, mais l'incertitude dans les indices saisonniers est une autre question.) Si vous voulez un intervalle de confiance réaliste pour une prévision plus d'une période à venir, en prenant toutes les sources de , Il vaut mieux utiliser des méthodes empiriques: par exemple, pour obtenir un intervalle de confiance pour une prévision à deux étapes, vous pouvez créer une autre colonne sur le tableur pour calculer une prévision à 2 étapes pour chaque période ( En amorçant la prévision en une étape). Calculer ensuite le RMSE des erreurs de prévision à 2 pas et utiliser ceci comme base pour un intervalle de confiance à deux pas. Moyennes de déplacement et moyennes mobiles centrées Un couple de points concernant la saisonnalité dans une série chronologique se répètent, même si Ils semblent évidents. D'une part, le terme de saison 8222 ne se réfère pas nécessairement aux quatre saisons de l'année qui résultent de l'inclinaison de l'axe de la Terre. Dans l'analyse prédictive, 8220season8221 signifie souvent précisément que, parce que beaucoup des phénomènes que nous étudions varient avec la progression du printemps à l'hiver: les ventes d'engins d'hiver ou d'été, l'incidence de certaines maladies généralisées, les événements météorologiques causés par l'emplacement du Jet et les changements dans la température de l'eau dans l'océan Pacifique est, et ainsi de suite. De même, les événements qui se produisent régulièrement peuvent agir comme des saisons météorologiques, même s'ils n'ont qu'un faible lien avec les solstices et les équinoxes. Les déplacements de huit heures dans les hôpitaux et les usines se traduisent souvent par l'incidence des apports et des dépenses d'énergie, une saison de huit heures et le cycle des saisons chaque jour et non chaque année. Les dates d'échéance des impôts signalent le début d'une inondation de dollars dans les trésoreries municipales, étatiques et fédérales, la saison pourrait être d'une année (impôt sur le revenu des particuliers), six mois (taxes foncières dans de nombreux États), trimestriellement ), etc. Il est un peu étrange que nous ayons le mot 8220season8221 pour désigner généralement la période de temps régulièrement récurrente, mais aucun terme général pour la période pendant laquelle un tour complet des saisons se produit. 8220Cycle8221 est possible, mais dans l'analyse et la prévision, ce terme est généralement considéré comme une période de longueur indéterminée, comme un cycle économique. En l'absence d'un meilleur terme, j'ai utilisé la période 8222 dans ce chapitre et dans les chapitres suivants. Ce n'est pas seulement une réflexion terminologique. Les façons dont nous identifions les saisons et la période pendant laquelle les saisons tournent ont des implications réelles, voire mineures, sur la façon dont nous mesurons leurs effets. Les sections suivantes expliquent comment certains analystes varient la façon dont ils calculent les moyennes mobiles selon que le nombre de saisons est impair ou pair. Utiliser des moyennes mobiles plutôt que des moyennes simples Supposons qu'une grande ville envisage de réaffecter sa police de la circulation pour mieux répondre à l'incidence de la conduite avec facultés affaiblies, ce qui, selon la ville, a augmenté. Il ya quatre semaines, une nouvelle loi est entrée en vigueur, légalisant la possession et l'usage récréatif de la marijuana. Depuis, le nombre quotidien d'arrestations de la DWI semble s'accroître. La complication est le fait que le nombre d'arrestations semble augmenter les vendredis et samedis. Pour aider à planifier les besoins en main-d'œuvre dans l'avenir, vous aimeriez prévoir toute tendance sous-jacente à l'établissement de 8217s. Vous aimeriez aussi chronométrer le déploiement de vos ressources afin de tenir compte de toute saisonnalité liée au week-end qui se produise. La figure 5.9 contient les données pertinentes avec lesquelles vous devez travailler. Figure 5.9 Avec cet ensemble de données, chaque jour de la semaine constitue une saison. Même en observant le graphique de la figure 5.9. Vous pouvez dire que la tendance du nombre d'arrestations quotidiennes est en hausse. Vous devrez planifier d'augmenter le nombre d'agents de la circulation, et espérer que la tendance se stabilise bientôt. En outre, les données confirment l'idée que plus d'arrestations se produisent régulièrement les vendredis et samedis, donc votre allocation de ressources doit répondre à ces pointes. Mais vous devez quantifier la tendance sous-jacente, pour déterminer combien de police supplémentaire vous devez apporter. Vous devez également quantifier la taille attendue des pointes du week-end, afin de déterminer combien d'autres policiers vous devez surveiller pour les pilotes erratiques ces jours-là. Le problème est que, pour le moment, vous ne savez pas combien de l'augmentation quotidienne est due à la tendance et combien est due à cet effet week-end. Vous pouvez commencer par détringir la série chronologique. Plus tôt dans ce chapitre, dans 8220Simple Saisonnier Moyennes, 8221 vous avez vu un exemple de la façon de détringir une série chronologique afin d'isoler les effets saisonniers en utilisant la méthode des moyennes simples. Dans cette section, vous verrez comment le faire en utilisant des moyennes mobiles 8212 très probablement, l'approche des moyennes mobiles est utilisée plus souvent dans l'analyse prédictive que l'approche des moyennes simples. Il y a plusieurs raisons pour la plus grande popularité des moyennes mobiles, entre autres, que l'approche des moyennes mobiles ne vous demande pas d'effondrer vos données dans le processus de quantification d'une tendance. Rappelons que l'exemple précédent obligeait à réduire les moyennes trimestrielles par rapport aux moyennes annuelles, à calculer une tendance annuelle, puis à répartir un quart de la tendance annuelle pour chaque trimestre de l'année. Cette étape était nécessaire afin de supprimer la tendance des effets saisonniers. En revanche, l'approche des moyennes mobiles vous permet de détrôner la série chronologique sans recourir à ce genre de machination. La figure 5.10 montre comment fonctionne l'approche des moyennes mobiles dans le présent exemple. Figure 5.10 La moyenne mobile du deuxième graphique clarifie la tendance sous-jacente. La figure 5.10 ajoute une colonne de moyenne mobile et une colonne pour des données saisonnières spécifiques. À l'ensemble de données de la figure 5.9. Les deux ajouts nécessitent une discussion. Les pointes dans les arrestations qui ont lieu les week-ends vous donne raison de croire que vous travaillez avec des saisons qui se répètent une fois par semaine. Par conséquent, commencer par obtenir la moyenne pour la période englobante 8212, qui est, les sept premières saisons, du lundi au dimanche. La formule de la moyenne de la cellule D5, la première moyenne mobile disponible, est la suivante: Cette formule est copiée et collée dans la cellule D29, de sorte que vous avez 25 moyennes mobiles basées sur 25 séries de sept jours consécutifs. Notez que pour montrer à la fois les premières et dernières observations de la série chronologique, j'ai caché les lignes 10 à 17. Vous pouvez les afficher, si vous le souhaitez, dans le manuel de ce chapitre, disponible sur le site Web de l'éditeur. Effectuez une sélection multiple des lignes visibles 9 et 18, cliquez avec le bouton droit sur l'un de leurs en-têtes de ligne et choisissez Représenter dans le menu contextuel. Lorsque vous masquez une ligne de travail, comme dans la figure 5.10. Toutes les données tracées dans les lignes cachées sont également masquées sur le graphique. Les étiquettes des axes x ne désignent que les points de données qui apparaissent sur le graphique. Comme chaque moyenne mobile de la figure 5.10 englobe sept jours, aucune moyenne mobile n'est jumelée aux trois premières ou trois dernières observations réelles. Copier et coller la formule dans la cellule D5 jusqu'à un jour à la cellule D4 vous court des observations8212 il n'y a aucune observation enregistrée dans la cellule C1. De même, il n'y a pas de moyenne mobile enregistrée en dessous de la cellule D29. Copier et coller la formule dans D29 dans D30 nécessiterait une observation dans la cellule C33, et aucune observation n'est disponible pour le jour que la cellule représenterait. Il est possible, bien sûr, de raccourcir la longueur de la moyenne mobile, par exemple cinq, au lieu de sept. Cela signifie donc que les formules de moyenne mobile de la figure 5.10 pourraient commencer dans la cellule D4 au lieu de D5. Cependant, dans ce type d'analyse, vous voulez que la longueur de la moyenne mobile soit égale au nombre de saisons: sept jours par semaine pour les événements répétés chaque semaine implique une moyenne mobile de sept heures et quatre trimestres d'une année pour des événements qui Récurrent chaque année implique une moyenne mobile de longueur quatre. Dans le même ordre d'idées, nous quantifions généralement les effets saisonniers de telle sorte qu'ils totalisent à zéro dans la période englobante. Comme vous l'avez vu dans la première section de ce chapitre, sur des moyennes simples, cela se fait en calculant la moyenne des quatre trimestres d'une année, puis en soustrayant la moyenne de l'année de chaque chiffre trimestriel. Ce faisant, on s'assure que le total des effets saisonniers est nul. À son tour, that8217s utile parce qu'il met les effets saisonniers sur un pied d'égalité 8212a effet d'été de 11 est aussi loin de la moyenne comme un effet d'hiver de 821111. Si vous voulez faire la moyenne de cinq saisons au lieu de sept pour obtenir votre moyenne mobile, Off trouvant un phénomène qui se répète toutes les cinq saisons au lieu de sept. Toutefois, lorsque vous prenez la moyenne des effets saisonniers plus tard dans le processus, ces moyennes sont peu susceptibles de s'ajouter à zéro. Il est nécessaire à ce stade de recalibrer ou de normaliser. Les moyennes pour que leur somme soit nulle. Quand cela est fait, les moyennes saisonnières moyennes expriment l'effet sur une période d'appartenance à une saison particulière. Une fois normalisées, les moyennes saisonnières sont appelées les indices saisonniers que ce chapitre a déjà mentionné plusieurs fois. La figure 5.10 montre également ce que l'on appelle des données saisonnières spécifiques dans la colonne E. Elles sont les suivantes après avoir soustrait la moyenne mobile de l'observation réelle. Pour avoir une idée de ce que représentent les saisons spécifiques, considérez la moyenne mobile dans la cellule D5. C'est la moyenne des observations dans C2: C8. Les écarts de chaque observation par rapport à la moyenne mobile (par exemple, C2 8211 D5) sont garantis à un total égal à zéro 8212, ce qui est une caractéristique d'une moyenne. Par conséquent, chaque écart exprime l'effet d'être associé à ce jour particulier dans cette semaine particulière. Il s'agit d'une saison spécifique, puis spécifique, parce que la déviation s'applique à ce lundi ou mardi particulier et ainsi de suite, et saisonnière parce que dans cet exemple nous traitons chaque jour comme s'il s'agissait d'une saison dans la période englobante d'une semaine. Parce que chaque saison saisonnière mesure l'effet de cette saison vis-à-vis de la moyenne mobile pour ce groupe de (ici) sept saisons, vous pouvez ensuite faire la moyenne des saisons spécifiques pour une saison particulière (par exemple, tous les vendredis dans votre Série chronologique) pour estimer que la saison8217s général, plutôt que spécifique, l'effet. Cette moyenne n'est pas confondue par une tendance sous-jacente dans la série chronologique, car chaque saisonnier spécifique exprime un écart par rapport à sa propre moyenne mobile particulière. Alignement des moyennes mobiles Il ya aussi la question d'aligner les moyennes mobiles avec l'ensemble de données d'origine. Dans la figure 5.10. J'ai aligné chaque moyenne mobile avec le milieu de la gamme d'observations qu'il comprend. Ainsi, par exemple, la formule dans la cellule D5 fait la moyenne des observations en C2: C8, et je l'ai alignée avec la quatrième observation, le milieu de la plage moyenne, en la plaçant dans la rangée 5. Cette disposition est appelée moyenne mobile centrée . Et de nombreux analystes préfèrent aligner chaque moyenne mobile avec le point milieu des observations qu'il moyenne. Gardez à l'esprit que dans ce contexte, 8220midpoint8221 se réfère au milieu d'un laps de temps: jeudi est le milieu de lundi à dimanche. Il ne fait pas référence à la médiane des valeurs observées, bien que, bien sûr, il pourrait fonctionner de cette façon dans la pratique. Une autre approche est la moyenne mobile à la baisse. Dans ce cas, chaque moyenne mobile est alignée sur l'observation finale selon laquelle elle est en moyenne 8212 et, par conséquent, elle traîne derrière ses arguments. C'est souvent l'arrangement préféré si vous voulez utiliser une moyenne mobile comme prévision, comme c'est le cas avec le lissage exponentiel, parce que votre moyenne mobile finale coïncide avec la dernière observation disponible. Centré Moyennes mobiles avec nombres pairs de saisons Nous adoptons habituellement une procédure spéciale lorsque le nombre de saisons est encore plutôt que impair. C'est l'état typique des affaires: il y a même un nombre de saisons dans la période englobante pour des saisons typiques telles que des mois, des trimestres et des périodes quadriennales (pour les élections). La difficulté avec un nombre pair de saisons est qu'il n'y a pas de point médian. Deux n'est pas le point médian d'une plage commençant par 1 et se terminant par 4, et aucun n'est 3 si on peut dire qu'il en a un, son milieu est de 2,5. Six n'est pas le point médian de 1 à 12, ni 7 son point de vue purement théorique est 6,5. Pour agir comme si un point médian existe, vous devez ajouter une couche de moyenne sur les moyennes mobiles. Voir la figure 5.11. Figure 5.11 Excel offre plusieurs façons de calculer une moyenne mobile centrée. L'idée derrière cette approche pour obtenir une moyenne mobile qui centré sur un point médian existant, quand il ya un nombre pair de saisons, est de tirer ce point milieu vers l'avant par une demi-saison. Vous calculez une moyenne mobile qui serait centrée à, disons, le troisième point dans le temps si cinq saisons au lieu de quatre constituaient un tour complet du calendrier. Ceux-ci sont réalisés en prenant deux moyennes mobiles consécutives et en faisant la moyenne. Donc, dans la figure 5.11. Il y a une moyenne mobile dans la cellule E6 qui fait la moyenne des valeurs dans D3: D9. Parce qu'il y a quatre valeurs saisonnières dans D3: D9, la moyenne mobile en E6 est considérée comme centrée à la saison imaginaire 2.5, soit un demi-point de moins que la première saison candidate disponible, 3. (Les saisons 1 et 2 ne sont pas disponibles comme points médians pour Manque de données à la moyenne avant la saison 1.) Notez, cependant, que la moyenne mobile dans la cellule E8 moyenne des valeurs dans D5: D11, la deuxième à la cinquième dans la série chronologique. Cette moyenne est centrée au point (imaginaire) 3.5, une période complète devant la moyenne centrée à 2.5. En faisant la moyenne des deux moyennes mobiles, la pensée va, vous pouvez tirer le point central de la première moyenne mobile vers l'avant d'un demi point, de 2.5 à 3. Ce sont les moyennes dans la colonne F de la figure 5.11. La cellule F7 fournit la moyenne des moyennes mobiles en E6 et E8. Et la moyenne dans F7 est alignée avec le troisième point de données dans la série chronologique originale, dans la cellule D7, pour souligner que la moyenne est centrée sur cette saison. Si vous développez la formule dans la cellule F7 ainsi que les moyennes mobiles dans les cellules E6 et E8, vous verrez qu'il s'avère être une moyenne pondérée des cinq premières valeurs de la série chronologique, la première et la cinquième valeur étant donné un poids De 1 et les deuxième à quatrième valeurs étant donné un poids de 2. Cela nous amène à un moyen plus rapide et plus simple de calculer une moyenne mobile centrée avec un nombre pair de saisons. Toujours dans la figure 5.11. Les poids sont stockés dans la plage H3: H11. Cette formule renvoie la première moyenne mobile centrée, dans la cellule I7: Cette formule renvoie 13,75. Qui est identique à la valeur calculée par la formule de double moyenne dans la cellule F7. En faisant la référence aux poids absolus, au moyen des signes de dollar dans H3: H11. Vous pouvez copier la formule et le coller vers le bas autant que nécessaire pour obtenir le reste des moyennes mobiles centrées. Détriction de la série avec des moyennes mobiles Lorsque vous avez soustrait les moyennes mobiles des observations originales pour obtenir les données saisonnières spécifiques, vous avez supprimé la tendance sous-jacente de la série. Ce qui reste dans les saisons spécifiques est normalement une série horizontale stationnaire avec deux effets qui font que les saisonniers spécifiques partent d'une ligne absolument droite: les effets saisonniers et l'erreur aléatoire dans les observations originales. La figure 5.12 montre les résultats de cet exemple. Figure 5.12 Les effets saisonniers spécifiques pour le vendredi et le samedi demeurent clairs dans la série détruites. Le graphique supérieur de la figure 5.12 montre les observations quotidiennes initiales. La tendance générale à la hausse et les pointes saisonnières du week-end sont claires. Le graphique ci-dessous montre les données saisonnières spécifiques: le résultat de la déviation de la série d'origine avec un filtre de moyenne mobile, tel que décrit plus haut dans 8220. Comprendre les saisons spécifiques. 8221 Vous pouvez voir que la série détruits est maintenant pratiquement horizontale (une ligne de tendance linéaire pour les saisons spécifiques A une légère dérive vers le bas), mais les pics saisonniers vendredi et samedi sont toujours en place. La prochaine étape consiste à aller au-delà des saisonniers spécifiques aux indices saisonniers. Voir la figure 5.13. Figure 5.13 Les effets saisonniers spécifiques sont d'abord évalués en moyenne puis normalisés pour atteindre les indices saisonniers. Dans la figure 5.13. Les saisons spécifiques dans la colonne E sont réarrangés dans la forme tabulaire représentée dans la plage H4: N7. Le but est simplement de faciliter le calcul des moyennes saisonnières. Ces moyennes sont indiquées dans H11: N11. Cependant, les chiffres de H11: N11 sont des moyennes, et non des écarts par rapport à une moyenne, et on peut donc s'attendre à ce qu'elles viennent à zéro. Nous avons encore besoin de les ajuster afin qu'ils expriment des écarts par rapport à un grand moyen. Cette grande moyenne apparaît dans la cellule N13, et est la moyenne des moyennes saisonnières. On peut arriver aux indices saisonniers en soustrayant la moyenne générale de N13 de chacune des moyennes saisonnières. Le résultat est dans la plage H17: N17. Ces indices saisonniers ne sont plus spécifiques à une moyenne mobile particulière, comme c'est le cas pour les saisons spécifiques de la colonne E. Étant donné qu'ils sont basés sur une moyenne de chaque cas d'une saison donnée, ils expriment l'effet moyen d'une saison donnée sur la période Quatre semaines dans la série chronologique. En outre, ce sont des mesures d'une saison où l'incidence sur les arrestations par rapport à la moyenne est de sept jours. Nous pouvons maintenant utiliser ces indices saisonniers pour dessaisonner la série. Nous utiliserons la série désaisonnalisée pour obtenir des prévisions par régression linéaire ou méthode Holt8217s de lissage des séries tendancielles (voir chapitre 4). Ensuite, nous ajoutons simplement les indices saisonniers dans les prévisions pour procéder à une nouvelle détermination de la saisonnalité. Tout cela apparaît à la figure 5.14. Figure 5.14 Après avoir les indices saisonniers, les finitions appliquées ici sont les mêmes que dans la méthode des moyennes simples. Les étapes illustrées dans la figure 5.14 sont largement les mêmes que celles des figures 5.6 et 5.7. Dont il est question dans les sections suivantes. Désontonalisation des observations Soustraire les indices saisonniers des observations originales pour désactualiser les données. Vous pouvez le faire comme le montre la figure 5.14. Dans lequel les observations originales et les indices saisonniers sont disposés sous la forme de deux listes commençant dans la même rangée, les colonnes C et F. Cette disposition rend un peu plus facile de structurer les calculs. Vous pouvez également effectuer la soustraction comme le montre la Figure 5.6. Où les observations trimestrielles initiales (C12: F16), les indices trimestriels (C8: F8) et les résultats désaisonnalisés (C20: F24) sont présentés sous forme de tableaux. Cet arrangement rend un peu plus facile de se concentrer sur les indices saisonniers et les trimestres à déséquilibre. Prévision des observations désaisonnalisées Figure 5.14. Les observations désaisonnalisées sont dans la colonne H et dans la figure 5.7 elles sont dans la colonne C. Peu importe si vous voulez utiliser une approche de régression ou une approche de lissage de la prévision, il est préférable d'organiser les observations désaisonnalisées dans une liste à une seule colonne. Dans la figure 5.14. Les prévisions sont dans la colonne J. La formule de tableau suivant est entrée dans la plage J2: J32. Plus haut dans ce chapitre, j'ai souligné que si vous omettez l'argument x-values ​​des arguments TREND () function8217s, Excel fournit les valeurs par défaut 1. 2. N. Où n est le nombre de valeurs y. Dans la formule donnée précédemment, H2: H32 contient 31 y-values. Étant donné que l'argument contenant normalement les valeurs x est manquant, Excel fournit les valeurs par défaut 1. 2. 31. Ce sont les valeurs que nous voudrions utiliser de toute façon, dans la colonne B, donc la formule telle que donnée est équivalente à TREND (H2: H32, B2: B32). Et la structure utilisée dans D5: D24 de la Figure 5.7: Faire la prévision en une étape Jusqu'à présent, vous avez arrangé pour les prévisions des séries temporelles désaisonnalisées de t 1 à t 31 dans la figure 5.14. Et de t 1 à t 20 à la figure 5.7. Ces prévisions constituent des informations utiles à diverses fins, dont l'évaluation de l'exactitude des prévisions au moyen d'une analyse RMSE. Mais votre objectif principal est de prévoir au moins la période suivante, encore non observée. Pour obtenir cela, vous pouvez d'abord prévoir à partir de la fonction TREND () ou LINEST () si vous utilisez la régression, ou à partir de la formule de lissage exponentiel si vous utilisez la méthode Holt8217s. Ensuite, vous pouvez ajouter l'index saisonnier associé à la prévision de régression ou de lissage, pour obtenir une prévision qui inclut à la fois la tendance et l'effet saisonnier. Dans la figure 5.14. Vous obtenez la prévision de régression dans la cellule J33 avec cette formule: Dans cette formule, les valeurs y dans H2: H32 sont les mêmes que dans les autres formules TREND () dans la colonne J. Ainsi sont les valeurs x (par défaut) de 1 À travers 32. Maintenant, vous fournissez une nouvelle valeur x en tant que troisième argument de fonction8217, que vous dites à TREND () à rechercher dans la cellule B33. It8217s 32. La valeur suivante de t. Et Excel renvoie la valeur 156.3 dans la cellule J33. La fonction TREND () dans la cellule J33 indique à Excel, en effet, 8220Calculer l'équation de régression pour les valeurs de H2: H32 régressée sur les valeurs t de 1 à 31. Appliquer cette équation de régression à la nouvelle valeur x de 32 et retourner le résultat.8221 Vous trouverez la même approche dans la cellule D25 de la figure 5.7. Où la formule pour obtenir la prévision en une seule étape est la suivante: Ajout des indices saisonniers Retour Dans L'étape finale est de procéder à une nouvelle saisonnalisation des prévisions en ajoutant les indices saisonniers aux prévisions de tendance, inverser ce que vous avez fait quatre pas en soustrayant la Des observations originales. Cela se fait dans la colonne F de la figure 5.7 et la colonne K dans la figure 5.14. Don8217 oublier d'ajouter l'indice saisonnier approprié pour la prévision en une étape, avec les résultats montrés dans la cellule F25 dans la figure 5.7 et dans la cellule K33 dans la figure 5.14. Vous pouvez trouver des graphiques de trois représentations des données d'arrêt du trafic de la figure 5.15. La série désaisonnalisée, la prévision linéaire à partir des données désaisonnalisées et les prévisions rationalisées. Il est à noter que les prévisions intègrent à la fois la tendance générale des données originales et leurs pics de vendredi. Figure 5.15 Tracer les prévisions.


No comments:

Post a Comment