Saturday, 22 April 2017

5 Punkt Einfach Symmetrisch Gleitender Durchschnitt


Bewegungsdurchschnitte Bewegungsdurchschnitte Bei herkömmlichen Datensätzen ist der Mittelwert oft der erste und eine der nützlichsten Zusammenfassungsstatistiken zu berechnen. Wenn Daten in Form einer Zeitreihe vorliegen, ist das Serienmittel ein nützliches Maß, entspricht aber nicht der Dynamik der Daten. Mittelwerte, die über kurzgeschlossene Perioden berechnet werden, die entweder der aktuellen Periode vorausgeht oder auf der aktuellen Periode zentriert sind, sind oft nützlicher. Weil diese Mittelwerte variieren oder sich bewegen, wenn sich die aktuelle Periode von der Zeit t 2, t 3 usw. bewegt, werden sie als gleitende Mittelwerte (Mas) bezeichnet. Ein einfacher gleitender Durchschnitt ist (typischerweise) der ungewichtete Durchschnitt von k vorherigen Werten. Ein exponentiell gewichteter gleitender Durchschnitt ist im Wesentlichen derselbe wie ein einfacher gleitender Durchschnitt, aber mit Beiträgen zum Mittelwert, der durch ihre Nähe zur aktuellen Zeit gewichtet wird. Weil es nicht eine, sondern eine ganze Reihe von gleitenden Durchschnitten für jede gegebene Serie gibt, kann der Satz von Mas selbst auf Graphen aufgetragen, als Serie analysiert und bei der Modellierung und Prognose verwendet werden. Eine Reihe von Modellen kann mit gleitenden Durchschnitten konstruiert werden, und diese sind als MA-Modelle bekannt. Wenn solche Modelle mit autoregressiven (AR) Modellen kombiniert werden, sind die resultierenden zusammengesetzten Modelle als ARMA - oder ARIMA-Modelle bekannt (die I ist für integriert). Einfache Bewegungsdurchschnitte Da eine Zeitreihe als ein Satz von Werten betrachtet werden kann, kann t 1,2,3,4, n der Mittelwert dieser Werte berechnet werden. Wenn wir annehmen, daß n ziemlich groß ist und wir eine ganze Zahl k wählen, die viel kleiner als n ist. Wir können einen Satz von Blockdurchschnitten oder einfache gleitende Mittelwerte (der Ordnung k) berechnen: Jede Maßnahme repräsentiert den Mittelwert der Datenwerte über ein Intervall von k Beobachtungen. Beachten Sie, dass die erste mögliche MA der Ordnung k gt0 die für t k ist. Im Allgemeinen können wir den zusätzlichen Index in den obigen Ausdrücken fallen lassen und schreiben: Dies besagt, dass der geschätzte Mittelwert zum Zeitpunkt t der einfache Durchschnitt des beobachteten Wertes zum Zeitpunkt t und der vorhergehenden k -1 Zeitschritte ist. Wenn Gewichte angewendet werden, die den Beitrag von Beobachtungen, die weiter weg in der Zeit sind, verringern, wird der gleitende Durchschnitt exponentiell geglättet. Bewegliche Mittelwerte werden oft als eine Form der Prognose verwendet, wobei der Schätzwert für eine Reihe zum Zeitpunkt t 1, S t1. Wird als MA für den Zeitraum bis einschließlich Zeit t genommen. z. B. Die heutige Schätzung basiert auf einem Durchschnitt der bisher aufgezeichneten Werte bis einschließlich gestern (für Tagesdaten). Einfache gleitende Durchschnitte können als eine Form der Glättung gesehen werden. In dem unten dargestellten Beispiel wurde der in der Einleitung zu diesem Thema gezeigte Luftverschmutzungs-Datensatz um eine 7-Tage-Gleitende Durchschnitt (MA) - Linie erweitert, die hier in rot dargestellt ist. Wie man sehen kann, glättet die MA-Linie die Gipfel und Tröge in den Daten und kann sehr hilfreich bei der Identifizierung von Trends sein. Die Standard-Vorwärtsberechnungsformel bedeutet, dass die ersten k -1 Datenpunkte keinen MA-Wert haben, aber danach rechnen die Berechnungen bis zum endgültigen Datenpunkt in der Serie. PM10 tägliche Mittelwerte, Greenwich Quelle: London Air Quality Network, londonair. org. uk Ein Grund für die Berechnung einfacher gleitender Durchschnitte in der beschriebenen Weise ist, dass es ermöglicht, Werte für alle Zeitschlitze von der Zeit tk bis zur Gegenwart berechnet werden, und Da eine neue Messung für die Zeit t 1 erhalten wird, kann die MA für die Zeit t 1 dem bereits berechneten Satz hinzugefügt werden. Dies stellt eine einfache Prozedur für dynamische Datensätze zur Verfügung. Allerdings gibt es einige Probleme mit diesem Ansatz. Es ist vernünftig zu argumentieren, dass der Mittelwert über die letzten 3 Perioden, sagen wir, zum Zeitpunkt t -1 liegen sollte, nicht Zeit t. Und für eine MA über eine gerade Anzahl von Perioden vielleicht sollte es sich am Mittelpunkt zwischen zwei Zeitintervallen befinden. Eine Lösung für dieses Problem ist die Verwendung von zentrierten MA-Berechnungen, bei denen das MA zum Zeitpunkt t der Mittelwert eines symmetrischen Satzes von Werten um t ist. Trotz seiner offensichtlichen Verdienste wird dieser Ansatz im Allgemeinen nicht verwendet, weil es erfordert, dass Daten für zukünftige Ereignisse verfügbar sind, was möglicherweise nicht der Fall ist. In Fällen, in denen die Analyse vollständig aus einer bestehenden Serie besteht, kann die Verwendung von zentriertem Mas vorzuziehen sein. Einfache gleitende Durchschnitte können als eine Form der Glättung betrachtet werden, wobei einige hochfrequente Komponenten einer Zeitreihe entfernt werden und die Trends in ähnlicher Weise wie der allgemeine Begriff der digitalen Filterung hervorgehoben werden (aber nicht entfernen) werden. In der Tat sind gleitende Mittelwerte eine Form des linearen Filters. Es ist möglich, eine gleitende Durchschnittsberechnung auf eine Reihe anzuwenden, die bereits geglättet worden ist, d. h. Glätten oder Filtern einer bereits geglätteten Reihe. Zum Beispiel können wir mit einem gleitenden Durchschnitt von Ordnung 2, wie sie mit Gewichten berechnet werden, also die MA bei x 2 0,5 x 1 0,5 x 2 betrachten. Ebenso ist die MA bei x 3 0,5 x 2 0,5 x 3. Wenn wir Eine zweite Glättung oder Filterung anwenden, haben wir 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 dh die zweistufige Filterung Prozess (oder Faltung) hat einen variabel gewichteten symmetrischen gleitenden Durchschnitt mit Gewichten erzeugt. Mehrere Windungen können sehr komplexe gewichtete Bewegungsdurchschnitte erzeugen, von denen einige von besonderem Gebrauch in spezialisierten Bereichen, wie in Lebensversicherungsberechnungen, gefunden wurden. Bewegliche Mittelwerte können verwendet werden, um periodische Effekte zu entfernen, wenn sie mit der Länge der Periodizität als bekannt berechnet werden. Zum Beispiel, mit monatlichen Daten saisonale Variationen können oft entfernt werden (wenn dies das Ziel ist), indem Sie einen symmetrischen 12-Monats-gleitenden Durchschnitt mit allen Monaten gleich gewichtet, mit Ausnahme der ersten und letzten, die mit 12 gewichtet werden. Dies ist, weil es wird 13 Monate im symmetrischen Modell (aktuelle Zeit, t. - 6 Monate). Die Summe wird durch 12 geteilt. Ähnliche Verfahren können für jede klar definierte Periodizität angenommen werden. Exponentiell gewichtete Bewegungsdurchschnitte (EWMA) Mit der einfachen gleitenden Durchschnittsformel: Alle Beobachtungen werden gleich gewichtet. Wenn wir diese gleichen Gewichte nennen, alpha t. Jedes der k Gewichte würde 1 k betragen. So wäre die Summe der Gewichte 1, und die Formel wäre: Wir haben bereits gesehen, dass mehrere Anwendungen dieses Prozesses dazu führen, dass die Gewichte variieren. Bei exponentiell gewichteten Bewegungsdurchschnitten wird der Beitrag zum Mittelwert aus Beobachtungen, die in der Zeit mehr entfernt werden, reduziert und damit neue (lokale) Ereignisse hervorgehoben. Im wesentlichen wird ein Glättungsparameter, 0lt alpha lt1, eingeführt und die Formel überarbeitet: Eine symmetrische Version dieser Formel wäre von der Form: Werden die Gewichte im symmetrischen Modell als Begriffe der Binomialexpansion ausgewählt, (1212) 2q. Sie werden auf 1 summieren, und wenn q groß wird, wird die Normalverteilung angenähert. Dies ist eine Form der Kernel-Gewichtung, wobei die Binomie als Kernfunktion fungiert. Die im vorigen Unterabschnitt beschriebene zweistufige Faltung ist genau diese Anordnung, wobei q 1 die Gewichte ergibt. Bei der exponentiellen Glättung ist es notwendig, einen Satz von Gewichten zu verwenden, die auf 1 summieren und die Größe geometrisch verkleinern. Die verwendeten Gewichte sind typischerweise in der Form: Um zu zeigen, dass diese Gewichte auf 1 summieren, betrachten wir die Ausdehnung von 1 als Reihe. Wir können den Ausdruck in Klammern mit der Binomialformel (1- x) p schreiben und erweitern. Wobei x (1-) und p -1, was ergibt: Dies ergibt dann eine Form des gewichteten gleitenden Durchschnitts der Form: Diese Summation kann als eine Wiederholungsrelation geschrieben werden, die die Berechnung stark vereinfacht und das Problem vermeidet, dass das Gewichtungsregime Sollte strikt unendlich sein, damit die Gewichte auf 1 summieren (für kleine Werte von alpha ist dies normalerweise nicht der Fall). Die Notation, die von verschiedenen Autoren verwendet wird, variiert. Manche verwenden den Buchstaben S, um anzuzeigen, daß die Formel im wesentlichen eine geglättete Variable ist und schreibt: Während die Kontrolle Theorie Literatur oft Z anstelle von S für die exponentiell gewichteten oder geglätteten Werte verwendet (siehe z. B. Lucas und Saccucci, 1990, LUC1 , Und die NIST-Website für weitere Details und bearbeitete Beispiele). Die oben zitierten Formeln stammen aus der Arbeit von Roberts (1959, ROB1), aber Hunter (1986, HUN1) verwendet einen Ausdruck der Form: die für die Verwendung in einigen Kontrollverfahren besser geeignet ist. Bei alpha 1 ist die mittlere Schätzung einfach der gemessene Wert (oder der Wert des vorherigen Datenelementes). Mit 0,5 ist die Schätzung der einfache gleitende Durchschnitt der aktuellen und früheren Messungen. Bei der Vorhersage der Modelle ist der Wert S t. Wird oft als Schätz - oder Prognosewert für den nächsten Zeitraum verwendet, dh als Schätzung für x zum Zeitpunkt t 1. Damit haben wir: Dies zeigt, dass der Prognosewert zum Zeitpunkt t 1 eine Kombination aus dem vorherigen exponentiell gewichteten gleitenden Durchschnitt ist Plus eine Komponente, die den gewichteten Vorhersagefehler darstellt, epsilon. Zum Zeitpunkt t. Unter der Annahme, dass eine Zeitreihe gegeben ist und eine Prognose erforderlich ist, ist ein Wert für Alpha erforderlich. Dies kann aus den vorhandenen Daten abgeschätzt werden, indem die Summe der quadratischen Vorhersagefehler mit variierenden Werten von alpha für jedes t 2,3 ausgewertet wird. Einstellung der ersten Schätzung als der erste beobachtete Datenwert x 1. Bei den Steuerungsanwendungen ist der Wert von alpha wichtig, der bei der Bestimmung der oberen und unteren Kontrollgrenzen verwendet wird und die erwartete durchschnittliche Lauflänge (ARL) beeinflusst Bevor diese Kontrollgrenzen kaputt sind (unter der Annahme, dass die Zeitreihe einen Satz von zufälligen, identisch verteilten unabhängigen Variablen mit gemeinsamer Varianz darstellt). Unter diesen Umständen ist die Varianz der Kontrollstatistik: (Lucas und Saccucci, 1990): Kontrollgrenzen werden gewöhnlich als feste Vielfache dieser asymptotischen Varianz gesetzt, z. B. - 3 mal die Standardabweichung. Wenn beispielsweise Alpha 0,25 und die zu überwachenden Daten eine Normalverteilung N (0,1) haben, wenn die Kontrolle begrenzt wird, werden die Regelgrenzen - 1.134 sein und der Prozeß erreicht eine oder andere Grenze in 500 Schritten im Durchschnitt. Lucas und Saccucci (1990 LUC1) leiten die ARLs für eine breite Palette von Alpha-Werten und unter verschiedenen Annahmen mit Markov Chain Verfahren ab. Sie tabellieren die Ergebnisse, einschließlich der Bereitstellung von ARLs, wenn der Mittelwert des Kontrollprozesses um ein Vielfaches der Standardabweichung verschoben wurde. Zum Beispiel ist bei einer 0,5-Schicht mit alpha 0,25 die ARL weniger als 50 Zeitschritte. Die oben beschriebenen Ansätze werden als einzelne exponentielle Glättung bezeichnet. Da die Prozeduren einmal auf die Zeitreihen angewendet werden und dann analysiert oder kontrolliert werden, werden Prozesse auf dem resultierenden geglätteten Datensatz durchgeführt. Wenn der Datensatz einen Trend und saisonale Komponenten enthält, kann eine zweidimensionale oder dreistufige Exponentialglättung als Mittel zur Beseitigung (expliziten Modellierung) dieser Effekte angewendet werden (siehe weiter unten den Abschnitt "Vorhersage" und das NIST-Beispiel). CHA1 Chatfield C (1975) Die Analyse der Times-Serie: Theorie und Praxis. Chapman und Hall, London HUN1 Hunter J S (1986) Der exponentiell gewichtete gleitende Durchschnitt. J von Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Exponentiell gewichtete Moving Average Control Schemes: Eigenschaften und Erweiterungen. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Kontrolltabelle Tests basierend auf geometrischen Moving Averages. Technometrics, 1, 239-2506.2 Bewegen von Durchschnittswerten ma 40 elecsales, order 5 41 In der zweiten Spalte dieser Tabelle wird ein gleitender Durchschnitt der Ordnung 5 angezeigt, der eine Schätzung des Trendzyklus liefert. Der erste Wert in dieser Spalte ist der Durchschnitt der ersten fünf Beobachtungen (1989-1993) der zweite Wert in der 5-MA-Spalte ist der Mittelwert der Werte 1990-1994 und so weiter. Jeder Wert in der 5-MA-Säule ist der Durchschnitt der Beobachtungen in der Fünfjahresperiode, die auf dem entsprechenden Jahr zentriert sind. Es gibt keine Werte für die ersten zwei Jahre oder die letzten zwei Jahre, weil wir nicht zwei Beobachtungen auf beiden Seiten haben. In der obigen Formel enthält Spalte 5-MA die Werte von Hut mit k2. Um zu sehen, wie die Trendzyklusschätzung aussieht, zeichnen wir sie mit den Originaldaten in Abbildung 6.7 zusammen. Plot 40 elecsales, main quotResidential Elektrizitätsverkäufe, ylab quotGWhquot. Xlab quotYearquot 41 Zeilen 40 ma 40 elecsales, 5 41. col quotredquot 41 Beachten Sie, wie der Trend (in Rot) glatter ist als die Originaldaten und erfasst die Hauptbewegung der Zeitreihe ohne all die kleinen Schwankungen. Die gleitende Durchschnittsmethode erlaubt keine Schätzungen von T, wobei t nahe den Enden der Reihe liegt, daher erstreckt sich die rote Linie nicht auf die Kanten des Graphen auf beiden Seiten. Später werden wir anspruchsvollere Methoden der Trendzyklusschätzung einsetzen, die Schätzungen in der Nähe der Endpunkte zulassen. Die Reihenfolge des gleitenden Durchschnitts bestimmt die Glätte der Trendzyklusschätzung. Im Allgemeinen bedeutet eine größere Ordnung eine glattere Kurve. Die folgende Grafik zeigt die Auswirkung der Änderung der Reihenfolge des gleitenden Durchschnitts für die Wohnungsdaten der Verkaufsdaten. Einfache gleitende Mittelwerte wie diese sind meist von ungerader Ordnung (zB 3, 5, 7 usw.). Das ist also symmetrisch: In einem gleitenden Durchschnitt der Ordnung m2k1 gibt es k frühere Beobachtungen, k spätere Beobachtungen und die mittlere Beobachtung Die gemittelt werden. Aber wenn m war sogar, wäre es nicht mehr symmetrisch. Verschieben von Durchschnittswerten der gleitenden Mittelwerte Es ist möglich, einen gleitenden Durchschnitt auf einen gleitenden Durchschnitt anzuwenden. Ein Grund dafür ist es, einen gleichmäßigen gleitenden Durchschnitt symmetrisch zu machen. Zum Beispiel könnten wir einen gleitenden Durchschnitt von Ordnung 4 nehmen und dann einen anderen gleitenden Durchschnitt von Ordnung 2 auf die Ergebnisse anwenden. In Tabelle 6.2 wurde dies für die ersten Jahre der australischen vierteljährlichen Bierproduktionsdaten durchgeführt. Bier2 lt-fenster 40 ausbeer, start 1992 41 ma4 ltmma 40 bier2, bestell 4. centre FALSE 41 ma2x4 ltmma 40 bier2, bestell 4. zentrum TRUE 41 Die notation 2times4-MA in der letzten Spalte bedeutet ein 4-MA Gefolgt von einem 2-MA. Die Werte in der letzten Spalte werden durch einen gleitenden Durchschnitt der Ordnung 2 der Werte in der vorherigen Spalte erhalten. Zum Beispiel sind die ersten beiden Werte in der 4-MA-Säule 451,2 (443410420532) 4 und 448,8 (410420532433) 4. Der erste Wert in der Spalte 2times4-MA ist der Durchschnitt dieser beiden: 450,0 (451,2448,8) 2. Wenn ein 2-MA einem gleitenden Durchschnitt der geraden Ordnung folgt (wie z. B. 4), wird er als zentrierter gleitender Durchschnitt von Ordnung 4 bezeichnet. Dies liegt daran, dass die Ergebnisse nun symmetrisch sind. Um zu sehen, dass dies der Fall ist, können wir die 2times4-MA wie folgt schreiben: begin Hut amp frac Bigfrac (y y y y) frac (y y y y) Big Amps frac y frac14y frac14y frac14y frac18y. Ende Es ist jetzt ein gewichteter Durchschnitt von Beobachtungen, aber es ist symmetrisch. Auch andere Kombinationen von gleitenden Durchschnitten sind möglich. Zum Beispiel wird oft ein 3times3-MA verwendet und besteht aus einem gleitenden Durchschnitt der Ordnung 3, gefolgt von einem anderen gleitenden Durchschnitt der Ordnung 3. Im Allgemeinen sollte eine gerade Ordnung MA von einer geraden Ordnung MA folgen, um sie symmetrisch zu machen. In ähnlicher Weise sollte eine ungerade Ordnung MA von einer ungeraden Ordnung MA folgen. Schätzung des Trendzyklus mit saisonalen Daten Die häufigste Verwendung von zentrierten gleitenden Durchschnitten ist die Schätzung des Trendzyklus aus saisonalen Daten. Betrachten Sie die 2times4-MA: Hut frac y frac14y frac14y frac14y frac18y. Bei der Anwendung auf vierteljährliche Daten wird jedes Viertel des Jahres gleichgewichtig, da die ersten und letzten Bedingungen für das gleiche Quartal in aufeinanderfolgenden Jahren gelten. Folglich wird die saisonale Variation gemittelt und die resultierenden Werte von Hut t haben wenig oder keine saisonale Variation übrig. Ein ähnlicher Effekt würde mit einem 2 x 8-MA oder einem 2 x 12-MA erhalten. Im Allgemeinen entspricht ein 2 x m-MA einem gewichteten gleitenden Durchschnitt der Ordnung m1 mit allen Beobachtungen, die das Gewicht 1m mit Ausnahme der ersten und letzten Begriffe, die Gewichte 1 (2m) nehmen, Wenn also die saisonale Periode gleich und von der Ordnung m ist, benutze ein 2 mal m-MA, um den Trendzyklus abzuschätzen. Wenn die Saisonperiode ungerade und der Ordnung m ist, verwenden Sie einen m-MA, um den Trendzyklus abzuschätzen. Insbesondere kann ein 2 x 12-MA verwendet werden, um den Trendzyklus der monatlichen Daten abzuschätzen und ein 7-MA kann verwendet werden, um den Trendzyklus der täglichen Daten abzuschätzen. Andere Entscheidungen für den Auftrag der MA werden in der Regel dazu führen, dass Trend-Zyklus-Schätzungen durch die Saisonalität in den Daten verunreinigt werden. Beispiel 6.2 Herstellung elektrischer Geräte Abbildung 6.9 zeigt eine 2-mal 12-MA, die auf den Index der elektronischen Ausrüstung angewendet wird. Beachten Sie, dass die glatte Linie keine Saisonalität zeigt, ist es fast das gleiche wie der Trendzyklus, der in Abbildung 6.2 gezeigt wird, der mit einer viel anspruchsvolleren Methode geschätzt wurde, als im Durchschnitt zu fahren. Jede andere Wahl für die Reihenfolge des gleitenden Durchschnitts (außer 24, 36, etc.) hätte zu einer glatten Linie geführt, die einige saisonale Schwankungen zeigt. Plot 40 elecequip, ylab quotNeu bestellt indexquot. Col quotgrayquot, main quotElektrische Geräteherstellung (Eurozone) 41 Zeilen 40 ma 40 elecequip, Auftrag 12 41. col quotredquot 41 Gewichtete Bewegungsdurchschnitte Kombinationen von gleitenden Durchschnitten führen zu gewichteten gleitenden Durchschnitten. Zum Beispiel entspricht der oben diskutierte 2x4-MA einem gewichteten 5-MA mit Gewichten, die durch frac, frac, frac, frac, frac gegeben sind. Im allgemeinen kann ein gewichteter m-MA als Hut t sum k aj y geschrieben werden, wobei k (m-1) 2 und die Gewichte durch a, Punkte, ak gegeben sind. Es ist wichtig, dass die Gewichte alle zu einem summieren und dass sie symmetrisch sind, so dass aj a. Die einfache m-MA ist ein Spezialfall, bei dem alle Gewichte gleich 1m sind. Ein großer Vorteil der gewichteten gleitenden Durchschnitte ist, dass sie eine glattere Schätzung des Trendzyklus ergeben. Anstelle von Beobachtungen, die die Berechnung mit vollem Gewicht betreten und verlassen, werden ihre Gewichte langsam erhöht und dann langsam verringert, was zu einer glatteren Kurve führt. Einige spezifische Sätze von Gewichten sind weit verbreitet. Einige davon sind in Tabelle 6.3 angegeben. Zeitreihenanalyse: Der Prozess der saisonalen Anpassung Was sind die beiden Hauptphilosophien der saisonalen Anpassung Was ist ein Filter Was ist das Endpunkt Problem Wie entscheiden wir, welches Filter zu verwenden ist Was ist eine Verstärkungsfunktion Was ist eine Phasenverschiebung Was macht Henderson im Durchschnitt? Wie gehen wir mit dem Endpunktproblem um Was sind saisonale Bewegungsdurchschnitte Warum werden Trendschätzungen überarbeitet Wieviel Daten sind erforderlich, um akzeptable saisonbereinigte Schätzungen zu erhalten ERWEITERT Wie können die beiden saisonalen Anpassungsphilosophien vergleichen? SIND DIE ZWEI HAUPTPHILOSOPHIEN DER SEASONALEN EINSTELLUNG Die beiden Hauptphilosophien für die saisonale Anpassung sind die modellbasierte Methode und die Filterbasierte Methode. Filterbasierte Methoden Diese Methode wendet einen Satz von festen Filtern (gleitende Mittelwerte) an, um die Zeitreihen in einen Trend, saisonale und unregelmäßige Komponente zu zerlegen. Die zugrundeliegende Vorstellung besteht darin, dass die ökonomischen Daten aus einer Reihe von Zyklen bestehen, einschließlich der Konjunkturzyklen (der Trend), der saisonalen Zyklen (Saisonalität) und des Lärms (der unregelmäßigen Bestandteil). Ein Filter entfernt oder reduziert die Stärke bestimmter Zyklen aus den Eingangsdaten. Um eine saisonbereinigte Serie aus monatlich gesammelten Daten zu produzieren, müssen Ereignisse, die alle 12, 6, 4, 3, 2,4 und 2 Monate auftreten, entfernt werden. Diese entsprechen saisonalen Frequenzen von 1, 2, 3, 4, 5 und 6 Zyklen pro Jahr. Die längeren nicht-saisonalen Zyklen gelten als Teil des Trends und die kürzeren nicht-saisonalen Zyklen bilden die Unregelmäßigen. Allerdings kann die Grenze zwischen dem Trend und den unregelmäßigen Zyklen mit der Länge des Filters variieren, der verwendet wird, um den Trend zu erhalten. In ABS saisonale Anpassung, Zyklen, die erheblich zum Trend beitragen sind in der Regel größer als etwa 8 Monate für monatliche Serien und 4 Quartalen für vierteljährliche Serie. Der Trend, saisonale und unregelmäßige Komponenten brauchen keine expliziten Einzelmodelle. Die unregelmäßige Komponente ist definiert als das, was nach dem Trend bleibt und saisonale Komponenten durch Filter entfernt wurden. Irregulars zeigen keine weißen Rauschcharakteristiken an. Filterbasierte Methoden werden oft als X11-Stilmethoden bezeichnet. Dazu gehören X11 (entwickelt von U. S. Census Bureau), X11ARIMA (entwickelt von Statistics Canada), X12ARIMA (entwickelt von U. S. Census Bureau), STL, SABL und SEASABS (das Paket von der ABS verwendet). Die rechnerischen Unterschiede zwischen den verschiedenen Methoden der Familie X11 sind vor allem das Ergebnis verschiedener Techniken, die an den Enden der Zeitreihe verwendet werden. Zum Beispiel verwenden einige Methoden an den Enden asymmetrische Filter, während andere Methoden die Zeitreihe extrapolieren und symmetrische Filter auf die erweiterte Serie anwenden. Modellbasierte Methoden Dieser Ansatz erfordert, dass der Trend, saisonale und unregelmäßige Komponenten der Zeitreihen separat modelliert werden. Es geht davon aus, dass die unregelmäßige Komponente 8220white noise8221 ist - das sind alle Zykluslängen gleichermaßen dargestellt. Die irregulars haben Nullmittel und eine konstante Varianz. Die saisonale Komponente hat ihr eigenes Rauschelement. Zwei weit verbreitete Softwarepakete, die modellbasierte Methoden anwenden, sind STAMP und SEATSTRAMO (von der Bank of Spain entwickelt). Wesentliche rechnerische Unterschiede zwischen den verschiedenen modellbasierten Methoden sind in der Regel auf Modellspezifikationen zurückzuführen. In einigen Fällen werden die Komponenten direkt modelliert Dass die ursprünglichen Zeitreihen zuerst modelliert werden und die Komponentenmodelle davon zerlegt werden. Für einen Vergleich der beiden Philosophien auf einem fortgeschritteneren Niveau, siehe Wie sehen die beiden saisonalen Anpassungsphilosophien WAS IST EIN FILTER Filter können verwendet werden, um sich zu zerlegen Eine Zeitreihe in einen Trend, saisonale und unregelmäßige Komponente. Gebende Mittelwerte sind eine Art von Filter, die nacheinander durchschnittlich eine Verschiebung Zeitspanne von Daten, um eine geglättete Schätzung einer Zeitreihe zu produzieren. Diese geglättete Serie kann als abgeleitet werden Indem man eine Eingangsreihe durch einen Prozeß ausführt, bei dem man bestimmte Zyklen herausfiltert. Folglich wird ein gleitender Durchschnitt oft als Filter bezeichnet. Der Grundprozess beinhaltet die Festlegung eines Satzes von Gewichten der Länge m 1 m 2 1 als: Anmerkung: Ein symmetrischer Satz von Gewichten hat m 1 m 2 und wjw - j Ein gefilterter Wert zum Zeitpunkt t kann berechnet werden, wobei Y t den Wert beschreibt Der Zeitreihen zum Zeitpunkt t. Zum Beispiel betrachten wir die folgende Serie: Unter Verwendung eines einfachen 3-Term-symmetrischen Filters (dh m 1 m 2 1 und aller Gewichte sind 13) wird der erste Term der geglätteten Reihe durch Anwendung der Gewichte auf die ersten drei Begriffe des Originals erhalten Serie: Der zweite geglättete Wert wird durch die Anwendung der Gewichte auf die zweite, dritte und vierte Begriffe in der Originalreihe erzeugt: WAS IST DAS ENDE POINT PROBLEM Überprüfen Sie die Serie: Diese Serie enthält 8 Begriffe. Jedoch enthält die geglättete Reihe, die durch Anwenden eines symmetrischen Filters auf die ursprünglichen Daten erhalten wird, nur 6 Ausdrücke: Dies liegt daran, daß an den Enden der Reihe nicht genügend Daten vorhanden sind, um einen symmetrischen Filter anzuwenden. Der erste Begriff der geglätteten Serie ist ein gewichteter Durchschnitt von drei Begriffen, zentriert auf den zweiten Begriff der ursprünglichen Serie. Ein gewichteter Mittelpunkt, der auf den ersten Term der ursprünglichen Serie zentriert ist, kann nicht als Daten erhalten werden, bevor dieser Punkt nicht verfügbar ist. Ebenso ist es nicht möglich, einen gewichteten Mittelwert zu berechnen, der auf den letzten Term der Serie zentriert ist, da nach diesem Punkt keine Daten vorhanden sind. Aus diesem Grund können symmetrische Filter nicht am Ende einer Serie verwendet werden. Dies ist bekannt als Endpunkt Problem. Zeitreihenanalytiker können asymmetrische Filter verwenden, um geglättete Schätzungen in diesen Regionen zu erzeugen. In diesem Fall wird der geglättete Wert 8216off cent8817 berechnet, wobei der Durchschnitt unter Verwendung mehrerer Daten von einer Seite des Punktes als der andere bestimmt wird, je nachdem, was verfügbar ist. Alternativ können Modellierungsverfahren verwendet werden, um die Zeitreihen zu extrapolieren und dann symmetrische Filter auf die erweiterte Reihe anzuwenden. WIE WERDEN WIR DARFEN, WELCHE FILTER ZUM BENUTZEN Der Zeitreihenanalytiker wählt einen geeigneten Filter auf der Grundlage seiner Eigenschaften, wie z. B. welche Zyklen der Filter bei der Anwendung entfernt. Die Eigenschaften eines Filters können mit einer Verstärkungsfunktion untersucht werden. Verstärkungsfunktionen werden verwendet, um die Wirkung eines Filters bei einer gegebenen Frequenz auf die Amplitude eines Zyklus für eine bestimmte Zeitreihe zu untersuchen. Für weitere Details über die Mathematik, die mit Gain-Funktionen verbunden ist, können Sie die Time Series Course Notes herunterladen, eine Einführung in die Zeitreihenanalyse, die vom Time Series Analysis Section des ABS veröffentlicht wurde (siehe Abschnitt 4.4). Das folgende Diagramm ist die Verstärkungsfunktion für den symmetrischen 3-Term-Filter, den wir früher untersuchten. Abbildung 1: Verstärkungsfunktion für symmetrischen 3-Term-Filter Die horizontale Achse repräsentiert die Länge eines Eingangszyklus relativ zu der Periode zwischen den Beobachtungspunkten in der ursprünglichen Zeitreihe. So ist ein Eingabezyklus der Länge 2 in 2 Perioden abgeschlossen, was 2 Monate für eine Monatsreihe und 2 Quartale für eine vierteljährliche Serie darstellt. Die vertikale Achse zeigt die Amplitude des Ausgangszyklus relativ zu einem Eingangszyklus. Dieser Filter reduziert die Stärke von 3 Periodenzyklen auf Null. Das heißt, es entfernt vollständig Zyklen von ungefähr dieser Länge. Dies bedeutet, dass für eine Zeitreihe, in der Daten monatlich gesammelt werden, alle saisonalen Effekte, die vierteljährlich auftreten, durch die Anwendung dieses Filters auf die ursprüngliche Serie eliminiert werden. Eine Phasenverschiebung ist die Zeitverschiebung zwischen dem gefilterten Zyklus und dem ungefilterten Zyklus. Eine positive Phasenverschiebung bedeutet, dass der gefilterte Zyklus rückwärts verschoben wird und eine negative Phasenverschiebung in der Zeit nach vorne verschoben wird. Eine Phasenverschiebung tritt auf, wenn das Timing der Wendepunkte verzerrt ist, zum Beispiel wenn der gleitende Durchschnitt von den asymmetrischen Filtern außerhalb der Mitte liegt. Das heißt, sie werden entweder früher oder später in der gefilterten Serie auftreten, als im Original. Ungerade Länge symmetrische gleitende Durchschnitte (wie von der ABS verwendet), wo das Ergebnis zentral platziert ist, verursachen keine Zeit Phasenverschiebung. Es ist wichtig für Filter, die verwendet werden, um den Trend abzuleiten, um die Zeitphase beizubehalten, und damit das Timing von Wendepunkten. Die Fig. 2 und 3 zeigen die Effekte des Anlegens eines 2x12 symmetrischen gleitenden Durchschnitts, der außerhalb des Zentrums liegt. Die kontinuierlichen Kurven stellen die Anfangszyklen dar und die gebrochenen Kurven stellen die Ausgangszyklen nach dem Anlegen des gleitenden Durchschnittsfilters dar. Abbildung 2: 24 Monat Zyklus, Phase -5,5 Monate Amplitude 63 Abbildung 3: 8 Monat Zyklus, Phase -1,5 Monate Amplitude 22 WAS SIND HENDERSON BEWEGLICHE DURCHSCHNITTIGE Henderson bewegte Durchschnitte sind Filter, die von Robert Henderson im Jahre 1916 für den Einsatz in versicherungsmathematischen Anwendungen abgeleitet wurden. Sie sind Trendfilter, die üblicherweise in der Zeitreihenanalyse verwendet werden, um saisonbereinigte Schätzungen zu sanieren, um eine Trendschätzung zu generieren. Sie werden bevorzugt einfachere gleitende Durchschnitte verwendet, weil sie Polynome von bis zu Grad 3 reproduzieren können, wodurch Trendwendepunkte eingefangen werden. Das ABS nutzt Henderson Moving Averages, um Trendschätzungen aus einer saisonbereinigten Serie zu produzieren. Die von der ABS veröffentlichten Trendschätzungen werden typischerweise mit einem 13-Term-Henderson-Filter für Monatsreihen und einem 7-Term-Henderson-Filter für vierteljährliche Serien abgeleitet. Henderson-Filter können entweder symmetrisch oder asymmetrisch sein. Symmetrische Bewegungsdurchschnitte können an Punkten angewendet werden, die ausreichend weit entfernt von den Enden einer Zeitreihe liegen. In diesem Fall wird der geglättete Wert für einen gegebenen Punkt in der Zeitreihe aus einer gleichen Anzahl von Werten auf beiden Seiten des Datenpunktes berechnet. Um die Gewichte zu erhalten, wird ein Kompromiss zwischen den beiden Merkmalen, die im Allgemeinen von einer Trendreihe erwartet werden, geschlagen. Dies ist, dass der Trend in der Lage sein sollte, eine breite Palette von Krümmungen darzustellen und dass es auch so glatt wie möglich sein sollte. Zur mathematischen Ableitung der Gewichte siehe Abschnitt 5.3 der Zeitreihen-Kursnotizen. Die von der ABS-Website kostenlos heruntergeladen werden können. Die Gewichtungsmuster für eine Reihe von symmetrischen Henderson-Bewegungsdurchschnitten sind in der folgenden Tabelle angegeben: Symmetrisches Gewichtungsmuster für Henderson Moving Average Im Allgemeinen gilt, je länger der Trendfilter ist, desto glatter ist der resultierende Trend, wie sich aus einem Vergleich der Verstärkungsfunktionen ergibt über. Ein 5-Term-Henderson reduziert Zyklen von etwa 2,4 Perioden oder weniger um mindestens 80, während ein 23-Term-Henderson Zyklen von etwa 8 Perioden oder weniger um mindestens 90 reduziert. Tatsächlich entfernt ein 23-Term-Henderson-Filter vollständig Zyklen von weniger als 4 Perioden . Henderson bewegte Durchschnitte dämpfen auch die saisonalen Zyklen in unterschiedlichem Ausmaß. Allerdings zeigen die Verstärkungsfunktionen in den Abbildungen 4-8, dass die jährlichen Zyklen in der Monats - und Quartalsreihe nicht wesentlich genug gedämpft werden, um die Anwendung eines Henderson-Filters direkt auf die ursprünglichen Schätzungen zu rechtfertigen. Aus diesem Grund werden sie nur auf eine saisonbereinigte Serie angewendet, bei der die kalenderbezogenen Effekte bereits mit speziell entworfenen Filtern entfernt wurden. Abbildung 9 zeigt die Glättungseffekte des Aufbringens eines Henderson-Filters auf eine Serie: Abbildung 9: 23-Term-Henderson-Filter - Wert der Nicht-Wohngebäude-Zulassungen WIE WIR SIND MIT DEM ENDEPUNKT-PROBLEM ANWENDEN Der symmetrische Henderson-Filter kann nur auf Regionen angewendet werden Von Daten, die ausreichend weit entfernt von den Enden der Serie sind. Zum Beispiel kann der Standard 13 Term Henderson nur auf monatliche Daten angewendet werden, die mindestens 6 Beobachtungen vom Beginn oder Ende der Daten sind. Dies ist, weil die Filterglätte die Serie durch einen gewichteten Durchschnitt der 6 Ausdrücke auf beiden Seiten des Datenpunktes sowie den Punkt selbst. Wenn wir versuchen, es auf einen Punkt anzuwenden, der weniger als 6 Beobachtungen vom Ende der Daten ist, dann gibt es nicht genügend Daten auf einer Seite des Punktes, um den Durchschnitt zu berechnen. Um Trendschätzungen dieser Datenpunkte vorzusehen, wird ein modifizierter oder asymmetrischer gleitender Durchschnitt verwendet. Die Berechnung von asymmetrischen Henderson-Filtern kann durch eine Reihe verschiedener Methoden erzeugt werden, die ähnliche, aber nicht identische Ergebnisse erzeugen. Die vier Hauptmethoden sind die Musgrave-Methode, die Minimierung der Mean Square Revision Methode, die Best Linear Unvoreingenommene Schätzungen (BLUE) Methode und die Kenny und Durbin Methode. Shiskin et. Al (1967) abgeleitet die ursprünglichen asymmetrischen Gewichte für den Henderson gleitenden Durchschnitt, die innerhalb der X11-Pakete verwendet werden. Informationen zur Ableitung der asymmetrischen Gewichte finden Sie in Abschnitt 5.3 der Zeitreihen-Kursnotizen. Man betrachte eine Zeitreihe, in der der zuletzt beobachtete Datenpunkt zum Zeitpunkt N auftritt. Dann kann ein 13-Term-symmetrisches Henderson-Filter nicht auf Datenpunkte angewendet werden, die zu jeder Zeit nach und einschließlich der Zeit N-5 gemessen werden. Für alle diese Punkte muss ein asymmetrischer Satz von Gewichten verwendet werden. Die folgende Tabelle gibt die asymmetrische Gewichtung Muster für einen Standard 13 Begriff Henderson gleitenden Durchschnitt. Die asymmetrischen 13-Term-Henderson-Filter entfernen oder dämpfen nicht die gleichen Zyklen wie der symmetrische 13-Term-Henderson-Filter. Tatsächlich verstärkt das asymmetrische Gewichtungsmuster, das verwendet wird, um den Trend bei der letzten Beobachtung zu schätzen, die Stärke von 12 Periodenzyklen. Auch asymmetrische Filter erzeugen eine zeitliche Phasenverschiebung. WAS SIND SEASONAL BEWEGLICHE DURCHSCHLÜSSE Fast alle von der ABS untersuchten Daten haben saisonale Eigenschaften. Da die Henderson bewegten Durchschnitte verwendet, um die Trendreihe zu schätzen, nicht die Saisonalität zu beseitigen, müssen die Daten saisonbereinigt zuerst mit saisonalen Filtern eingestellt werden. Ein saisonaler Filter hat Gewichte, die im gleichen Zeitraum über die Zeit angewendet werden. Ein Beispiel für das Gewichtungsmuster für einen saisonalen Filter wäre: (13, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 13, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 13), wo zum Beispiel ein Gewicht von einem Drittel auf drei aufeinanderfolgende Januar angewendet wird. Within X11, a range of seasonal filters are available to choose from. These are a weighted 3-term moving average (ma) S 3x1 . weighted 5-term ma S 3x3 . weighted 7-term ma S 3x5 . and a weighted 11-term ma S 3x9 . The weighting structure of weighted moving averages of the form, S nxm . is that a simple average of m terms calculated, and then a moving average of n of these averages is determined. This means that nm-1 terms are used to calculate each final smoothed value. For example, to calculate an 11-term S 3x9 . a weight of 19 is applied to the same period in 9 consecutive years. Then a simple 3 term moving average is applied across the averaged values: This gives a final weighting pattern of (127, 227, 19, 19, 19, 19, 19, 19, 19, 227, 127). The gain function for an 11 term seasonal filter, S 3x9 . looks like: Figure 10: Gain Function for 11 Term (S 3x9 ) Seasonal Filter Applying a seasonal filter to data will generate an estimate of the seasonal component of the time series, as it preserves the strength of seasonal harmonics and dampens cycles of non-seasonal lengths. Asymmetric seasonal filters are used at the ends of the series. The asymmetric weights for each of the seasonal filters used in X11 can be found in section 5.4 of the Time Series Course Notes . WHY ARE TREND ESTIMATES REVISED At the current end of a time series, it is not possible to use symmetric filters to estimate the trend because of the end point problem . Instead, asymmetric filters are used to produce provisional trend estimates. However, as more data becomes available, it is possible to recalculate the trend using symmetric filters and improve the initial estimates. This is known as a trend revision. HOW MUCH DATA IS REQUIRED TO OBTAIN ACCEPTABLE SEASONALLY ADJUSTED ESTIMATES If a time series exhibits relatively stable seasonality and is not dominated by the irregular component, then 5 years of data can be considered an acceptable length to derive seasonally adjusted estimates from. For a series that shows particularly strong and stable seasonality, a crude adjustment can be made with 3 years of data. It is generally preferable to have at least 7 years of data for a normal time series, to precisely identify seasonal patterns, trading day and moving holiday effects, trend and seasonal breaks, as well as outliers. ADVANCED HOW DO THE TWO SEASONAL ADJUSTMENT PHILOSOPHIES COMPARE Model based approaches allow for the stochastic properties (randomness) of the series under analysis, in the sense that they tailor the filter weights based on the nature of the series. The model8217s capability for accurately describing the behaviour of the series can be evaluated, and statistical inferences for the estimates are available based on the assumption that the irregular component is white noise. Filter based methods are less dependent on the stochastic properties of the time series. It is the time series analyst8217s responsibility to select the most appropriate filter from a limited collection for a particular series. It is not possible to perform rigorous checks on the adequacy of the implied model and exact measures of precision and statistical inference are not available. Therefore, a confidence interval cannot be built around the estimate. The following diagrams compare the presence of each of the model components at the seasonal frequencies for the two seasonal adjustment philosophies. The x axis is the period length of the cycle and the y axis represents the strength of the cycles which comprise each component: Figure 11: Comparison of the two seasonal adjustment philosophies Filter based methods assume that the each component exists only a certain cycle lengths. The longer cycles form the trend, the seasonal component is present at seasonal frequencies and the irregular component is defined as cycles of any other length. Under a model based philosophy, the trend, seasonal and irregular component are present at all cycle lengths. The irregular component is of constant strength, the seasonal component peaks at seasonal frequencies and the trend component is strongest in the longer cycles. This page first published 14 November 2005, last updated 25 July 2008

No comments:

Post a Comment