Autoregressive Gleit Durchschnitt Stata
Einführung in ARIMA Nichtseasonale Modelle. ARIMA p, d, q Vorhersage Gleichung ARIMA Modelle sind in der Theorie die allgemeinste Klasse von Modellen für die Vorhersage einer Zeitreihe, die gemacht werden kann, um stationär zu sein, indem sie gegebenenfalls, wenn auch in Verbindung mit nichtlinearen Transformationen, differenziert werden Wie z. B. Protokollierung oder Abblendung, wenn nötig Eine zufällige Variable, die eine Zeitreihe ist, ist stationär, wenn ihre statistischen Eigenschaften alle über die Zeit konstant sind. Eine stationäre Serie hat keinen Trend, ihre Variationen um ihren Mittelwert haben eine konstante Amplitude, und sie wackelt in einer konsistenten Weise Dh ihre kurzfristigen zufälligen Zeitmuster sehen immer in einem statistischen Sinn gleich aus. Die letztere Bedingung bedeutet, dass ihre Autokorrelationskorrelationen mit ihren eigenen vorherigen Abweichungen vom Mittel konstant über die Zeit bleiben oder äquivalent, dass sein Leistungsspektrum über die Zeit konstant bleibt Variable dieses Formulars kann wie gewöhnlich als eine Kombination von Signal und Rauschen betrachtet werden, und das Signal, wenn man offensichtlich ist, könnte ein Muster der schnellen oder langsamen mittleren Reversion oder sinusförmigen Oszillation oder eines schnellen Wechseles im Zeichen sein, und es könnte auch haben Eine saisonale Komponente Ein ARIMA-Modell kann als ein Filter betrachtet werden, der versucht, das Signal vom Rauschen zu trennen, und das Signal wird dann in die Zukunft extrapoliert, um Prognosen zu erhalten. Die ARIMA-Prognosegleichung für eine stationäre Zeitreihe ist eine lineare, dh regression - Typ-Gleichung, in der die Prädiktoren aus Verzögerungen der abhängigen Variablen und / oder Verzögerungen der Prognosefehler bestehen. Das ist. Gezahlter Wert von Y eine Konstante und / oder eine gewichtete Summe aus einem oder mehreren neueren Werten von Y und einer gewichteten Summe von eins oder Neuere Werte der Fehler. Wenn die Prädiktoren nur aus verzögerten Werten von Y bestehen, ist es ein reines autoregressives, selbstregressives Modell, das nur ein Spezialfall eines Regressionsmodells ist und mit Standardregressionssoftware ausgestattet werden könnte Erstklassiges autoregressives AR 1 - Modell für Y ist ein einfaches Regressionsmodell, bei dem die unabhängige Variable nur Y um eine Periode LAG Y, 1 in Statgraphics oder YLAG1 in RegressIt liegt. Wenn einige der Prädiktoren Fehler der Fehler sind, ein ARIMA-Modell Es handelt sich dabei nicht um ein lineares Regressionsmodell, denn es gibt keine Möglichkeit, den letzten Periodenfehler als eigenständige Variable anzugeben, die Fehler müssen auf einer Periodendauer berechnet werden, wenn das Modell an die Daten angepasst ist. Aus technischer Sicht ist die Problem bei der Verwendung von verzögerten Fehlern als Prädiktoren ist, dass die Vorhersagen des Modells keine linearen Funktionen der Koeffizienten sind, obwohl sie lineare Funktionen der vergangenen Daten sind. Daher müssen Koeffizienten in ARIMA-Modellen, die verzögerte Fehler enthalten, durch nichtlineare Optimierungsmethoden hill-climbing geschätzt werden Anstatt nur ein System von Gleichungen zu lösen. Das Akronym ARIMA steht für Auto-Regressive Integrated Moving Average Lags der stationären Serie in der Prognose Gleichung heißen autoregressive Begriffe, Verzögerungen der Prognosefehler werden als gleitende durchschnittliche Ausdrücke und eine Zeitreihe bezeichnet Die gestört werden muss, um stationär zu sein, soll eine integrierte Version einer stationären Serie sein. Random-Walk - und Random-Trend-Modelle, autoregressive Modelle und exponentielle Glättungsmodelle sind alle Sonderfälle von ARIMA-Modellen. Ein nicht seasonales ARIMA-Modell wird klassifiziert Als ARIMA p, d, q Modell, wobei p die Anzahl der autoregressiven Terme ist. d ist die Anzahl der für die Stationarität benötigten Nichtseasonalunterschiede und ist die Anzahl der verzögerten Prognosefehler in der Vorhersagegleichung. Die Prognosegleichung ist Konstruiert wie folgt Zuerst bezeichne y die d-te Differenz von Y, die bedeutet. Hinweis, dass die zweite Differenz von Y der d 2 Fall ist nicht der Unterschied von 2 Perioden vor Vielmehr ist es die erste Differenz-of-the-first Unterschied, das ist das diskrete Analog einer zweiten Ableitung, dh die lokale Beschleunigung der Serie und nicht die lokale Tendenz. In Bezug auf y die allgemeine Prognose Gleichung ist. Hier sind die gleitenden durchschnittlichen Parameter s definiert, so dass ihre Zeichen sind negativ in der Gleichung, nach der Konvention von Box und Jenkins eingeführt Einige Autoren und Software einschließlich der R-Programmiersprache definieren sie so, dass sie Pluszeichen statt haben Wenn die tatsächlichen Zahlen in die Gleichung gesteckt sind, gibt es keine Mehrdeutigkeit, aber es ist wichtig zu wissen, welche Konvention Ihre Software verwendet, wenn Sie die Ausgabe lesen Oft werden die Parameter dort mit AR 1, AR 2, und MA 1, MA 2, etc. identifiziert. Um das passende ARIMA-Modell für Y zu identifizieren, beginnen Sie mit der Bestimmung der Reihenfolge der differenzierenden d Notwendigkeit Um die Serie zu stationieren und die Brutto-Features der Saisonalität zu entfernen, vielleicht in Verbindung mit einer Varianz-stabilisierenden Transformation wie Logging oder Deflating Wenn Sie an dieser Stelle stoppen und voraussagen, dass die differenzierte Serie konstant ist, haben Sie nur einen zufälligen Spaziergang oder zufällig platziert Trendmodell Allerdings können die stationärisierten Serien noch autokorrelierte Fehler aufweisen, was darauf hindeutet, dass in der Prognosegleichung auch eine Anzahl von AR-Terme p1 und / oder einige Anzahl MA-Terme q1 erforderlich sind. Verfahren zur Bestimmung der Werte von p, d und Q, die am besten für eine gegebene Zeitreihe sind, werden in späteren Abschnitten der Notizen besprochen, deren Links oben auf dieser Seite stehen, aber eine Vorschau auf einige der Arten von nicht-seasonalen ARIMA-Modellen, die häufig angetroffen werden, ist unten angegeben. ARIMA 1 , 0,0 erstklassiges autoregressives Modell, wenn die Serie stationär und autokorreliert ist, vielleicht kann es als ein Vielfaches ihres eigenen vorherigen Wertes prognostiziert werden, plus eine Konstante Die Prognosegleichung in diesem Fall ist. das ist Y, das auf sich selbst zurückgeblieben ist Eine Periode Dies ist ein ARIMA 1,0,0 Konstante Modell Wenn der Mittelwert von Y Null ist, dann wäre der konstante Term nicht enthalten. Wenn der Steigungskoeffizient 1 positiv und kleiner als 1 in der Größenordnung ist, muss er kleiner als 1 in sein Größe, wenn Y stationär ist, beschreibt das Modell das Mittel-Rückkehr-Verhalten, bei dem der nächste Perioden-s-Wert 1 mal so weit weg von dem Mittelwert liegen sollte, wie dieser Periodenwert Wenn 1 negativ ist, prognostiziert er das Mittel-Rückkehr-Verhalten mit Wechsel Von Zeichen, dh es sagt auch voraus, dass Y unterhalb der mittleren nächsten Periode sein wird, wenn es über dem Mittelwert dieser Periode liegt. In einem autoregressiven Modell der zweiten Ordnung ARIMA 2,0,0 würde es einen Y-t-2-Term geben Genau so gut und so weiter Abhängig von den Zeichen und Größenordnungen der Koeffizienten könnte ein ARIMA 2.0,0 Modell ein System beschreiben, dessen mittlere Reversion in einer sinusförmig oszillierenden Weise stattfindet, wie die Bewegung einer Masse auf einer Feder, die Wird zufälligen Schocks ausgesetzt. ARIMA 0,1,0 zufälliger Spaziergang Wenn die Serie Y nicht stationär ist, ist das einfachste Modell für sie ein zufälliges Spaziergangmodell, das als Begrenzungsfall eines AR 1 - Modells betrachtet werden kann Autoregressiver Koeffizient ist gleich 1, dh eine Reihe mit unendlich langsamer mittlerer Reversion Die Vorhersagegleichung für dieses Modell kann wie überall geschrieben werden, wo der konstante Term die durchschnittliche Periodenänderung ist, dh die Langzeitdrift in Y Dieses Modell könnte sein Als ein Nicht-Intercept-Regressionsmodell, bei dem die erste Differenz von Y die abhängige Variable ist, da sie nur eine nicht-seasonale Differenz und einen konstanten Term enthält, wird sie als ARIMA 0,1,0-Modell mit Konstante klassifiziert. Die zufällige Walk - Ohne - Drift-Modell wäre ein ARIMA-0,1,0-Modell ohne constant. ARIMA 1,1,0 differenzierte Autoregressive Modell erster Ordnung Wenn die Fehler eines zufälligen Walk-Modells autokorreliert sind, kann das Problem eventuell durch Hinzufügen einer Verzögerung behoben werden Der abhängigen Variablen zur Vorhersagegleichung - dh durch Rückkehr der ersten Differenz von Y auf sich selbst verzögert um eine Periode Dies würde die folgende Vorhersagegleichung ergeben, die umgeordnet werden kann. Dies ist ein autoregressives Modell erster Ordnung mit einer Ordnung von Nonseasonal differenzing und ein konstanter term - dh ein ARIMA 1,1,0 model. ARIMA 0,1,1 ohne konstante einfache exponentielle Glättung Eine weitere Strategie zur Korrektur autokorrelierter Fehler in einem zufälligen Walk-Modell wird durch das einfache exponentielle Glättungsmodell vorgeschlagen Für einige nichtstationäre Zeitreihen, z. B. solche, die geräuschvolle Schwankungen um ein langsam variierendes Mittel aufweisen, führt das zufällige Spaziergangmodell nicht so gut wie ein gleitender Durchschnitt der vergangenen Werte. Anders ausgedrückt, anstatt die jüngste Beobachtung als die Prognose der Nächste Beobachtung ist es besser, einen Durchschnitt der letzten Beobachtungen zu verwenden, um das Rauschen herauszufiltern und den lokalen Mittel genauer zu schätzen. Das einfache exponentielle Glättungsmodell verwendet einen exponentiell gewichteten gleitenden Durchschnitt der vergangenen Werte, um diesen Effekt zu erzielen. Die Vorhersagegleichung Denn das einfache exponentielle Glättungsmodell kann in einer Anzahl von mathematisch äquivalenten Formen geschrieben werden, von denen eine die sogenannte Fehlerkorrekturform ist, in der die vorherige Prognose in Richtung des von ihr vorgenommenen Fehlers eingestellt wird. Weil e t-1 Y T-1 - t-1 per definitionem kann dies umgeschrieben werden, da ist eine ARIMA 0,1,1 - without-konstante Prognosegleichung mit 1 1 - das bedeutet, dass man eine einfache exponentielle Glättung platzieren kann, indem man sie als ARIMA 0,1,1 Modell ohne Konstante, und der geschätzte MA 1 - Koeffizient entspricht 1-minus-alpha in der SES-Formel Erinnern Sie sich, dass im SES-Modell das Durchschnittsalter der Daten in den Prognosen von 1 Periode 1 beträgt Was bedeutet, dass sie tendenziell hinter Trends oder Wendepunkten um etwa 1 Perioden zurückbleiben. Daraus folgt, dass das Durchschnittsalter der Daten in den 1-Periodenprognosen eines ARIMA 0,1,1 - without-constant-Modells 1 1 - 1 Wenn also 1 0 8 das Durchschnittsalter 5 ist, so nähert sich das ARIMA 0,1,1 - without-konstantes Modell zu einem sehr langfristigen gleitenden Durchschnitt, und wenn 1 sich nähert, wird es Ein zufälliges Spaziergang ohne Drift-Modell. Was ist der beste Weg, um die Autokorrelation zu korrigieren, indem man AR-Terme hinzufügt oder MA-Terme hinzufügt. In den vorangegangenen zwei Modellen, die oben diskutiert wurden, wurde das Problem der autokorrelierten Fehler in einem zufälligen Walk-Modell auf zwei verschiedene Arten festgelegt Durch Hinzufügen eines verzögerten Wertes der differenzierten Reihe zur Gleichung oder Hinzufügen eines verzögerten Wertes des Prognosefehlers, welcher Ansatz am besten ist. Ein Schlüsselbund für diese Situation, der später ausführlicher erörtert wird, ist die positive Autokorrelation In der Regel am besten behandelt durch Hinzufügen eines AR-Begriffs zum Modell und negative Autokorrelation ist in der Regel am besten durch Hinzufügen eines MA-Begriffs In Business-und wirtschaftlichen Zeitreihen, negative Autokorrelation oft entsteht als Artefakt der Differenzierung Im Allgemeinen, differenziert reduziert positive Autokorrelation und kann sogar verursachen Ein Wechsel von positiver zu negativer Autokorrelation So wird das ARIMA-0,1,1-Modell, bei dem die Differenzierung von einem MA-Term begleitet wird, häufiger als ein ARIMA 1,1,0-Modell verwendet. ARIMA 0,1,1 mit konstantem Einfache exponentielle Glättung mit Wachstum Durch die Implementierung des SES-Modells als ARIMA-Modell erhalten Sie tatsächlich eine gewisse Flexibilität Zunächst einmal darf der geschätzte MA 1 - Koeffizient negativ sein, dies entspricht einem Glättungsfaktor größer als 1 in einem SES-Modell In der Regel nicht erlaubt durch das SES-Modell-Anpassungsverfahren Zweitens haben Sie die Möglichkeit, einen konstanten Begriff in das ARIMA-Modell einzubeziehen, wenn Sie es wünschen, um einen durchschnittlichen Nicht-Null-Trend zu schätzen. Das ARIMA-0,1,1-Modell mit Konstante hat Die Vorhersagegleichung. Die Prognosen für ein Periodenabschätzung von diesem Modell sind qualitativ ähnlich denen des SES-Modells, mit der Ausnahme, dass die Trajektorie der Langzeitprognosen typischerweise eine abfallende Linie ist, deren Steigung gleich mu ist, anstatt einer horizontalen Linie. ARIMA 0,2,1 oder 0,2,2 ohne konstante lineare exponentielle Glättung Lineare exponentielle Glättungsmodelle sind ARIMA-Modelle, die zwei Nichtseason-Differenzen in Verbindung mit MA-Terme verwenden. Der zweite Unterschied einer Serie Y ist nicht einfach der Unterschied zwischen Y und Selbst ist von zwei Perioden verzögert, aber vielmehr ist es der erste Unterschied der ersten Differenz - der Wechsel-in-der-Änderung von Y in der Periode t. Somit ist die zweite Differenz von Y in der Periode t gleich Yt-Y T-1 - Y t-1 - Y t-2 Y t - 2Y t-1 Y t-2 Eine zweite Differenz einer diskreten Funktion ist analog zu einer zweiten Ableitung einer stetigen Funktion, die die Beschleunigung oder Krümmung in der Funktion misst Zu einem gegebenen Zeitpunkt. Das ARIMA-0,2,2-Modell ohne Konstante prognostiziert, dass die zweite Differenz der Serie gleich einer linearen Funktion der letzten beiden Prognosefehler ist, die umgestellt werden kann, wo 1 und 2 die MA 1 sind Und MA 2 Koeffizienten Dies ist ein allgemeines lineares exponentielles Glättungsmodell, das im Wesentlichen das gleiche wie das Holt-Modell ist, und das Brown-Modell ist ein Spezialfall Es verwendet exponentiell gewichtete Bewegungsdurchschnitte, um sowohl eine lokale Ebene als auch einen lokalen Trend in der Serie zu schätzen. Term-Prognosen aus diesem Modell konvergieren zu einer Geraden, deren Steigung von der durchschnittlichen Tendenz abhängt, die gegen Ende der Serie beobachtet wird. ARIMA 1,1,2 ohne konstante gedämpfte Trend lineare exponentielle Glättung. Dieses Modell ist in den begleitenden Folien auf ARIMA dargestellt Modelle Es extrapoliert den lokalen Trend am Ende der Serie, aber legt es bei längeren Prognosehorizonten ab, um eine Note des Konservatismus einzuführen, eine Praxis, die empirische Unterstützung hat. Sehen Sie den Artikel auf Warum der gedämpfte Trend von Gardner und McKenzie und der Goldenen Regel arbeitet Artikel von Armstrong et al für Details. Es ist in der Regel ratsam, an Modellen, in denen mindestens eines von p und q ist nicht größer als 1, dh nicht versuchen, ein Modell wie ARIMA 2,1,2, wie dies zu passen Dürfte zu Überfüllung und Gemeinsamen Faktoren führen, die in den Anmerkungen zur mathematischen Struktur von ARIMA-Modellen näher erörtert werden. Spreadsheet-Implementierung ARIMA-Modelle wie die oben beschriebenen sind einfach in einer Tabellenkalkulation implementierbar. Die Vorhersagegleichung ist einfach ein Lineare Gleichung, die sich auf vergangene Werte der ursprünglichen Zeitreihen und vergangene Werte der Fehler bezieht. So können Sie eine ARIMA-Prognosekalkulationstabelle einrichten, indem Sie die Daten in Spalte A, die Prognosemethode in Spalte B und die Fehlerdaten abzüglich Prognosen in Spalte speichern C Die Prognoseformel in einer typischen Zelle in Spalte B wäre einfach ein linearer Ausdruck, der sich auf Werte in vorhergehenden Zeilen der Spalten A und C bezieht, multipliziert mit den entsprechenden AR - oder MA-Koeffizienten, die in anderen Zellen auf der Tabellenkalkulation gespeichert sind. 2 2 Autoregressive Modelle VAR p Modelle. VAR Modelle Vektor autoregressive Modelle werden für multivariate Zeitreihen verwendet Die Struktur ist, dass jede Variable eine lineare Funktion von vergangenen Verzögerungen von sich selbst und vergangene Verzögerungen der anderen Variablen ist. Als Beispiel nehmen wir an, dass wir drei verschiedene Zeitreihenvariablen messen , Die mit x, x und x bezeichnet wird. Das Vektor-autoregressive Modell der Ordnung 1, das als VAR 1 bezeichnet wird, ist wie folgt: Jede Variable ist eine lineare Funktion der Verzögerungs-1-Werte für alle Variablen im Set. In einem VAR 2 - Modell Werden die Verzögerungswerte 2 für alle Variablen zu den rechten Seiten der Gleichungen addiert, im Falle von drei x-Variablen oder Zeitreihen gibt es sechs Prädiktoren auf der rechten Seite jeder Gleichung, drei Verzögerung 1 Ausdrücke und drei Verzögerung 2 Begriffe Im Allgemeinen werden für ein VAR-p-Modell die ersten p-Verzögerungen jeder Variablen im System als Regressions-Prädiktoren für jede Variable verwendet. VAR-Modelle sind ein spezieller Fall von allgemeineren VARMA-Modellen VARMA-Modelle für multivariate Zeitreihen sind die VAR-Struktur oben zusammen mit gleitenden durchschnittlichen Ausdrücken für jede Variable Im Allgemeinen sind es in diesem Fall besondere Fälle von ARMAX-Modellen, die die Hinzufügung von anderen Prädiktoren erlauben, die außerhalb des multivariaten Satzes von Hauptinteressen liegen. Hierbei handelt es sich um wie in Abschnitt 5 8 des Textes , Wir konzentrieren uns auf VAR-Modelle. Auf Seite 304 passen die Autoren zum Modell des Formulars. Mathbf t Gamma mathbf t phi mathbf mathbf t. wo mathbf t 1, t enthält Begriffe, um gleichzeitig die Konstante und den Trend zu platzieren. Es entstand aus makroökonomischen Daten, bei denen große Änderungen in den Daten dauerhaft das Niveau der Serie beeinflussen. Es ist nicht so subtil Unterschied hier aus früheren Lektionen, in denen wir jetzt ein Modell an Daten anpassen, die nicht stationär sein müssen In früheren Versionen des Textes haben die Autoren jede Serie unter Verwendung einer linearen Regression mit t, dem Zeitindex, als Prädiktor separat de-trended Variable Die de-trended Werte für jede der drei Serien sind die Residuen aus dieser linearen Regression auf t Die De-Trending ist sinnvoll, weil es die gemeinsame Lenkkraft, die die Zeit auf jede Serie und die Schaffung von Stationarität, wie wir gesehen haben, In vergangenen Lektionen Dieser Ansatz führt zu ähnlichen Koeffizienten, wenn auch etwas anders, da wir jetzt gleichzeitig den Intercept und den Trend gemeinsam in einem multivariaten OLS-Modell anpassen. Die R vars Bibliothek, die von Bernhard Pfaff verfasst ist, hat die Möglichkeit, dieses Modell mit Trend zu betrachten Bei 2 beispielen ein differenz-stationäres modell und ein trend-stationäres modell. Differenz-stationäres Modell. Example 5 10 aus dem Text ist ein differenz-stationäres Modell, dass erste Unterschiede stationär sind Lassen Sie uns den Code und das Beispiel aus dem Text durch Anpassen untersuchen Das obige Modell Wenn nicht bereits installiert Wenn nicht bereits installiert Bibliothek Vars Bibliothek astsa x cbind cmort, tempr, Teil main, xlab Zusammenfassung VAR x, p 1, geben Sie beide. Die ersten beiden Befehle laden die notwendigen Befehle aus der Vars-Bibliothek und die notwendigen Daten aus unserem Textbibliothek. Der Befehl cbind erstellt einen Vektor von Antwortvariablen einen notwendigen Schritt für multivariate Antworten. Der VAR-Befehl schätzt die AR-Modelle mit gewöhnlichen kleinsten Quadraten bei gleichzeitiger Anpassung des Trend-, Intercept - und ARIMA-Modells. Das Argument p 1 fordert eine AR an 1 Struktur und beide passt konstant und trend Mit dem Vektor der Antworten ist es eigentlich ein VAR 1.Following ist die Ausgabe aus dem VAR Befehl für die Variable tempr der Text liefert die Ausgabe für cmort. Die Koeffizienten für eine Variable sind in der Schätzung Spalte Die l1 an jedem Variablen Namen angefügt, dass sie lag 1 Variablen. Using Notation T Temperatur, t Zeit gesammelt wöchentlich, M Mortalität und P Verschmutzung, die Gleichung für die Temperatur ist. Hut t 67 586 - 007 t - 0 244 M 0 487 T - 0 128 P. Die Gleichung für die Sterblichkeitsrate ist. Hut t 73 227 0 014 t 0 465 M - 0 361 T 0 099 P. Die Gleichung für die Verschmutzung ist. Hut t 67 464 - 005 t - 0 125 M - 0 477 T 0 581 P Die Kovarianzmatrix der Residuen aus dem VAR 1 für die drei Variablen wird unterhalb der Schätzergebnisse gedruckt. Die Abweichungen sind diagonal und können eventuell verwendet werden Um dieses Modell mit VARs höherer Ordnung zu vergleichen. Die Determinante dieser Matrix wird bei der Berechnung der BIC-Statistik verwendet, die verwendet werden kann, um die Anpassung des Modells an die Anpassung anderer Modelle zu vergleichen, siehe Formeln 5 89 und 5 90 des Textes. Für weitere Referenzen zu dieser Technik siehe Analyse von integrierten und mitintegrierten Zeitreihen mit R von Pfaff und auch Campbell und Perron 1991. In Beispiel 5 11 auf Seite 307 geben die Autoren Ergebnisse für ein VAR 2-Modell für die Mortalitätsrate an R, können Sie das VAR 2-Modell mit dem Befehl. summary VAR x, p 2 passen, geben Sie beide ein. Die Ausgabe, wie sie vom VAR-Befehl angezeigt wird, ist wie folgt: Die Koeffizienten für eine bestimmte Variable werden in der Spalte Schätzung aufgelistet Als Beispiel ist die geschätzte Gleichung für die Temperatur. Hut t 49 88 - 005 t - 0 109 M 0 261 T 0 051 P - 0 041 M 0 356 T 0 095 P. Wir diskutieren Informationskriterien Statistiken, um VAR Modelle von verschiedenen Aufträgen in den Hausaufgaben zu vergleichen. Residuals sind auch verfügbar für Analyse Wenn wir zum Beispiel den VAR-Befehl einem Objekt mit dem Namen fitvar2 in unserem Programm. fitvar2 VAR x, p 2 zuordnen, geben wir beide ein. Dann haben wir Zugriff auf die Matrixreste fitvar2 Diese Matrix hat drei Spalten, eine Spalte von Resten für Jede Variable. Zum Beispiel könnten wir verwenden, um die ACF der Residuen für die Sterblichkeit nach der Montage der VAR 2-Modell zu sehen. Im Folgenden ist die ACF, die aus dem Befehl gerade beschrieben entstand Es sieht gut aus für eine restliche ACF Die große Spike an der Beginn ist die unwichtige Verzögerung 0 Korrelation. Die folgenden zwei Befehle werden ACFs für die Residuen für die beiden anderen Variablen. Sie ähneln auch weißes Rauschen. Wir können auch untersuchen, diese Plots in der Kreuz-Korrelation Matrix von acf residuals fitvar2.Die Plots Entlang der Diagonale sind die einzelnen ACFs für jedes Modell s Residuen, die wir gerade oben diskutiert haben. Darüber hinaus sehen wir nun die Kreuzkorrelationsdiagramme jedes Satzes von Resten Idealerweise würden diese auch einem weißen Rauschen ähnlich sein, aber wir sehen die verbleibenden Kreuzkorrelationen , Vor allem zwischen Temperatur und Verschmutzung Wie unsere Autoren beachten, dieses Modell nicht adäquat erfassen die komplette Assoziation zwischen diesen Variablen in time. Trend-Stationary Model. Lets erkunden ein Beispiel, wo die ursprünglichen Daten stationär sind und untersuchen die VAR-Code durch die Montage des Modells Oben mit einer Konstante und einem Trend Mit R haben wir n 500 Sample-Werte mit dem VAR 2-Modell simuliert. Mit dem oben beschriebenen VAR-Befehl. Zusammenfassung VAR cbind y1, y2, p 2, geben Sie beide ein. Wir erhalten die folgende Ausgabe. Die Schätzungen sind sehr nah an den simulierten Koeffizienten und der Trend ist nicht signifikant, wie erwartet Für stationäre Daten, wenn detrending unnötig ist, können Sie auch verwenden Der Befehl, um ein VAR-Modell anzupassen. fitvar2 y2, Ordnung 2.In der ersten Matrix gegeben, über eine Zeile lesen, um die Koeffizienten für eine Variable zu erhalten Die vorherigen Kommas gefolgt von 1 oder 2 geben an, ob die Koeffizienten Verzögerung 1 oder Verzögerung 2 Variablen sind Die Abschnitte der Gleichungen werden unter einem Intercept pro Variable gegeben. Die Matrix unter gibt die Varianz-Kovarianz-Matrix der Residuen aus dem VAR 2 für die beiden Variablen Die Varianzen sind die Diagonale und können auch verwendet werden, um dieses Modell zu vergleichen VARs höherer Ordnung wie oben erwähnt. Die Standardfehler der AR-Koeffizienten werden durch den Befehl gegeben. Die Ausgabe ist. Mit den Koeffizienten, die über die Zeilen gelesen werden Die erste Zeile gibt die Standardfehler der Koeffizienten für die Verzögerungs-1-Variablen, die y1 vorhersagen Die zweite Zeile gibt die Standardfehler für die Koeffizienten, die y2 vorhersagen. Sie können feststellen, dass die Koeffizienten in der Nähe des VAR-Befehls sind, mit Ausnahme des Intercept Dies liegt daran, dass das Modell für x-mean x geschätzt wird. Um dem Intercept zu entsprechen, das durch die Zusammenfassung VAR cbind y1 bereitgestellt wird , Y2, p 2, Typ const Befehl, müssen Sie das Intercept wie folgt berechnen. In unserem Beispiel ist der Intercept für das simulierte Modell für yt, 1 gleich-0 043637 -2 733607 1-0 2930 0 4523 15 45479 -0 1913-0 6365 9 580768.und die geschätzte Gleichung für yt, 1.Estimation mit Minitab. For Minitab Benutzer, hier ist der allgemeine Fluss von dem, was zu tun ist. Lesen Sie die Daten in Spalten. Verwenden Sie Zeitreihe Lag, um die notwendigen verzögerten Spalten zu erstellen Der stationären Werte. Use Stat ANOVA Allgemeines MANOVA. Geben Sie die Liste der aktuellen Zeitvariablen als Antwortvariablen ein. Geben Sie die verzögerten x-Variablen als Kovariaten und als Modell ein. Klicken Sie auf Ergebnisse und wählen Sie Univariate Analysis, um die geschätzten Regressionskoeffizienten für jede Gleichung zu sehen. Wenn gewünscht, klicken Sie auf Speicher und wählen Sie Residuals und oder Fits. Es gibt eine Reihe von Ansätzen zur Modellierung Zeitreihen Wir skizzieren ein paar der häufigsten Ansätze unten. Trend, saisonale, restliche Zerlegung. Ein Ansatz ist es, die Zeitreihe in zerlegen Ein Trend, saisonale und restliche Komponente. Triple exponentielle Glättung ist ein Beispiel für diesen Ansatz Ein weiteres Beispiel, genannt saisonale Löss, basiert auf lokal gewichteten kleinsten Quadrate und wird von Cleveland 1993 diskutiert Wir diskutieren nicht saisonalen Löss in diesem Handbuch. Frequenzbasiert Methoden. Ein weiterer Ansatz, der üblicherweise in wissenschaftlichen und technischen Anwendungen eingesetzt wird, besteht darin, die Serie im Frequenzbereich zu analysieren. Ein Beispiel für diesen Ansatz bei der Modellierung eines sinusförmigen Typs Datensatzes wird in der Strahlablenkungsfallstudie gezeigt. Das Spektrale Diagramm ist das primäre Werkzeug für Die Frequenzanalyse der Zeitreihen. Autoregressive AR-Modelle. Ein allgemeiner Ansatz für die Modellierung von univariaten Zeitreihen ist das autoregressive AR-Modell Xt delta phi1 X phi2 X cdots phip X At, wobei Xt die Zeitreihe ist, At ist weißes Rauschen und Delta links 1 - sum p phii rechts mu mit mu, die den Prozessmittel bedeuten. Ein autoregressives Modell ist einfach eine lineare Regression des aktuellen Wertes der Serie gegen einen oder mehrere vorherige Werte der Serie. Der Wert von p heißt die Reihenfolge des AR-Modells. AR-Modelle können mit einer von verschiedenen Methoden analysiert werden, einschließlich Standard-lineare Methoden der kleinsten Quadrate Sie haben auch eine einfache Interpretation. Moving Average MA Models. Another gemeinsamen Ansatz für die Modellierung univariate Zeitreihen Modelle ist die gleitende Durchschnitt MA Modell Xt mu At-theta1 A - theta2 A - cdots - thetaq A, wobei Xt die Zeitreihe ist, mu ist der Mittelwert der Serie, A sind weiße Rauschbegriffe und theta1, ldots, thetaq sind die Parameter des Modells Der Wert von q ist Nannte die Reihenfolge des MA-Modells. Das ist ein gleitendes Mittelmodell ist konzeptionell eine lineare Regression des aktuellen Wertes der Serie gegen das weiße Rauschen oder zufällige Schocks von einem oder mehreren vorherigen Werten der Serie Die zufälligen Schocks an jedem Punkt sind Angenommen von der gleichen Verteilung, typischerweise eine normale Verteilung, mit der Lage bei Null und konstanter Skala Die Unterscheidung in diesem Modell ist, dass diese zufälligen Schocks zu zukünftigen Werten der Zeitreihe propagiert werden. Die Anpassung der MA-Schätzungen ist komplizierter als bei AR-Modellen Da die Fehlerterme nicht beobachtbar sind, bedeutet dies, dass iterative nichtlineare Anpassungsprozesse anstelle von linearen kleinsten Quadraten verwendet werden müssen. MA-Modelle haben auch eine weniger offensichtliche Interpretation als AR-Modelle. Manchmal wird das ACF und PACF vorschlagen, dass ein MA-Modell würde Sei eine bessere Wahl des Modells und manchmal sollten sowohl AR - als auch MA-Begriffe im selben Modell verwendet werden. Siehe Abschnitt 6 4 4 5.Beachten Sie jedoch, dass die Fehlertermine nach dem Modell unabhängig sind und den Standardannahmen für eine Univariate folgen Process. Box und Jenkins popularisierten einen Ansatz, der den gleitenden Durchschnitt und die autoregressiven Ansätze in dem Buch Time Series Analysis Forecasting und Control Box, Jenkins und Reinsel, 1994 kombiniert. Obwohl sowohl autoregressive als auch gleitende durchschnittliche Ansätze bereits bekannt waren und ursprünglich untersucht wurden Yule, der Beitrag von Box und Jenkins war in der Entwicklung einer systematischen Methodik für die Identifizierung und Schätzung von Modellen, die beide Ansätze beinhalten könnte Dies macht Box-Jenkins Modelle eine leistungsfähige Klasse von Modellen Die nächsten paar Abschnitte werden diese Modelle im Detail zu diskutieren.
Comments
Post a Comment