Ich habe Panel-Daten, die amerikanische Staaten (1-48) und Jahre (1900-1917) enthält. Alle Variablen sind zeitveränderlich mit einer Ausnahme. Diese Ausnahme ist zeitinvariante und eine dreistufige kategorische Variable, die regionale Bezeichnungen für die mit zwei Dummy-Variablen getesteten Staaten misst. Ich möchte auch Interaktionen zwischen einem der Dummies und einigen der zeitvariablen Variablen betrachten. OLS-Schätzungen dieses Modells zeigen Heterosedastizität an. Also bei der Organisation der Daten meine Frage ist, welche der Panel-Techniken ist am besten und warum ich bin mit Stata. Danke, RB fragte Jan 3 14 um 15:41 Ich würde sagen, es hängt von den Daten ab. Aber es gibt einige allgemeine Vorstellungen über Modellspezifikation. Fixed-Effekt-Methode ist konsistent und sollte daher verwendet werden, um Subjekt-Level-Confounder zu kontrollieren. Wenn es keine Subjekt-Level-Confounder gibt, ist die Zufalls-Effekt-Methode effizient, um korrelierte Fehler zu berücksichtigen. OLS vs. feste Effekte. F-Test der gemeinsamen Bedeutung der Fixed-Effects-Abschnitte. Die Nullhypothese ist, dass alle festen Effektabschnitte null sind. Wenn die Null abgelehnt wird, dann müssen wir feste Effekte verwenden. Der F-Test wird automatisch durchgeführt, wenn wir xtreg in Stata laufen lassen. Es erscheint am unteren Rand der Regressionsausgabe. Fixed vs. zufällige Effekte: Hausman Test. Die Nullhypothese ist, dass sich die Steigungskoeffizienten der beiden verglichenen Modelle nicht wesentlich unterscheiden. Wenn die Schätzungen unterschiedlich sind, dann lehnen wir Romie-Effekte ab und müssen feste Effekte verwenden, sonst verwenden wir die effizientere Methode der Zufallseffekte. Es gibt einen Befehl Hausmann in Stata. Antwortete Jan 3 14 um 16:10 Ich denke, die Falten ist die zeitinvariante Variable (3 Stufen, 2 Dummies), die mit Aggregationen der Querschnittsdaten (Zustände) erzeugt wird. Also, wenn ich das Fixeffektmodell in Stata laufe, fallen die beiden Dummies aus. Ist die Lösung, um die beiden Dummies fallen und schauen Sie sich nur die einzelnen Staaten, die diese beiden Dummies enthalten. Vielen Dank, RB ndash Benutzer36830 Jan 3 14 um 16:28 Sie haben Recht, user36830. Im Allgemeinen kann die Fixed-Effects-Methode nicht zeitlich-invariante Kovariaten verarbeiten, aber das aktuelle Papier kann von Interesse sein. Wenn Sie sich wirklich für die Effekte von zeitinvarianten Kovariaten interessieren, können Sie sich der Methode der zufälligen Effekte zuwenden. Es gibt auch ein anderes Längsplan-Datenmodell, das als Populations-Durchschnitts - (oder Randmodelle) bezeichnet wird (z. B. verallgemeinerte Schätzgleichungsmodelle), verglichen mit fachspezifischen Modellen. Siehe meine klärung hier Ndash Jiebiao Wang Jan 3 14 at 16: 49Stata: Datenanalyse und statistische Software Dynamische Panel-Daten (DPD) - Analyse Stata verfügt über eine Reihe von Tools für die dynamische Panel-Datenanalyse: xtabond implementiert den Arellano - und Bond-Schätzer, der Moment-Bedingungen verwendet Verzögerungen der abhängigen Variablen und erste Differenzen der exogenen Variablen sind Instrumente für die erste differenzierte Gleichung. Xtdpdsys implementiert den Arellano - und BoverBlundell - und Bond-System-Schätzer, der die xtabond-Moment-Bedingungen und Moment-Bedingungen verwendet, bei denen die verzögerten ersten Differenzen der abhängigen Variablen Instrumente für die Pegelgleichung sind. Xtdpd Für fortgeschrittene Benutzer, ist eine flexiblere Alternative, die Modelle mit niedrigwertigen gleitendurchschnittlichen Korrelationen in den idiosynkratischen Fehlern und vorgegebenen Variablen mit einer komplizierteren Struktur passen kann, als mit xtabond und xtdpdsys erlaubt ist. Mit den Postestimationswerkzeugen können Sie in den ersten differenzierten Resten die serielle Korrelation testen und die Gültigkeit der Überkennungsbeschränkungen prüfen. Aufbauend auf der Arbeit von Layard und Nickell (1986), Arellano und Bond (1991) passen ein dynamisches Modell der Arbeitsnachfrage zu einem unausgewogenen Panel von Firmen im Vereinigten Königreich. Zuerst modellieren wir Beschäftigung auf Löhne, Kapitalstock, Industrieproduktion, Jahrespuppen und einen Zeittrend, einschließlich einer Verzögerung der Beschäftigung und zwei Lohn der Löhne und des Grundkapitals. Wir werden den einstufigen ArellanondashBond Schätzer verwenden und ihre robuste VCE anfordern: Weil wir eine Verzögerung von n in unserem Regressionsmodell aufgenommen haben, verwendet xtabond 2 und zurück als Instrumente. Unterschiede der exogenen Variablen dienen auch als Instrumente. Hier setzen wir unser Modell um, indem wir stattdessen xtdpdsys verwenden, damit wir die ArellanondashBoverBlundellndashBond-Schätzungen erhalten können: Beim Vergleich der Fußzeilen der beiden Commandrsquo-Ausgabe wird der Schlüsselunterschied zwischen den beiden Schätzern verglichen. Xtdpdsys enthalten die verzögerten Unterschiede von n als Instrumente in der Level-Gleichung xtabond nicht. Die Momentbedingungen dieser GMM-Schätzer sind nur gültig, wenn es keine serielle Korrelation in den idiosynkratischen Fehlern gibt. Weil der erste Unterschied des weißen Rauschens notwendigerweise autokorreliert ist, brauchen wir uns nur mit einer zweiten und höheren Autokorrelation zu beschäftigen. Wir können estat abond verwenden, um auf Autokorrelation zu testen: Referenzen Arellano, M. und S. Bond. 1991. Einige Tests der Spezifikation für Panel-Daten: Monte Carlo Beweise und eine Anwendung auf Beschäftigungsgleichungen. Die Überprüfung der ökonometrischen Studien 58: 277ndash297. Layard, R. und S. J. Nickell. 1986. Arbeitslosigkeit in Großbritannien. Economica 53: 5121ndash5169.Stata: Datenanalyse und statistische Software Nicholas J. Cox, Durham University, Großbritannien Christopher Baum, Boston College egen, ma () und seine Einschränkungen Statarsquos am offensichtlichsten Befehl für die Berechnung der gleitenden Mittelwerte ist die ma () - Funktion von egen . Angesichts eines Ausdrucks, schafft es einen - periodischen gleitenden Durchschnitt dieses Ausdrucks. Standardmäßig wird als 3. ungerade genommen. Jedoch kann, wie der manuelle Eintrag anzeigt, egen, ma () nicht mit varlist kombiniert werden:. Und aus diesem Grund allein gilt es nicht für Paneldaten. In jedem Fall steht es außerhalb des Satzes von Befehlen, die speziell für Zeitreihen geschrieben sind, siehe Zeitreihen für Details. Alternative Ansätze Um berechnende Durchschnitte für Panel-Daten zu berechnen, gibt es mindestens zwei Möglichkeiten. Beide hängen davon ab, dass der Datensatz vorher gesendet wurde. Das lohnt sich nicht nur: Sie können sich nicht nur wiederholt spezifizieren, um die Variable und die Zeitvariable zu bestimmen, aber Stata verhält sich scharf zwischen den Lücken. 1. Schreiben Sie Ihre eigene Definition mit generieren Verwenden Sie Zeitreihenoperatoren wie L. und F.. Geben Sie die Definition des gleitenden Durchschnitts als Argument einer generierten Anweisung an. Wenn Sie dies tun, sind Sie natürlich nicht auf die gleichgewichteten (ungewichteten) zentrierten gleitenden Durchschnitte, die von egen, ma () berechnet wurden, beschränkt. Zum Beispiel werden gleichgewichtete dreiseitige gleitende Durchschnitte gegeben und manche Gewichte können leicht angegeben werden: Sie können natürlich auch einen Ausdruck wie log (myvar) anstelle eines Variablennamens wie myvar angeben. Ein großer Vorteil dieses Ansatzes ist, dass Stata automatisch die richtige Sache für Panel-Daten macht: führende und nacheilende Werte werden in Panels ausgearbeitet, genauso wie Logik diktiert sie sein sollte. Der bemerkenswerteste Nachteil ist, dass die Kommandozeile ziemlich lang werden kann, wenn der gleitende Durchschnitt mehrere Begriffe beinhaltet. Ein weiteres Beispiel ist ein einseitiger gleitender Durchschnitt, der nur auf vorherigen Werten basiert. Dies könnte nützlich sein, um eine adaptive Erwartung zu schaffen, was eine Variable nur auf Informationen aktuell basiert: Was könnte jemand prognostizieren für die aktuelle Periode auf der Grundlage der letzten vier Werte, mit einem festen Gewichtung Schema (eine 4-Periode Verzögerung könnte sein Besonders häufig mit vierteljährlichen Zeiträumen verwendet.) 2. Verwenden Sie egen, filter () aus SSC Verwenden Sie den benutzerdefinierten egen-Funktionsfilter () aus dem egenmore-Paket auf SSC. In Stata 7 (aktualisiert nach dem 14. November 2001) können Sie dieses Paket installieren, nach welcher Hilfe egenmore auf Details zu filter () verweist. Die beiden obigen Beispiele würden gerendert (in diesem Vergleich ist der Generatoransatz vielleicht transparenter, aber wir sehen ein Beispiel für das Gegenteil in einem Moment.) Die Lags sind eine Numlist. Führt zu negativen Verzögerungen: In diesem Fall -11 dehnt sich auf -1 0 1 oder Blei 1, lag 0, lag 1. Die Coef ficients, eine andere numlist, multiplizieren die entsprechenden hinteren oder führenden Elemente: In diesem Fall sind diese Elemente F1.myvar . Myvar und L1.myvar Die Wirkung der Normalisierungsoption besteht darin, jeden Koeffizienten durch die Summe der Koeffizienten so zu skalieren, daß Coef (1 1 1) normalisiert ist, äquivalent zu Koeffizienten von 13 13 13 und Coef (1 2 1) Normalisierung äquivalent zu Koeffizienten von 14 12 14 ist Sie müssen nicht nur die Verzögerungen angeben, sondern auch die Koeffizienten. Weil egen, ma () den gleich gewichteten Fall liefert, ist die Hauptgrundlage für egen, filter (), den ungleich gewichteten Fall zu unterstützen, für den Sie Koeffizienten angeben müssen. Es könnte auch gesagt werden, dass die Verpflichtung der Benutzer, Koeffizienten anzugeben, ein wenig zusätzlicher Druck auf sie ist, darüber nachzudenken, welche Koeffizienten sie wollen. Die Hauptberechtigung für gleiche Gewichte ist, wir vermuten, Einfachheit, aber gleiche Gewichte haben lausige Frequenzdomäneneigenschaften, um nur eine Betrachtung zu erwähnen. Das dritte Beispiel oben könnte entweder so genauso kompliziert sein wie der generierte Ansatz. Es gibt Fälle, in denen egen, filter () gibt eine einfachere Formulierung als zu generieren. Wenn Sie einen neunfristigen Binomialfilter wünschen, welche Klimatologen nützlich sind, dann sieht es vielleicht weniger schrecklich aus als und einfacher, sich richtig zu machen, genauso wie bei der generierten Annäherung egen, filter () funktioniert ordnungsgemäß mit Panel-Daten. In der Tat, wie oben erwähnt, hängt es davon ab, dass der Datensatz vorher gesendet wurde. Eine grafische Spitze Nach der Berechnung Ihrer gleitenden Durchschnitte, werden Sie wahrscheinlich wollen, um einen Graphen zu betrachten. Der benutzerdefinierte Befehl tsgraph ist schlau über Tattendatensätze. Installiere es in einem up-to-date Stata 7 von ssc inst tsgraph. Was ist mit der Abrechnung, wenn keines der obigen Beispiele von Einschränkungen Gebrauch macht. Tatsächlich wird es nicht möglich sein, Gelegentlich Menschen wollen, wenn bei der Berechnung der gleitenden Durchschnitte zu verwenden, aber seine Verwendung ist ein wenig komplizierter als es in der Regel ist. Was würden Sie von einem gleitenden Durchschnitt erwarten, mit dem berechnet. Lassen Sie uns zwei Möglichkeiten identifizieren: Schwache Interpretation: Ich möchte keine Ergebnisse für die ausgeschlossenen Beobachtungen sehen. Starke Interpretation: Ich möchte gar nicht, dass du die Werte für die ausgeschlossenen Beobachtungen nimmst. Hier ist ein konkretes Beispiel. Angenommen, als Folge von einigen, wenn Bedingung, sind Beobachtungen 1-42 enthalten, aber nicht Beobachtungen 43 auf. Aber der gleitende Durchschnitt für 42 hängt unter anderem von dem Wert für die Beobachtung ab, wenn der Durchschnitt sich rückwärts und vorwärts erstreckt und mindestens 3 beträgt, und es wird in einigen Fällen auch von einigen der Beobachtungen abhängen. Unsere Vermutung ist, dass die meisten Leute für die schwache Interpretation gehen würden, aber ob das richtig ist, egen, filter () nicht, wenn entweder. Sie können immer ignorieren, was Sie donrsquot wollen oder sogar unerwünschte Werte festlegen, um danach zu fehlen, indem Sie ersetzen. Ein Hinweis auf fehlende Ergebnisse an den Enden der Serie Weil gleitende Mittelwerte Funktionen von Verzögerungen und Leads sind, erzeugt egen, ma () fehlt, wo die Verzögerungen und Leads nicht existieren, am Anfang und am Ende der Serie. Eine Option nomiss zwingt die Berechnung von kürzeren, nicht beeinträchtigten gleitenden Durchschnitten für die Schwänze. Im Gegensatz dazu weder generieren noch egen, filter () tut, oder erlaubt, etwas Besonderes, um fehlende Ergebnisse zu vermeiden. Wenn einer der für die Berechnung benötigten Werte fehlt, fehlt dieses Ergebnis. Es liegt an den Anwendern, zu entscheiden, ob und welche Korrekturchirurgie für solche Beobachtungen erforderlich ist, vermutlich nach dem Betrachten des Datensatzes und unter Berücksichtigung einer zugrunde liegenden Wissenschaft, die zu tragen ist.
No comments:
Post a Comment