Reed College

Umformen Ihrer Daten in Stata

Beim Importieren von Daten liegen Ihre Daten häufig im Breitformat vor. Großformat ist, wenn jede Person eine Zeile mit all ihren Beobachtungen aufnimmt, die sich über die Seite verteilen. Die Art und Weise, wie Stata ANOVAs mit wiederholten Messungen ausführt, erfordert jedoch, dass die Daten im Long-Format vorliegen. Langes Format ist, wenn jede Beobachtung jeder Person eine eigene Linie ist. Während das manuelle Umschalten immens mühsam ist, macht der Befehl reshape das Umschalten zwischen Breit- und Langformat nahezu mühelos. Das Beste ist, es ist vollständig reversibel.

Die Verwendung des Befehls reshape erfordert einige Dinge Ihrer Daten. Die erste davon ist, dass jede Person eine eindeutige Kennung hat, wie eine ID-Nummer. Wenn Ihre Daten derzeit keinen solchen Bezeichner enthalten, können Sie einen beliebigen hinzufügen, da Stata nur weiß, welche Datenpunkte zu welcher Person gehören. Der einfachste Weg, dies zu tun, besteht darin, generate id= _n in das Befehlsfenster einzugeben. _n ist Statas Methode, sich auf die Zeilennummern zu beziehen, und daher generiert dieser Befehl eine neue numerische Variable, die den ersten Fall in Ihrem Datensatz als 1 identifiziert und dann die folgenden nacheinander nummeriert. Stellen Sie sicher, dass Sie zwischen = und _n ein Leerzeichen setzen, da sonst der Befehl nicht funktioniert. Während dieser Befehl funktioniert, wenn Ihre Daten im Breitformat vorliegen, funktioniert er nicht, wenn Ihre Daten im Langformat vorliegen. In diesem Fall müssen Sie den Bezeichner manuell eingeben, damit die Daten ordnungsgemäß gruppiert werden.

Die einzige andere Sache, die beim Wechsel von einem langen zu einem breiten Datenformat beachtet werden muss, ist, dass mehrere Beobachtungen ein ähnliches Benennungsschema haben müssen. Wenn ich zum Beispiel drei Glücksbeobachtungen habe, möchte ich, dass sie Namen wie hap1, hap2 und hap3 haben. Dieses Benennungsschema teilt Stata mit, dass es sich um unterschiedliche Beobachtungen derselben Variablen handelt. Wenn Ihre Variablen beispielsweise hap1 , happy2 und hap3 wären, würden Sie rename happy2 hap2 und dann fortfahren.

Auf den Basisbefehl reshape folgt, in welche Richtung long oder wide die Daten umgeformt werden sollen. Dann werden die Variablen umgestaltet. Als nächstes folgt der erste Teil des Arguments i() gefolgt von der Dimension, die Sie auf j umformen (reshape (das offizielle Stata-Datenverwaltungshandbuch) und umfasst mehrere Ebenen von Sortiervariablen. Klicken Sie hier, um diese Datenzeilen zum Spielen herunterzuladen. Unten werden die Daten im längstmöglichen Format angezeigt (es wird in diesem Format heruntergeladen).

Unten finden Sie die gleichen Daten im größtmöglichen Format:

In der folgenden Tabelle wird erläutert, wie Sie zwischen diesen verschiedenen Formaten wechseln können, um sowohl eine gute Vorstellung von den vollen Funktionen von Reshape als auch von deren Verwendung zu erhalten. Hinweis Beim Übergang von long-long zu wide-wide sind mehrere reshape -Befehle erforderlich.

In diesem Beispiel werden auch zwei neue Optionen des Befehls reshape eingeführt. Die erste davon, @ , teilt Stata mit, wo der Name einer Variablen nicht mehr gelesen werden soll. Wenn also die Variable inc80 heißen würde und ich wollte, dass die Variable inc ist, wenn sie das Format wechselt, würde ich reshape inc@ angeben, indem ich das @ -Zeichen vor inc setze. Stata weiß, dass inc für Männer minc und inc für Frauen finc verwendet wird die Sex-Variable wie in j, f und m angegeben.

Die andere nützliche Option ist string, die Stata mitteilt, dass die in j() angegebene Variable eine Zeichenfolgenvariable ist.

Beachten Sie schließlich, dass reshape etwas reversibel ist. Insbesondere können Sie eine Iteration zurückbewegen. Wenn Sie beispielsweise reshape long eingeben, nachdem Sie die Daten so umgestaltet haben, dass sie breit sind, setzt Stata die Daten zurück.

Zurück zu Tutorials
Zurück zu Wiederholungs-ANOVA

You might also like

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.