Reed College

az adatok átalakítása Stata-ban

gyakran adatok importálásakor az adatok széles formátumban lesznek. A széles formátum az, amikor minden ember egy sort vesz fel, az összes megfigyelése az oldalon terjed. A Stata ismételt mérésű Anovák futtatásának módja azonban megköveteli, hogy az adatok hosszú formátumúak legyenek. A hosszú formátum az, amikor minden ember megfigyelése a saját vonala. Bár ez rendkívül unalmas kézzel váltani, a reshape parancs szinte könnyűvé teszi a széles és a hosszú formátum közötti váltást. A legjobb az egészben, hogy teljesen visszafordítható.

a reshape parancs használata néhány dolgot igényel az adatokból. Ezek közül az első az, hogy minden személynek egyedi azonosítója van, például egy azonosító szám. Ha az Ön adatai jelenleg nem tartalmaznak ilyen azonosítót, tetszőleges azonosítót adhat hozzá, mivel csak a Stata tudja, hogy mely adatpontok melyik egyénhez tartoznak. Ennek legegyszerűbb módja a generate id= _n beírása a parancsablakba. _n a Stata módja a sorszámokra való hivatkozásnak, így ez a parancs egy új numerikus változót generál, amely az adatkészlet első esetét 1-ként azonosítja, majd számozza azokat, amelyek egymás után következnek. Ügyeljen arra, hogy a = és a _n közé tegyen szóközt, különben a parancs nem fog működni. Továbbá, míg ez a parancs akkor működik, ha az adatok széles formátumban vannak, akkor nem fog működni, ha az adatok hosszú formátumban vannak; ebben az esetben manuálisan kell megadnia az azonosítót, hogy az adatok megfelelően csoportosuljanak.

az egyetlen dolog, amit figyelembe kell venni a hosszú adatformátumról a széles adatformátumra való váltáskor, az, hogy több megfigyelésnek hasonló elnevezési sémával kell rendelkeznie. Például, ha három boldogságmegfigyelésem van, szeretném, ha olyan nevük lenne, mint hap1, hap2 és hap3. Ez az elnevezési séma azt mondja a Stata – nak, hogy ugyanazon változó különböző megfigyelései. Ha a változók például hap1, happy2 és hap3 lennének, akkor rename happy2 hap2 – et használnánk, majd folytatnánk.

a reshape alapparancsot követi, hogy melyik long vagy wide irányba szeretné átformálni az adatokat. Ezután jön a változók átalakítása. A következő a i() argumentum első része, amelyet a j-n átformált dimenzió követ( reshape (a hivatalos Stata Adatkezelési kézikönyv), és több szintű rendezési változót tartalmaz. Kattintson ide, hogy töltse le ezeket a sorokat az adatok játszani. Az alábbiakban az adatok a lehető leghosszabb formátumban jelennek meg (ebben a formátumban töltődnek le).

az alábbiakban ugyanazok az adatok találhatók a lehető legszélesebb formátumban:

az alábbi táblázat elmagyarázza, hogyan lehet váltani a különböző formátumok között, jó ötletet adva a reshape teljes képességeiről, valamint azok használatáról. Megjegyzés abban az esetben, ha hosszú-hosszúról szélesre vált, több reshape parancsra van szükség.

ez a példa a reshape parancs két új opcióját is bemutatja. Ezek közül az első, a @ megmondja a Stata-nak, hogy hol hagyja abba a változó nevének olvasását. Tehát, ha a változót inc80-nak nevezték el, és azt akartam, hogy a változó inc legyen, amikor formátumot vált, akkor a reshape inc@ – et úgy határoznám meg, hogy a @ jelet az inc elé helyezem, a Stata tudja, hogy az inc-t a férfiaknál minc-re, a nőstényeknél pedig finc-re kell tenni, a J, az f és m. ha ennek nincs értelme, játsszon vele néhány percig.

a másik hasznos lehetőség a string, amely megmondja a Stata-nak, hogy a j() – ben megadott változó egy string változó.

Végül vegye figyelembe, hogy a reshape némileg visszafordítható. Pontosabban, egy iterációval visszaléphet. Ha például a reshape long parancsot írja be, miután az adatokat szélesre alakította, a Stata visszaállítja az adatokat.

vissza az oktatóanyagokhoz
vissza az ismételt mérésekhez ANOVA

You might also like

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.