uw gegevens opnieuw vormgeven in Stata
bij het importeren van gegevens worden uw gegevens vaak in grootformaat weergegeven. Wide format is wanneer elke persoon neemt een regel met al hun waarnemingen verspreiden over de pagina. Echter, de manier waarop Stata loopt herhaalde-maatregel ANOVAs vereist dat de gegevens in lang formaat. Lang formaat is wanneer elke waarneming van elke persoon zijn eigen lijn is. Hoewel dit ontzettend vervelend is om met de hand te schakelen, maakt het reshape
Commando het schakelen tussen breed en lang formaat bijna moeiteloos. Het beste van alles, het is volledig omkeerbaar.
het gebruik van het reshape commando vereist een paar dingen van uw gegevens. De eerste is dat elke persoon een unieke identificatiecode heeft, zoals een ID-nummer. Als uw gegevens op dit moment geen dergelijke identificatie bevatten, kunt u een willekeurige toevoegen omdat het er alleen voor Stata is om te weten welke gegevenspunten bij welk individu horen. De makkelijkste manier om dit te doen is door generate id= _n
in het opdrachtvenster te typen. _n
is Stata ‘ s manier om te verwijzen naar de regelnummers en dus zal dit commando een nieuwe numerieke variabele genereren die het eerste geval in uw gegevensset identificeert als 1 en dan de getallen die achtereenvolgens volgen. Zorg ervoor dat je een spatie plaatst tussen de =
en de _n
, anders zal het commando niet werken. Bovendien, terwijl dit commando zal werken als uw gegevens in groot formaat is het zal niet werken als uw gegevens in lang formaat; in dit geval moet u de identifier handmatig in te voeren, zodat de gegevens goed zijn gegroepeerd.
bij het overschakelen van een lang naar een breed gegevensformaat is het enige andere ding om op te letten dat meerdere waarnemingen een vergelijkbaar naamgevingsschema moeten hebben. Bijvoorbeeld, als ik drie geluk observaties zou ik willen dat ze namen als hap1, hap2 en hap3. Dit naamgevingsschema vertelt Stata dat het verschillende waarnemingen van dezelfde variabele zijn. Als uw variabelen bijvoorbeeld hap1, happy2 en hap3 waren, zou u rename happy2 hap2
gaan en dan verder gaan.
het basiscommando reshape
wordt gevolgd door welke richting long
of wide
u de gegevens opnieuw wilt vormgeven. Dan komen de variabelen die veranderd worden. Vervolgens is het eerste deel van het argument i()
gevolgd door de dimensie die u opnieuw vormgeeft op j (reshape (de officiële Stata Data Management manual) en waarbij meerdere niveaus van sorteervariabelen betrokken zijn. Klik hier om deze regels met gegevens te downloaden om mee te spelen. Hieronder worden de gegevens weergegeven in het langst mogelijke formaat (het zal in dit formaat downloaden).
hieronder vindt u dezelfde gegevens in het breedst mogelijke formaat:
de volgende grafiek legt uit hoe te schakelen tussen deze verschillende formaten, het geven van zowel een goed idee van de volledige mogelijkheden van reshape en hoe ze te gebruiken. Opmerking in gevallen waarin van long-long naar wide-wide wordt gegaan, zijn meerdere reshape
commando ‘ s nodig.
dit voorbeeld introduceert ook twee nieuwe opties van het reshape
Commando. De eerste van deze, de @
vertelt Stata waar te stoppen met het lezen van de naam van een variabele. Dus als de variabele inc80 heette, en ik wilde dat de variabele inc was als hij van formaat wisselde, zou ik reshape inc@
specificeren door het @ teken voor inc te zetten, Stata Weet inc te maken voor mannen minc en inc voor vrouwen finc, met behulp van de geslachtsvariabele zoals gespecificeerd in j, de f en m. als dit niet logisch is, speel er dan een paar minuten mee.
de andere nuttige optie is string
die Stata vertelt dat de variabele gespecificeerd in j()
een string variabele is.
ten slotte is reshape
enigszins omkeerbaar. Specifiek, kunt u een iteratie terug te verplaatsen. Als u bijvoorbeeld reshape long
intypt nadat u de gegevens hebt aangepast om breed te zijn, zal Stata de gegevens herstellen.
terug naar Tutorials
terug naar herhaalde maatregelen