Reed College

Omforming Av Dataene Dine I Stata

ofte når du importerer data, vil dataene dine være i bredt format. Wide format er når hver person tar opp en linje med alle sine observasjoner sprer seg over siden. Men Måten Stata kjører gjentatte mål ANOVAs krever at dataene skal være i lang format. Langt format er når hver observasjon av hver person er sin egen linje. Selv om dette er utrolig kjedelig å bytte for hånd, gjør kommandoen reshape bytte mellom bredt og langt format nesten uanstrengt. Best av alt, det er helt reversibelt.

Bruk av kommandoen omforme krever et par ting av dataene dine. Den første av disse er at hver person har en unik identifikator, som ET ID-nummer. Hvis dataene dine for øyeblikket ikke inneholder en slik identifikator, kan Du legge til en vilkårlig, siden Det bare Er Der For Stata å vite hvilke datapunkter som går med hvilken person. Den enkleste måten å gjøre dette på er å skrive generate id= _n inn I Kommandovinduet. _n Er Statas måte å referere til linjenumrene på, og denne kommandoen vil derfor generere en ny numerisk variabel som identifiserer det første tilfellet i datasettet som 1 og deretter nummererer de som følger sekvensielt. Pass på at du legger et mellomrom mellom = og _n eller kommandoen vil ikke fungere. I tillegg, mens denne kommandoen vil fungere hvis dataene dine er i bredt format, vil det ikke fungere hvis dataene dine er i langt format; i dette tilfellet må du skrive inn identifikatoren manuelt slik at dataene grupperes riktig.

den eneste andre tingen å være oppmerksom på når du bytter fra et langt til bredt dataformat, er at flere observasjoner må ha en lignende navngivningsordning. For eksempel, hvis jeg har tre lykkeobservasjoner, vil jeg at de skal ha navn som hap1, hap2 og hap3. Denne navneordningen forteller Stata at De er forskjellige observasjoner av samme variabel. Hvis variablene dine for eksempel var hap1, happy2 og hap3, ville du rename happy2 hap2 og deretter fortsette.

den grunnleggende kommandoen reshape etterfølges av hvilken retning long eller wide du vil omforme dataene. Deretter kommer variablene til å bli omformet. Neste er den første delen av argumentet i() etterfulgt av dimensjonen du omformer på j (omforme (den offisielle stata Data Management manual) og innebærer flere nivåer av sorteringsvariabler. Klikk her for å laste ned disse linjene med data å spille med. Nedenfor vises dataene i lengst mulig format (det lastes ned i dette formatet).

Nedenfor er de samme dataene i bredest mulig format:

følgende diagram forklarer hvordan du bytter mellom disse ulike formatene, noe som gir både en god ide om omformes fulle evner og hvordan du bruker dem. Merk i tilfeller av å gå fra lang lang til bred, er det nødvendig med flere kommandoer reshape.

dette eksemplet introduserer også to nye alternativer for kommandoen reshape. Den første av disse, @ forteller Stata hvor Du skal slutte å lese navnet på en variabel. Så Hvis variabelen ble kalt inc80, og jeg ønsket at variabelen skulle være inc når den byttet formater, ville jeg spesifisere reshape inc@ ved å sette @ – tegnet før inc, Stata vet å lage inc for menn minc og inc for kvinner finc, ved hjelp av sexvariabelen som angitt i j, f og m.Hvis dette ikke gir mening, lek med det i noen minutter.

det andre nyttige alternativet er string som forteller Stata at variabelen angitt i j() er en strengvariabel.

til Slutt, merk at reshape er noe reversibel. Spesielt kan du flytte tilbake en iterasjon. Hvis du for eksempel skriver inn reshape long etter at du har omformet dataene til å være brede, vil Stata tilbakestille dataene.

Tilbake Til Opplæringsprogrammer
Tilbake Til Gjentatte Tiltak ANOVA

You might also like

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.