Remodelarea datelor în Stata
adesea, atunci când importați date, datele dvs. vor fi în format larg. Formatul larg este atunci când fiecare persoană ocupă o linie cu toate observațiile lor răspândite pe pagină. Cu toate acestea, modul în care stata rulează anovas cu măsură repetată necesită ca datele să fie în format lung. Formatul lung este atunci când fiecare observație a fiecărei persoane este propria linie. În timp ce acest lucru este extrem de obositor pentru a comuta manual, comanda reshape
face comutarea între formatul larg și lung aproape fără efort. Cel mai bun dintre toate, este complet reversibil.
utilizarea comenzii remodelare necesită câteva lucruri din datele dvs. Primul dintre acestea este că fiecare persoană are un identificator unic, ca un număr de identificare. Dacă datele dvs. nu conțin în prezent un astfel de identificator, puteți adăuga unul arbitrar, deoarece este doar acolo pentru Stata să știe ce puncte de date merg cu care individ. Cel mai simplu mod de a face acest lucru este să tastați generate id= _n
în fereastra de comandă. _n
este modul Stata de a se referi la numerele de linie și astfel această comandă va genera o nouă variabilă numerică care identifică primul caz din setul dvs. de date ca 1 și apoi le numără pe cele care urmează secvențial. Asigurați-vă că ați pus un spațiu între =
și _n
sau comanda nu va funcționa. În plus, în timp ce această comandă va funcționa dacă datele dvs. sunt în format larg, nu va funcționa dacă datele dvs. sunt în format lung; în acest caz, va trebui să introduceți identificatorul manual, astfel încât datele să fie grupate corect.
singurul lucru de care trebuie să fiți conștienți atunci când treceți de la un format de date lung la larg este că mai multe observații trebuie să aibă o schemă de denumire similară. De exemplu, dacă am trei observații despre fericire, aș vrea să aibă nume precum hap1, hap2 și hap3. Această schemă de denumire îi spune lui Stata că sunt observații diferite ale aceleiași variabile. Dacă variabilele dvs. ar fi, de exemplu, hap1, happy2 și hap3, ați rename happy2 hap2
și apoi continuați.
comanda de bază reshape
este urmată de ce direcție long
sau wide
doriți să remodelați datele. Apoi vine variabilele fiind remodelate. Următoarea este prima parte a argumentului i()
urmată de dimensiunea pe care o remodelați pe j( remodelare (manualul oficial de gestionare a datelor Stata) și implică mai multe niveluri de variabile de sortare. Click aici pentru a descărca aceste linii de date pentru a juca cu. Mai jos, sunt datele afișate în cel mai lung format posibil (se va descărca în acest format).
mai jos sunt aceleași date în cel mai larg format posibil:
următoarea diagramă explică modul de comutare între aceste formate diferite, oferind atât o idee bună despre capacitățile complete ale reshape, cât și despre modul de utilizare a acestora. Notă în cazul trecerii de la long-long la wide-wide, sunt necesare mai multe comenzi reshape
.
acest exemplu introduce, de asemenea, două noi opțiuni ale comenzii reshape
. Primul dintre acestea, @
îi spune lui Stata unde să nu mai citească numele unei variabile. Deci, dacă variabila a fost numită inc80 și am vrut ca variabila să fie inc când a schimbat formatele, aș specifica reshape inc@
punând semnul @ înaintea inc, Stata știe să facă inc pentru bărbați minc și inc pentru femei finc, folosind variabila de sex așa cum este specificată în j, f și m. dacă acest lucru nu are sens, jucați-vă cu el câteva minute.
cealaltă opțiune utilă este string
care spune Stata că variabila specificată în j()
este o variabilă șir.
în cele din urmă, rețineți că reshape
este oarecum reversibil. Mai exact, puteți muta înapoi o iterație. De exemplu, dacă tastați reshape long
după ce ați remodelat datele pentru a fi largi, Stata va reveni la date.
înapoi la tutoriale
înapoi la repetate-măsuri ANOVA