Reed College

muokkaa tietojasi Statassa

usein tietoja tuotaessa tietosi ovat laajassa muodossa. Laaja muoto on, kun jokainen henkilö ottaa yhden rivin kaikki havainnot leviävät sivulle. Statan tapa suorittaa toistomitta ANOVAs vaatii kuitenkin, että tiedot ovat pitkässä muodossa. Pitkä formaatti on, kun jokaisen ihmisen jokainen havainto on oma repliikkinsä. Vaikka tämä on äärettömän työlästä vaihtaa käsin, reshape – komento tekee vaihtamisesta leveän ja pitkän formaatin välillä lähes vaivatonta. Mikä parasta, se on täysin palautettavissa.

reshape-komennon käyttäminen vaatii tietojasi muutaman asian. Ensimmäinen niistä on se, että jokaisella henkilöllä on yksilöllinen tunniste, kuten henkilötunnus. Jos tietosi eivät tällä hetkellä sisällä tällaista tunnistetta, voit lisätä siihen mielivaltaisen tunnisteen, koska vain Stata voi tietää, mitkä tietopisteet menevät mihinkin yksilöön. Helpoin tapa tehdä tämä on kirjoittaa generate id= _n komentoikkunaan. _n on Statan tapa viitata rivinumeroihin, joten tämä komento luo uuden numeerisen muuttujan, joka tunnistaa tietojoukkosi ensimmäisen tapauksen numeroksi 1 ja sen jälkeen numeroiksi ne, jotka seuraavat peräkkäin. Laita väli =: n ja _n: n väliin tai komento ei toimi. Lisäksi vaikka tämä komento toimii, jos tietosi ovat laajassa muodossa, se ei toimi, jos tietosi ovat pitkässä muodossa; tässä tapauksessa sinun on syötettävä tunniste manuaalisesti, jotta tiedot on ryhmitelty oikein.

ainoa toinen asia, joka tulee huomioida siirryttäessä pitkästä tietomuodosta laajaan, on se, että useilla havainnoilla on oltava samanlainen nimeämiskaava. Jos minulla on esimerkiksi kolme onnellisuushavaintoa, haluaisin niille nimet kuten hap1, hap2 ja hap3. Tämä nimeämiskaava kertoo Statalle, että ne ovat saman muuttujan eri havaintoja. Jos muuttujasi olisivat esimerkiksi hap1, happy2 ja hap3, olisit rename happy2 hap2 ja jatkaisit sitten.

peruskäskyä reshape seuraa, mihin suuntaan long tai wide haluat muokata tietoja. Sitten muuttujia muokataan uudelleen. Seuraavaksi on argumentin i() alkuosa, jota seuraa muuttuja j: ssä (reshape (virallinen Statan tiedonhallinnan käsikirja) ja johon liittyy useita eri tasoja lajittelevia muuttujia. Klikkaa tästä ladataksesi nämä tietorivit, joilla voit pelata. Alla, on tiedot näytetään pisin mahdollinen muoto (se lataa tässä muodossa).

alla samat tiedot mahdollisimman laajassa muodossa:

seuraavassa kaaviossa selitetään, miten vaihtaa näiden eri formaattien välillä, antaen molemmille hyvän käsityksen reshapen kaikista ominaisuuksista ja kuinka niitä käytetään. Huomaa, jos siirrytään pitkäpitkästä leveäksi, tarvitaan useita reshape käskyjä.

tässä esimerkissä esitellään myös kaksi uutta reshape – komennon vaihtoehtoa. Näistä ensimmäinen, @ kertoo Statalle, mistä muuttujan nimen lukeminen kannattaa lopettaa. Joten jos muuttujan nimeksi tuli inc80, ja halusin muuttujan olevan inc, kun se vaihtoi formaattia, määrittelisin reshape inc@ laittamalla @ – merkin ennen inc: tä, Stata osaa tehdä Inc: n miehille minc: n ja INC: n naisille finc: n käyttäen sukupuolimuuttujaa J: n, f: n ja m: n mukaisesti. jos tässä ei ole järkeä, leikittele sillä muutama minuutti.

toinen hyödyllinen vaihtoehto on string, joka kertoo Statalle, että j() määritelty muuttuja on merkkijonomuuttuja.

huomaa lopuksi, että reshape on jossain määrin reversiibeli. Erityisesti, voit siirtyä taaksepäin yhden iteraation. Jos esimerkiksi kirjoitat reshape long sen jälkeen, kun olet muokannut tiedot leveiksi, Stata palauttaa tiedot.

Back To Tutorials
Back to remained-Measures ANOVA

You might also like

Vastaa

Sähköpostiosoitettasi ei julkaista.