Remodelación de sus datos en Stata
A menudo, al importar datos, sus datos estarán en formato amplio. El formato ancho es cuando cada persona toma una línea con todas sus observaciones extendidas por la página. Sin embargo, la forma en que Stata ejecuta ANOVAs de medida repetida requiere que los datos estén en formato largo. El formato largo es cuando cada observación de cada persona es su propia línea. Si bien es inmensamente tedioso cambiar a mano, el comando reshape
hace que cambiar entre formato ancho y largo sea casi fácil. Lo mejor de todo es que es completamente reversible.
El uso del comando remodelar requiere algunas cosas de sus datos. El primero de ellos es que cada persona tiene un identificador único, como un número de identificación. Si sus datos no contienen actualmente dicho identificador, puede agregar uno arbitrario, ya que solo está ahí para que Stata sepa qué puntos de datos van con qué individuo. La forma más fácil de hacerlo es escribir generate id= _n
en la ventana de comandos. _n
es la forma de Stata de referirse a los números de línea, por lo que este comando generará una nueva variable numérica que identifica el primer caso en su conjunto de datos como 1 y luego numera los que siguen secuencialmente. Asegúrese de colocar un espacio entre =
y _n
o el comando no funcionará. Además, si bien este comando funcionará si sus datos están en formato ancho, no funcionará si sus datos están en formato largo; en este caso, deberá ingresar el identificador manualmente para que los datos se agrupen correctamente.
La única otra cosa a tener en cuenta al cambiar de un formato de datos largo a ancho es que las observaciones múltiples deben tener un esquema de nombres similar. Por ejemplo, si tengo tres observaciones de felicidad, me gustaría que tuvieran nombres como hap1, hap2 y hap3. Este esquema de nombres le dice a Stata que son observaciones diferentes de la misma variable. Si sus variables fueran, por ejemplo, hap1, happy2 y hap3, debería rename happy2 hap2
y luego continuar.
El comando básico reshape
va seguido de la dirección long
o wide
en la que desea cambiar la forma de los datos. Luego vienen las variables que se están reformulando. A continuación está la primera parte del argumento i()
, seguida de la dimensión que está remodelando en j( reshape (el manual oficial de Administración de Datos de Stata) e implica varios niveles de variables de ordenación. Haga clic aquí para descargar estas líneas de datos para jugar. A continuación, se muestran los datos en el formato más largo posible (se descargará en este formato).
A continuación se muestran los mismos datos en el formato más amplio posible:
La siguiente tabla explica cómo cambiar entre estos diversos formatos, dando una buena idea de las capacidades completas de reshape y cómo usarlas. Nota en los casos de pasar de largo-largo a ancho-ancho, se necesitan múltiples comandos reshape
.
Este ejemplo también presenta dos nuevas opciones del comando reshape
. El primero de ellos, @
le dice a Stata dónde dejar de leer el nombre de una variable. Así que si la variable se llamaba inc80, y quería que la variable fuera inc cuando cambiara de formato, especificaría reshape inc@
Poniendo el signo @ antes de inc, Stata sabe hacer inc para los hombres minc e inc para las mujeres finc, usando la variable sex como se especifica en j, f y m. Si esto no tiene sentido, juegue con ella durante unos minutos.
La otra opción útil es string
, que indica a Stata que la variable especificada en j()
es una variable de cadena.
Finalmente, tenga en cuenta que reshape
es algo reversible. Específicamente, puedes retroceder una iteración. Por ejemplo, si escribe reshape long
después de haber remodelado los datos para que sean amplios, Stata revertirá los datos.
Volver a Tutoriales
Volver a ANOVA de Medidas repetidas