reformulando seus dados em Stata
muitas vezes quando importar dados, seus dados serão em formato amplo. Formato largo é quando cada pessoa assume uma linha com todas as suas observações espalhando-se por toda a página. No entanto, a forma como o Stata executa a medida repetida ANOVAs exige que os dados sejam em formato longo. Formato longo é quando cada observação de cada pessoa é sua própria linha. Embora isto seja imensamente tedioso de mudar manualmente, o comando reshape
faz com que a mudança entre Formato largo e longo seja quase sem esforço. O melhor de tudo, é completamente reversível.O uso do comando de remodelação requer algumas coisas dos seus dados. O primeiro é que cada pessoa tem um identificador único, como um número de identificação. Se os seus dados não contêm de momento esse identificador, você pode adicionar um arbitrário, uma vez que ele só está lá para o Stata para saber quais pontos de dados vão com que indivíduo. A maneira mais fácil de fazer isso é digitar generate id= _n
na janela de comandos. _n
é a forma de Stata se referir aos números de linha e assim este comando irá gerar uma nova variável numérica que identifica o primeiro caso em seu conjunto de dados como 1 e, em seguida, números aqueles que seguem sequencialmente. Certifique-se de colocar um espaço entre o =
e o _n
ou o comando não irá funcionar. Além disso, enquanto este comando irá funcionar se os seus dados estiverem em formato amplo, não irá funcionar se os seus dados estiverem em formato longo; neste caso, você vai precisar digitar o identificador manualmente para que os dados sejam agrupados corretamente.
a única outra coisa a ter em conta quando se muda de um formato de dados Longo para amplo é que múltiplas observações precisam ter um esquema de nomenclatura semelhante. Por exemplo, se eu tiver três observações de felicidade Eu gostaria que eles tivessem nomes como hap1, hap2 e hap3. Este esquema de nomenclatura diz a Stata que eles são observações diferentes da mesma variável. Se as suas variáveis fossem, por exemplo, hap1, happy2 e hap3, você iria rename happy2 hap2
e, em seguida, prosseguir.
o comando básico reshape
é seguido por qual direção long
ou wide
você quer remodelar os dados. Depois vêm as variáveis a ser reformuladas. Segue-se a primeira parte do argumento i()
seguida da dimensão que está a remodelar em j( remodelação (o manual oficial de gestão de dados Stata) e envolve múltiplos níveis de variáveis de ordenação. Clique aqui para baixar estas linhas de dados para brincar. Abaixo, estão os dados exibidos no formato mais longo possível (ele irá baixar neste formato).
abaixo estão os mesmos dados no formato mais amplo possível:
o gráfico seguinte explica como alternar entre esses vários formatos, dando uma boa ideia das capacidades completas da remodelação e como usá-los. Nota em casos de ir de longo-longo para amplo, múltiplos comandos reshape
são necessários.
este exemplo também introduz duas novas opções do comando reshape
. O primeiro destes, o @
diz a Stata onde parar de ler o nome de uma variável. Assim, se a variável foi nomeado inc80, e eu queria que a variável inc quando ele trocou formatos, gostaria de especificar reshape inc@
colocando o sinal @ antes inc, Stata sabe fazer inc para os homens minc e os aumentos para as fêmeas finc, usando o sexo como variável especificada em j, f e m. Se isso não faz sentido, brincar com ele por alguns minutos.
a outra opção útil é string
o que diz ao Stata que a variável especificada em j()
é uma variável de cadeia de caracteres.
Finalmente, note que reshape
é um pouco reversível. Especificamente, podes recuar uma iteração. Por exemplo, se você digitar reshape long
depois de ter remodelado os dados para ser amplo, o Stata irá reverter os dados.De volta aos tutoriais de volta às medidas repetidas ANOVA