Módulo 4: Análisis e Interpretación de Datos

Presentación módulo 4

Ficheros do

Transcripción

En esta lección del módulo cuatro, vamos a ver lo que son los ficheros Do. Hay dos formas de trabajar en Stata, el modelo Interactivo y el modelo Batch.

En el modelo Interactivo, tenemos aquí todo lo que es la pantalla del Stata. Hemos cargado una base de datos, y lo que vemos es que tenemos las cinco ventanas, como hemos comentado siempre, y lo que pasa es que en el modo interactivo trabajamos, donde podemos ver que, le ponemos aquí los comandos y nos sale los resultados en la pantalla.

Sin guardar ningún resultado de ningún comando. En el modelo Batch, lo que nos pasa es que podemos estar grabando las instrucciones y los comandos del Stata, de tal forma que eso nos va a permitir agilizar después, a la hora de poder ejecutar los resultados que queremos ver y analizar los datos. El modelo Batch, trabaja con que se llama Do File.

Esto se hace yendo a la pestaña de Window. Vemos que tenemos el Do Date... el Do File Editor. Y entonces, se nos hace y se nos abre una pantalla. Cuando nosotros hacemos esto, observamos que se nos abre una ventanita adicional con el editor. Esto es pues un fichero, un archivo de código asci, como si fuera de texto.

A continuación, nosotros le podemos decir grabar y entonces nos aparecerá una ventana, como podemos ver, que tendrá el formato Do File. Estos, como he dicho, son archivos que tienen como si fueran de texto, y que los podemos abrir en cualquier editor de texto. Se recomienda utilizar el bloc de notas.

Esto es, por lo tanto, un fichero en el que tenemos, como ejemplo, observamos que, tenemos todas las instrucciones y todos los comandos que utiliza el Stata. ¿Cómo se han ejecutado todas estas instrucciones y comandos? Podemos ver que con la opción de File y Do, entonces abrimos el fichero y irán apareciendo todas las instrucciones y comandos que hemos grabado y hemos generado en nuestra pantalla. Quiero remarcar, como podéis observar, que tenemos, cuando queremos hacer comentarios, se pone un asterisco delante. Por ejemplo ahí tenemos: Esto es un ejemplo de trabajar con un Do File. Edición: el descriptor.

Ponemos aquí el asterisco y vemos que ponemos el comando. Después tendremos: Queremos editar los datos. Y ponemos el comando. Es decir, todo aquello que empecemos la frase con un asterisco, son comentarios que estamos poniendo nosotros en general y, después, todos los comandos se ponen tal cual.

Nosotros podremos ejecutar este fichero a través de File y Do File. Y vemos que en la pantalla de resultados irán apareciendo todas las instrucciones y comandos que hemos introducido en el fichero Do File. Después, lo que haremos es, si el Stata comete un error, entonces él parará del ejecutar el Do File.

Podremos entrar en un editor de texto, cambiar el comando o la instrucción que nos hemos equivocado y volver a reiniciar. Bueno, pues espero que hayáis disfrutado con este... con esta elección. Y nos vemos pronto en las siguientes. Hasta luego.

Ficheros do

1.0 point possible (ungraded)

Reemplazar valores

1.0 point possible (ungraded)

¿Qué comandos podemos utilizar para reemplazar los valores de las variables?

gen, egen, drop

tabulate, replace, egen

recode, replace

Ordenación de datos

Transcripcion

Hola, soy Adela Garcia_Aracil, en esta elección del módulo cuatro vamos a ver lo que son la ordenación de datos. Para ordenar datos en stata hay tres comandos el comando sort el comando wail y el comando orden. Vamos a verlos con detenimiento en esta lección. El comando sort normalmente las bases de datos están ordenadas por algunas variables sino que nos interesa ordenar por una variable en concreto, lo que haré utilizaremos será el comando sort imaginemos, ahi he puesto un ejemplo que queremos ordenar por la variable género y por la variable edad.

Esto se haría poniendo sort tiende a ni entonces lo que hace este comando es estaría ordenando los datos por género dicide entre hombres mujeres y dentro de cada grupo por edades esto se puede hacer con el está ta viendo la opción hay fichero vemos que está la opción sort y nos dice si lo queremos hacer en orden ascendente o descendente lo que queremos ordenar.

Cuando queremos hacer una unión de base de datos el comando sort es muy bueno normalmente queremos unir dos bases de datos siempre tiene que haber una variable al menos una que esté repetidas en ambas bases de datos. Esta variable se suele llamar la variable identificador dentro de nuestro caso de ejemplo, que estamos utilizando la european socail service esta variable se llama idno el identificador de cada uno de los registros.

¿Como se unen dos bases de datos? Pues imaginemos tenemos una base de datos que hemos llamado aquí en el ejemplo dos.dta Stata la llama using data set y lo que hacemos es primero de todo ordenarla por el identificador.

Sería sort id lo que hacemos una vez caso de los datos los es guardarlos, para que la base de datos se guarde ordenada y que después cuando queramos unirla con la base de datos inicial o lo que llama stata master data set. Entonces como ya está ordenada por sort id va a permitir que se haga esa unión en la base de datos.

En la base de datos uno, la master lo que hacemos es lo mismo lo que hacemos es ordenar la por la misma variable que hemos ordenado la anterior y después ya ponemos el comando merge que es unir y fijaros como digo une con el identificador y de usando también decir que con qué base de datos va a utilizar.

La que hemos puesto aquí en el ejemplo con dos.dta

Cuando hacemos la unión de la base de datos entonces lo que nos dice stata nos genera una variable que se llama merge. Entonces esta variable merge tomará los siguientes valores, el valor uno
cuando la observación está sólo en la variable inicial, la que está considerada como master.

Tomará el valor dos cuando la observación está sólo en la using dataset se elegir la que nosotros hemos llamado dos de la segunda base de datos y tomará el valor tres cuando la observaciones están en ambas bases de datos.

Por lo tanto el comando sort nos permite generar ordenar perdón los loros las variables y además
se utiliza mucho cuando hacemos unión de bases de datos. Otro comando que nos permite ordenar las observaciones por grupos, en este caso el comando by si nosotros ponemos el held en la ayuda el by nos dice cómo se hace la sintaxis, y yo aqui os he puesto un ejemplo. Imaginaros que queremos
generar el ejemplo de agrupar el nivel de estudios entre o mostrarlo por hombres y mujeres. Lo que hacemos es primero ordenamos por género y después decimos, por género by gndr muéstrame el nivel educativo y fijaros resultados nos sale para los hombres en nivel educativo y para el grupo de las mujeres su nivel educativo.

De acuerdo esto se hace con el comando by y el último comando que tiene stata para ordenar variables es el comando orden, el comando order lo que hace es que nos ayuda a inspeccionar la base de datos que queremos que tenga otra apariencia. Vemos que las variables de datos suelen tener perdón, la base de datos suele tener muchas variables y hay algunas que miras utilizamos porque no nos interesa para el problema o proyecto investigación que estamos haciendo.

Y lo que nos interesa es ver las primeras que son las que más estamos utilizando por ejemplo nosotros que es en los ejemplos que ha sido poniendo estamos utilizando más la variable país, la variable género, la variable educación, el estado civil. Entonces yo puedo decir al stata ordename las variables por este orden y entonces el stata nos mostrará la información como nosotros hemos indicado. Primero veremos la variable el identificador luego el país, de su género así, etcétera, etcétera, etcétera.

El comando help nos da también una visión de cómo se utiliza este comando que podemos utilizar perfectamente y las ventajas. Y fijaros para el ejemplo que os he puesto como cuando yo hago el edit que nos muestre los datos como si estuviéramos en una hoja de excel primero nos muestra la columna que identificador el país, la variable género, etcétera, etcétera, como nosotros hemos sido mostrando.

Pues bueno estos son los tres comandos que se utiliza en stata para la ordenación de datos. El order, el by, el sort, espero que os haya sido de utilidad y cualquier sugerencia me podéis encontrar en los foros. Gracias.

Ordenación de datos

1.0 point possible (ungraded)

¿Qué comando nos permitiría ver las variables ordenadas de una base de datos como a nosotros mejor nos acomode?

replace

order

recode

Tratamiento missing values

Presentación módulo 4

Ficheros do

Transcripción

Ficheros do

Ficheros log

Intrucciones

Ficheros log

Comando "generate"

Transcripción

Comando "generate"

Comando "egen"

Transcripcion

Comando "egen"

Reemplazar valores

Reemplazar valores

Ordenación de datos

Transcripcion

Ordenación de datos

Tratamiento missing values

Transcripcion

Tratamiento missing values

Examen unidad 4

problem

problem

problem

problem