Presentación módulo 2


Transcripción
Hola, soy Adela García Aracil. Voy a ser la responsable del módulo dos
del manejo de paquetes estadísticos.
En este módulo vamos a ver qué son y para qué se utilizan los paquetes
estadísticos, como el SPSS, el R. Haremos comparaciones con
las hojas de cálculo, como la hoja de cálculo de excel.
Haremos una lectura de base de datos utilizando específicamente
el programa estadístico Stata.
Continuaremos profundizando un poco con los comandos descriptivos
de este programa estadístico para, después, poder realizar
síntesis de información, tanto en forma de tablas, como gráficos.
Y, finalmente, mostraremos una breve introducción
de los estadísticos más sofistic... sofisticados o avanzados
que realiza el Stata. Entonces, con todo esto, espero que en...
disfruten de este módulo y les veo pronto. Gracias.



¿Qué son los paquetes estadísticos?


Transcripción

Hola, soy Adela García Aracil, estoy aquí para explicaros la lección que versa sobre los paquetes estadísticos.

Los paquetes estadísticos son programas informáticos que han sido diseñados para el análisis estadístico de datos. Tratan de aglutinar rutinas matemáticas que fueron pensadas, inicialmente, para ser utilizados desde lenguajes de programación como el Fortran y el C. Este conjunto de rutinas y subprogramas, se fueron perfeccionando con el tiempo, empezaron a funcionar de forma conjunta y, cada vez, ha sido más completos y, por lo tanto, permiten proporcionar más información; que es importante para los analistas, que sois vosotros mismos.

En... si pretendeis hacer un estudio, por ejemplo de... de qué depende el nivel salarial, pues podemos hacer que dependa de... pues sí el nivel educativo influye o no al salario.

Podemos hacer una representación gráfica, o hacer predicciones, o establecer hipótesis... Pues todas estas rutinas, se pueden hacer y se aglutinan, y forman, lo que se llama, los paquetes estadísticos. La evolución fue que, al principio, fueron diseñados para servidores grandes. Después, ya a media que fue incrementando la potencia de los ordenadores personales, pues entonces, ya existe una versión correspondiente para los PC's. Emm... Es difícil saber qué paquete estadístico es el más adecuado, porque, en algunos de ellos, hay que saber lenguaje de programación.

Y en cambio, para otros, se ha hecho más fácil su manejo porque se ha añadido una interfaz de usuario. Las ventajas es que, gracias a que tienen muchas... rapidez en la procesación de información, pues en tiempo muy corto hacemos muchas tareas.

La dificultad es que, tenemos tantos resultados que, a lo mejor, podemos obtener resultados contradictorios. Por lo tanto, el usuario tiene que estar... saber qué es lo que está haciendo. Y, como hemos comentado... he comentado antes, anteriormente, hay que tener, a veces, algún breve conocimiento sobre el lenguaje de programación para poder realizar los diferentes análisis.

De paquetes estadísticos tenemos tanto, para analizar datos cuantitativos, como para analizar datos cualitativos. Cuantitativos tenemos como el SPSS, el SAS, el Minitab, el R... Y para analizar datos cualitativos tenemos el Aquad, el Atlas.ti y el MaxQda entre otros.

¿Cuál escoger? Pues es difícil esta tarea, pero algunas veces nos marca pues el precio. Si nos fijamos en el costo, vemos que hay algunas versiones que son libres, de distribución, no tenemos que pagar licencia. En otras existen lo que es... ni más ni menos que... como dijéramos... el diseño del estudiante.

A veces tenemos que tener un mínimo de conocimiento requerido para poder utilizarlo. También tenemos, si nos fijamos, qué cantidad de volumen de datos pueden procesar, la facilidad de programación, entre otras. Si, os pongo aquí, como ejemplo, el SPSS que es muy utilizado en las ciencias sociales y en las empresas.

Permite administrar bases de datos de manera eficiente, hacer proyecciones... Está muy bien y es fácil de navegar a través de él. Sin embargo, a veces está mostrando un nivel excesivo de información, lo que puede confundirnos a vosotros. Aquí os muestro un poco, como es la interfaz del SPSS.

Por supuesto, el link para que veáis como poder acceder al software. También tenemos otro paquete estadístico que os muestro, como es el BMDP que cubre un amplio abanico de métodos estadísticos,
pero tiene un inconveniente que, para manejar datos, su capacidad es un poco limitada. Pero lo que tiene de... de a favor es que, al menos, los programas que estás ejecutando por separado, pueden ser beneficiosos para la entrada de otro programa que queramos hacer. Aquí tenéis también los links correspondientes para poder realizar la búsqueda de dicho software en las páginas web. El R es de fácil manejo.

Por lo menos, tiene libre acceso, el software es gratuito. Aunque, para algunos, es difícil su interpretación y su programación, porque tienen que saber un poco de lenguaje de programación. Veis aquí, en esta transparencia que os puesto, cuál sería el marco en el cuadro que sale cuando uno está con el R. Y en la parte inferior podéis observar, aquí, que es donde se establecen las instrucciones, ese lenguaje de programación que, los resultados, se ofrecen y se muestran en esta parte superior.

Y, finalmente, como otro ejemplo, os pongo el... el paquete estadístico que analiza datos cualitativos, que es como el Atlas.ti, que lo que permite es procesar la información... pues analizando los textos en pasajes y en citas, anotar comentarios o anotaciones, codificando... Es como si tuviéramos nosotros un papel y un lápiz de color, y fuéramos ahí estableciendo comentarios. Aquí veis, por ejemplo en este caso que os he puesto, cómo se dicen palabras que pueden aparecer en el texto, como citas, cuántas veces aparecen... Y esto, lo que nos permite, un análisis cualitativo del texto.

Otros software que os pongo, otros ejemplos, tanto para analizar datos cuantitativos como cualitativos. Y lo dicho, estoy a vuestra disposición en el foro del curso. Y muchas gracias.

¿Qué son los paquetes estadísticos?

1.0 point possible (ungraded)
¿Qué paquete estadístico se utilizaría para realizar investigación cualitativa?

Hojas de cálculo



Traductor
Hola, soy Adela García Aracil. En esta edición vamos a ver lo que son las hojas de cálculo. Una hoja de cálculo es una aplicación, a través de la cual, se puede manipular los datos agrupados en forma de tablas. Pueden ser, tanto datos numéricos, como alfanuméricos o de caracteres. En las tablas vemos que es un documento compuesto por filas y por columnas. Y, en la intersección de ambos, es lo que se llama y se conoce como celda. Normalmente, las operaciones que se utilizan en las hojas de cálculo, se realiza entre celdas.

Originalmente, las hojas de cálculo se crearon para manejar datos financieros, aunque, actualmente, se utilizan realizar tareas como administrar presupuestos, gestionar bases de datos, incluso hacer análisis estadísticos... Por eso, lo hemos puesto dentro de este programa para que podemos... vosotros podéis comparar entre, sí utilizar paquetes estadísticos, como hemos visto en la lección anterior; o una hoja de cálculo.

También se pueden realizar representaciones gráficas, como sectores... gráfica de sectores, histogramas, curvas... Las hojas de cálculo más conocidas, tenemos el Microsoft Excel, el StarOffice, el OpenCalc, Lotus 1 2 3, el Corel Quattro y el Kspread, entre otros.

Permítanme que os muestre, pues un poco, la apariencia que tiene las hojas de Excel. Si vemos, por ejemplo, la de StarOffice. También tenemos aquí el Kspread. Es decir, si nos damos cuenta, todas ellas tienen, más o menos, un formato parecido. Centrándonos, por ejemplo, en la hoja de excel, vemos que éste tiene una serie de funciones, que son las que nos permite hacer operaciones. Por ejemplo, si queremos realizar sumas, pues podemos, perfectamente, como veis aquí, cómo podemos decir, sumas desde dentro de una misma columna en diferentes celdas. Podemos también realizar sumas de celdas esparcidas, o realizar promedios y otras operaciones. Excel también permite hacer gráficos. Si observáis, tenemos ahí una opción, dentro de la hoja de excel, que nos permita hacer gráficos. Hay una ventana desplegable que nos permite elegir qué tipo de gráfico queremos ejecutar. 

Asimismo, excel también nos permite hacer estadística descriptiva, nos permite, de una manera simple, obtener resultados a través de las tablas, o también de gráficos, y esto lo podéis obtener, si os fijáis en la pestaña de arriba, hay una en la parte de herramientas; se abrirá una opción que será: análisis de datos. Y esto nos permite hacer la estadística descriptiva básica.

Os pongo aquí, como una... un ejemplo, donde veis aquí que tenemos un rango de entrada, que se pone qué celdas son las que queremos analizar. Y un rango de salida o, incluso, lo podemos hacer
que los datos salgan en una hoja nueva. Esto, alomejor puede ser que no lo tengais instalado en vuestra versión de excel, pero muchas operaciones se pueden obtener en la parte superior.

Tenéis la opción insertar y, dentro de insertar, tenéis funciones. Entonces se insertan funciones estadísticas. Asimismo, excel nos permite realizar, pues ejercicios de econometría. La econometría entendida como la aplicación de técnicas matemáticas y estadísticas a la economía, en unos tipos de problemas de análisis de datos, el desarrollo y la prueba de teorías y modelos. Es decir, lo que se plantea, es un modelo. 

Sabemos que hay una variable que depende de otra y, entonces, lo que hacemos es definir una función. A veces, no es necesario que este modelo esté bien definido, bien especificado, porque a veces no sabemos, si desconocemos, de qué depende una variable. ¿Qué relación vemos? Vemos relación, por ejemplo, entre distintas variables como: pues si el consumo que yo realizo depende de mi ingreso, o si el empleo que yo tengo depende del nivel de estudios o de la edad que yo tengo, si soy hombre o mujer... Son diferentes relaciones que se ven entre las variables. Excel permite hacer
tres principales usos de la econometría, como es la medición de parámetros, la prueba de hipótesis y la predicción.

Centrándonos en el primero, en la medición de parámetros, que es lo que llamamos estimación de modelos, podemos hacer diferentes análisis de regresión.

Lo que hacemos es que tenemos una variable dependiente, en este caso, la hemos llamado Y, y la tratamos de explicar por diferentes variables independientes, como tenemos aquí y que serían las X. Los modelos de regresión se pueden agrupar de diferentes formas  y clasificarlas. Nosotros lo podemos agrupar como modelos lineales y no lineales. Los lineales, tal como podemos observar, son aquellos donde la variable explicada, y que es la dependiente, depende de una combinación lineal de variables explicativas.

En cambio, los no lineales observamos que alguna de las variables independientes está no lineal, como podéis observar aquí, cómo está elevado al cuadrado. Y eso afectaría a la linealidad de las otras variables explicativas. Asimismo, se podemos obtener modelos de regresión simple, que es donde una... la variable explicativa, es una solamente, o modelos de regresión múltiple, donde vemos que pueden existir diferentes variables explicativas que afectan a la variable dependiente. Esto lo tenéis en la hoja de excel, en la pestaña de análisis de datos y, dentro de ella, la opción represión. Os pongo aqui un ejemplo donde podéis ver los resultados cómo saldrían. Perdón porque he pasado demasiado aprisa.

Cómo saldrian los resultados dentro de los... de la hoja de excel cuando hacemos análisis de regresión. Otras veces, lo que podemos hacer es, en vez de hacer la regresión con su información, hacer gráfico. Los gráficos, a veces, son muy intuitivos. Ya lo dicen: más vale una imagen que mil palabras. Esto lo tenemos entonces, en la pestaña del asistente de gráficos, dentro de la hoja de excel.

Y, por ejemplo, aquí os pongo otro ejemplillo también, donde vemos que se hace una regresión y esto está dentro de gráficos X Y de Scatter. Es decir, excel es una hoja, en este caso de cálculo, muy completa que nos permite hacer diferentes datos... diferentes análisis, tantos estadísticos descriptivos, como modelos de regresión y gráficos, que nos permiten analizar la información. Es una alternativa a los paquetes estadísticos que hemos visto anteriormente. Pues lo dicho, estoy con vosotros en el foro para cualquier consulta o duda. Y muchas gracias.

Hojas de cálculo

1.0 point possible (ungraded)
¿Qué función de la hoja de cálculo EXCEL utilizarías para calcular la media de un rango de datos?


Lectura de Bases de Datos I



Transcripción

Hola, soy Adela García Aracil. En esta lección os voy a explicar qué es la lectura de base de datos a través de un paquete estadístico.

Las bases de datos es un conjunto de datos, donde se pone, en un mismo contexto, se almacena mucha información para, después, poder utilizarla. Actualmente, la mayoría de las bases de datos están en formato digital y permiten un amplio rango de almacenamiento de datos. Se han creado, lo que se llama, los sistemas gestores de base de datos, que son programas que permiten almacenar los datos para, posteriormente, poder acceder a ellos de forma rápida y estructurada. Estos sistemas gestores de base de datos, lo que permiten son añadir, borrar, modificar y analizar los datos.

Y, lo que se hace, es que te permiten acceder de forma simple a dichos datos. Podemos... los datos, a medida que se han ido evolucionando las bases de datos, se han utilizado diferentes lenguajes de
moderación. Estos pueden ser jerárquicos, en red, relacionales, multidimensionales, de objeto... entre otros.

Lo que vemos es que, para poder acceder a las bases datos, necesitamos lenguajes de consulta. Que nos permiten interrogar a la base de datos. Podemos analizar los datos, pero no siempre todos los usuarios tienen el privilegio de poder actualizar datos. Es decir, si tenemos un... por ejemplo, una base de datos en una empresa sobre las personas, los trabajadores, pues algunos de ellos podrán ver sus datos personales, pero no, por ejemplo, las nóminas. Es decir se crearán claves de acceso o partes de las bases de datos estarán restringidas.

Como existen muchos paquetes estadísticos, como hemos visto hasta ahora, y cada uno de ellos, vemos, que trata la información de forma diferente. Hay un software que se llama el Stat Transfer
que, lo que nos permite, es... digeramos... exportar, importar datos y dar diseños de diferentes formatos de las bases de datos, acorde al paquete estadístico que queramos utilizar. Os he puesto... aquí tenéis, lo podéis ver, el... aquí en la transparencia, el link para poder acceder al Stat Transfer.

Esto lo que nos hace, como podéis comprobar aquí en la... en la en la pantalla, es, tenemos aquí... observamos que te dice: el fichero de entrada qué formato tiene. Pues podemos observar que puede ser en código access, o puede ser una excel o puede ser, por ejemplo, en MathLab.

Y, después, buscamos el fichero y le decimos qué salida, qué formato de salida, queremos que tenga el otro... la otra base de datos. La queremos transformar en Stata, o la queremos transformar en SPSS... a lo que queramos. Esto es mucho más fácil. Es verdad que los mismos paquetes estadísticos te permiten exportar o importar datos pero, que sepáis, que existe el Stat Transfer, que nos permite hacer esto con mucha más facilidad y ahorrarnos hacerlo manualmente.

Si nosotros nos centramos en lo que es, en el paquete estadístico Stata, podemos observar que cuando abrimos de Stata, diferenciamos y encontramos cinco ventanas diferentes. Déjadme mostrar en esta transparencia, como veis aquí, y os subrayo que tenéis aquí, pues 1, 2, 3, 4, y 5 ventanas. Podemos observar, en una ventana primera de aquí, en la número uno, es donde salen los comandos que hemos ido introduciendo. En la número dos nos dan los resultados.

En la número tres aparecen todas las variables que podemos tener en la base de datos. En la cuatro es donde escribimos nosotros los comandos e indicamos qué queremos hacer. Y la cinco nos describe, un poco, lo que es las variables que tenemos en la... en la ventana número tres. Esto lo podemos ver a través, por ejemplo, voy a haceros un ejemplillo, con el Stata que tengo yo aquí instalado en el ordenador. Observamos, por ejemplo, que si yo quiero abrir una base de datos, aquí tenemos el Stata y, vemos las cinco ventanas como se ha comentado, y le digo yo: abrir. Por ejemplo, abrir la base de datos.

Y entonces, efectivamente como podéis comprobar, tenemos aquí las variables. Aquí tenemos los comandos que estamos poniendo. Aquí tenemos, por ejemplo, las propiedades de cada una de las variables. Y, por ejemplo, si yo le digo esto aquí, que lo vamos a ver después, veo que me salen muchas variables al respecto. El Stata es el programa estadístico con el que nos vamos a centrar y vamos a hacer ejercicios, a lo largo del programa... del curso del MOOC, por el acceso y el manejo que... que nos facilita muchos análisis estadísticos.

Además, vamos a avanzar. Lo que quiero indicaros, para lo que es un paso previo del Stata, es tal como estábamos viendo anteriormente, que tenemos aquí en la parte superior del Stata, unos iconos que nos permiten hacer las diferentes operaciones de abrir una base de datos o guardar. Vemos que también podemos hacer, esto de aquí que veis es el log, es donde se pueden guardar los resultados. 

Imaginaros que yo le digo: muéstrame, por ejemplo... Perdonad que aquí cortelo que estaba haciendo. Si yo le digo: muéstrame, por ejemplo, la variable ciudad. La véis aquí. Hago doble clic y me aparece aquí abajo, ¿veis? la de ciudad. Le doy a intro y me aparece aquí una tabla con todos los datos de las ciudades que contiene esta base de datos en cuestión.

En particular, son treinta países. Si yo estos resultados, dices: Bueno, ¿qué hago con los resultados? ¿Copio y pego? Hay una opción dentro de stata que se llama: los ficheros log. Estos ficheros, los veis aquí, se abrió en otra pestañita.

En vez de SCM, le voy a decir que me lo haga en log. Voy a llamarle prueba, por ejemplo. Le doy a guardan. De tal forma que, si yo le digo otra vez lo mismo que he dicho antes. Puedo hacer perfectamente hacia atrás y me sale...Perdonad, a ver... ahí está. Me sale ahí. Yo, si después voy, como veis, al excel, busco donde he guardado en cuestión el fichero.

Le he llamado prueba log. Y ahí me sale, como veis, los resultados de lo que estábamos trabajando. Bueno, pues que sepáis que tenemos diferentes iconos dentro de la parte superior del... del Stata, que nos permite, pues tanto abrir, cerrar y poder manejar todas las las bases de datos. En los... en las próximas lecciones, vamos a trabajar un poco más con Stata.
Pues lo dicho, quedo a vuestra disposición, en los foros del curso me podéis encontrar. Y muchas gracias. Hasta pronto.

Lectura de Bases de Datos I

1.0 point possible (ungraded)
¿Para qué utilizaríamos un do-file en Stata?

Lectura de Bases de Datos II. Comandos Descriptivos

 Transcripción

Hola, soy Adela García Aracil. Aquí estoy de nuevo como vosotros. En esta lección vamos a ver la lectura de base de datos un poco más ampliada. Anteriormente, lo que vimos en el Stata era cómo se abría la base de datos. Continuamos con el Stata y lo que vamos a ver, son diferentes comandos. Entre ellos, destacamos los más básicos. Que es la descripción de los datos, el describe, el codebook, el edit y el list. Estos comandos básicos nos permiten observar la información que contiene la base de datos.

El describe, lo que hace es mostrar la información de todas las variables tal como se encuentra. ¿Qué nos ofrece? Nos ofrece el nombre de la variable, el tipo de almacenamiento de la variable, el formato y, cómo si si... y si se ha definido, perdón, alguna etiqueta para la variable. Asimismo, muestra el número de observaciones, el número de variables y el tamaño de la base de datos.

Aunque aquí yo os he puesto una pantalla apegada. Dejadme mostraros esto en el en modo real, volvemos, otra vez, aquí a mostrar el Stata, como habíamos hecho antes, habíamos abierto una base de datos. En concreto he abierto la base de datos de la European Social Survey, que esta es accesible en la página web. La podéis... acceder vosotros también.

Y entonces, lo que vamos a ver es, qué tipo de información contiene esta base de datos. Si nosotros le ponemos aquí describe, pero que también es lo mismo que poner desc. A ver si... vamos allá.

Que es el abreviado. Observamos, como os estaba comentando, fijaos aquí arriba. Tenemos el número de observaciones que tiene la base de datos, 54000. El número de variables, 626. Y el tamaño de la base de datos. A continuación, nos aparece un listado con todas las variables, su formato y, como os estaba diciendo, si está definida una etiqueta o no. Veréis que, a veces, en la pantalla de resultados del Stata no aparece todo. Fijaros como aquí aparece more. Le damos a la barra de espacio y nos va apareciendo más variables porque, en total, hemos dicho que tiene unas 600 y pico de variables. Si queremos detener esto porque ya estamos aburridos de tanta... ver este listado.

Fijaros aquí que tenemos un circuito rojito. Hacemos clic y lo que hacemos es detener la ejecución del comando. Esto que hemos hecho, simplemente tecleando aquí abajo, poniendo desc, como hemos puesto en la ventana de comandos.

Lo podemos hacer igual, lléndonos a la ventanita de aquí arriba, vemos que pone: Data, Describe data. Y entonces ponemos Describe data in memory or in a file. Y le decimos Ok. Y observaremos cómo nos sale otra vez el tamaño de la base de datos, el número de variables y otra vez la descripción de todas las variables. Por otra parte, tenemos, además del Describe, el Codebook. Si nosotros avanzamos, vamos a hacer aquí. Esto es lo mismo que os he puesto antes.

El Codebook es otra forma de obtener información. También presenta la formación indicando si la variable tiene definida una etiqueta, el formato, el rango de datos, la forma de codificación y el número de observaciones que no tienen dato para una variable. Lo que se llaman los missing values. Aunque de nuevo, aquí os he puesto, para que lo tengáis en la presentación, diferentes pantallazos de lo que hace el Codebook en lo que es en tiempo real. Vamos a volver otra vez al escritorio.

Y os presento, aquí, en la ventana de comandos pondremos simplemente codebook. Le damos a intro y fijaros como tenemos la misma información, por ejemplo, la variable país, que ya la hemos visto antes. A ver... donde la tenemos... la tenemos por aquí. ¡Ya me he pasado! Pues, o cualquier variable, podemos ver que tenemos aquí los rangos de cómo va, los ejemplos, cómo está codificada la variable y tenemos aquí, en este caso, valores missing, es decir, cero, no hay ninguno de el total de toda la base de datos que tenemos.

Esto asimismo, lo podemos ver también a través de la opción de aquí arriba de Data. Vemos el Describe... perdón. Nos vamos hacia abajo y tenemos ahí el Codebook que, en estos momentos, la verdad sea dicha, es que no lo veo. Pero no lo veo por aquí. ¡Aquí está! Fijaros, ahí está, esque está en pequeñito. Perdonad por el tamaño, ¿vale? Ahí lo tenemos, el Codebook, ¿de acuerdo? Bien, y otra forma de ver la información de las... de la base de datos es, otra vez, de la opción Edit. Edit nos permite ver la información como si fuera pues una hoja excel, ni más ni menos.

Si lo vemos, volvemos aquí, donde estábamos antes, pues yo pongo la palabra edit en la ventana de comandos, así, le doy a intro y fijaros como se abre otra ventana y ahí ya tenemos ya toda la información. Vamos, y fijaros como es por columnas y por... y por filas, tal como lo teníamos. Pero se nos ha abierto otra ventana, ¿de acuerdo? Que cerramos.

Y finalmente, tenemos lo que es la opción List. Esto, aquí os lo he puesto para que veáis diferentes. Y la List, lo que hace es... es igual... similar edit. Pero a lo mejor estamos acostumbrados, en vez de ver la información en una hoja de... de como si fuera una hoja de cálculo, pues nos gusta verlo más así en tipo cuadradito. Entonces, para no hacerlo porque el List si que le cuesta un poco más mostrar información.

Os enseño pues el pantallazo que... que puesto y fijaros como la información está así, en forma de cuadraditos para cada uno de los registros. Y bueno, pues esto es la fff... los comandos más básicos del Stata para poder visualizar lo que es la información que contiene una base de datos. Tanto el Describe, el Codebook, como el Edit y como List. Pues lo dicho, cualquier consulta me podéis encontrar en el foro del MOOC. Muchas gracias.

Lectura de Bases de Datos II. Comandos Descriptivos

1.0 point possible (ungraded)
¿Cuál es el comando que se utilizaría en Stata para mostrar la información de todas las variables de la base de datos?

Síntesis de información en forma de tablas

Transcripción

Hola, soy Adela García Aracil. Aquí estoy de nuevo. Vamos a continuar con el Stata. Hasta ahora, hemos visto la lectura de base de datos. Y, lo que vamos a hacer ahora, es mostrar la información, primero de todo, vamos a hacerla en forma de tablas. Para ello, el Stata tiene dos comandos: Uno que es el Sum, de... de lo que es hacer el summarize.

Y el tabulate, que es el Tab. Vamos a verlos. El sumarize, el comando Sum, lo que permite es mostrar las estadísticas básicas de las variables. Nos muestra el número de observaciones, el promedio, la desviación estándar... así como los valores mínimos y máximos. Todas estas estadísticas, nos las permite... mostrar, tanto para una variable o para todas las variables.

Aquí os he puesto un pantallazo, pero vamos a hacerlo porque siempre esto parece como que... la vida real es más bonita. Volvemos al escritorio, donde tenemos el... el... el programa Stata abierto con nuestra base de datos de la European Social Survey. Y nosotros ponemos aquí, bajo la ventana de comando. Ponemos sum, así tal cual. No ponemos ningún nombre variable ni nada. Y nos... observamos cómo van apareciendo las variables con la descripción de cada una de ellas.

Otra vez, como hay muchas variables, fijaros como aquí tenemos la opción de More para que, si queremos ver más, pues seguimos viendo, seguimos viendo o decimos, ya hemos visto lo que queríamos. Si queremos ver, por ejemplo, el resumen o las estadísticos descriptivos básicos de una variable. Por ejemplo, de la variable em... ci... em... ciudad, que hemos dicho antes.

O de la variable educación, ya que la tenemos aquí a mano, la tenemos aquí. Pues uno dice: bueno, pues la variable educación. Aquí vemos las observaciones para una de ellas: la media. Y es una variable que va de 1 a 99. Ese noventa y nueve está diciendo que hay valores missing values y, normalmente, los missing values están codificados con el número 9 o con el 99, según dependiendo de el rango de valores que adquiera la variable.

Bueno, esto que hemos hecho con el Sum, lo podemos hacer también aquí arriba donde vemos que tenemos los datos. Nos permite hacer también, perdón ahí, de escribir Data. Y, fijaros como aquí tenemos summary statistics. Nos haría exactamente lo mismo por ventanitas. Que no hay... no hace falta aprenderse el comando.

Bien, por otra parte, también tenemos, como hemos comentado al principio, lo que es el Tabulate. El Tabulate nos permite también mostrar información en forma de tabla. Aquí lo tenéis en grande, por ejemplo, para una sola variable, como hemos dicho, la variable género, pues en este caso va de 1 a 9 también.

Uno era para hombres, cero... dos para mujeres. El nueve es los missing values. Pues fijaros como abajo tenemos, en esta parte de aquí, los valores mostrados para la... con la opción tabla. Vemos que tenemos los valores de hombres, mujeres y el no answer. Esta... los missing values es lo que está codificado con valor 9. ¿De acuerdo? El... la opción Tabulate nos permite hacer pues mostrar información de forma diferente.

Como podemos ver, las observaciones totales, incluso nos permite ver los porcentajes de cada una de las categorías que representa la... la variable o que define la variable. ¿Vale? Como antes, pues incluso podemos obtener información cruzada. Vemos aquí, por ejemplo en este caso, os he puesto
para una sola variable, que es la variable educación, y os... abajo os he puesto el ejemplo de, para hacer dos variables cruzadas. En la parte de aquí de la... esta de aquí es la variable educación. Y aquí tenemos el género.

¿Vale? Podemos obtener, como vemos, tanto las frecuencias como los porcentajes de cada una de ellos. Aquí lo vemos, que esto se puede obtener tanto con... a través de comandos, como a través de las ventanas que nos ofrece el Stata. Observamos y aquí os he puesto el pantallazo. Cómo podemos obtener porcentajes de las frecuencias... en vez de verlos de las frecuencias, de la distribución de la variable. Observáis cómo la columna total está dando 100, que ese porcentaje de la distribución de nivel educativo entre hombres y mujeres. ¿De acuerdo?

Lo mismo lo podemos hacer pero el porcentaje, en vez de ser el 100% en las columnas, que sea en las filas. Como podemos observar, en esta parte de aquí, tal como tenéis en la presentación. Por lo tanto, para obtener información en forma de tablas, pues tenemos dos comandos, el Sum y el Table. Table nos permite perme... obtener información, tanto de las frecuencias, como en porcentajes. Pues lo dicho, cualquier consulta que tengáis, me encontrareis en los foros del curso.

Síntesis de información en forma de tablas

1.0 point possible (ungraded)
¿Qué debemos poner si queremos mostrar la información en tabla cruzada de dos variables (eisced = nivel educativo; gndr = género), pero mostrando ambos porcentajes en vez de frecuencias?

Síntesis de información en forma de gráficos



Transcripción
Hola, soy Adela García Aracil. Aquí estoy de nuevo.

Continuamos con el programa Stata y ahora vamos a ver, en esta lección, lo que es sintetizar la información pero en forma de gráficos.

Anteriormente lo hemos visto en forma de tablas, ahora en forma de gráficos. El Stata permite realizar gráficos de todo tipo. Y, ¿Cómo clasificar los gráficos? Pues los podemos hacer, o bien, aquellos que dices: Vamos a agruparlos por variables cualitativas, como serían los gráficos de sectores o los gráficos de barras; o bien, a... representando variables cuantitativas, como serían los gráficos de nube de puntos, los histogramas... entre otros.

También podemos realizar gráficos considerando, también, el tipo de variable, el número de dimensiones que representa. Es decir, tenemos, por ejemplo, unidimensionales, bidimensionales o multidimensionales, todo depende. Pues nada, que podemos ser y transformarnos en expertos a la hora de realizar gráficos con Stata.

El Stata permite hacer y reproducir diferentes gráficos, o bien, a través del comando Graph, que es el que contiene la mayor parte de gráficos, o otros comandos que son más específicos, como es el Dotplot o el Stem. El Dotplot es porque hace histogramas base de puntos y el Stem que realiza gráficos tanto de tallo y de hoja. También, el Stata te puede ofrecer gráficos a través de diferentes instrucciones gráficas, tras la realización de análisis estadísticos, como es el análisis factorial o los análisis de regresiones o la clusterización.

Estos gráficos, después de haber ejecutado estos análisis estadísticos, son como tenéis ahí, los comandos Greigen, el Rvplot o Clúster dendogram. Vamos a ver, la que es, la opción de gráfico, que es la... la que permite... la que tiene mayor modalidad a la hora de realizar gráficos. Como hemos comentado antes, los gráficos se pueden, por ejemplo, clasificar en diferentes modalidades.

Aquí tenemos, como podéis ver, las univariadas, como los gráficos de los sectores, gráficos de barras, gráficos de puntos o las bivariadas, que permite gráficos de dos dimensiones o los gráficos múltiples a través de una matriz.

La opción Graph la podemos obtener y la observamos en el escritorio... si tuviéramos... para no para no estar aquí mareando mucho, pobrecitos míos que estais aguantando bastante. Si veis aquí, tenemos arriba, en la parte superior del Stata, lo que es la opción gráficos. Y se nos abre un desplegable con todo lo que es la cantidad de diferentes opciones para hacer representaciones gráficas.

Por ejemplo, si nosotros que, volviendo al ejemplo que tenemos antes, tenemos aquí la variable género, como podemos observar. Entonces, vemos que tenemos los valores de hombres, mujeres y la representación... valores, perdón, observaciones que no... que... y no observaciones, perdón. Entonces vemos y hacemos un gráfico de sectores, aquí lo tenemos, simplemente poniendo la opción Graph
el Pie, que significa... para hacer lo que es el gráfico de sectores y las dos variables.

También podemos obtener el mismo resultado y fijaros como aquí, sería poner el comando Graph, el Pie porque es el tipo de sector, coma, y aquí tenemos la variable género de la base de datos de la European Social Survey y nos obtendríamos el mismo resultado. El porcentaje de hombres y el porcentaje de mujeres en color azul y rojo. Todas las que son... el diseño, la edición, el formato de los gráficos... se puede ir cambiando, pero como esto es mucho más complicado, pues lo dejamos para más adelante.

Podemos hacer también un gráfico... de sectores, no solamente por hombres y mujeres, sino que, además, para cada uno de los países. Os he puesto aquí, para que veáis, aquí abajo, es el mismo el mismo comando pero ampliando. Tenemos el Graph, el Pie porque es de sectores. Aquí tenemos la variable género ordenado, como veis aquí, by country. Y aquí tenemos, lo que es, la variable de país. Y entonces, nos ofrece, aquí tenéis todos los gráficos sectores para cada uno de los países, cómo de distribuye el porcentaje de hombres y mujeres en nuestra base de datos que estamos utilizando.
El gráfico de barras nos permite obtener la misma información.

He utilizando la misma información de hombres y mujeres para que veáis las diferencias entre unos y otros. Y os invito a que hagais la diferencia entre este gráfico de aquí arriba, con este comando donde ponemos lo que es el Graph la... el Bar de barras hombres y mujeres y, después, abajo, fijaros que hay una comita y se ha puesto la opción no label. Os invito a que hagáis la diferencia entre uno y el otro, para que veáis qué diferencia hay entre un gráfico y el otro con diferentes instrucciones. Aquí os he puesto otros ejemplos en el gráfico éste de barras, en el que vemos cómo podemos estar, tanto representando las frecuencias, que sería el primer caso; como en el segundo, que podemos ver que se están representando porcentajes. ¿De acuerdo? Aquí vemos la diferencia entre uno y otro. Así que, ya con esto que es lo más sencillito terminamos la forma de ver, sintetizar la información en tipo de gráficos. Y cualquier consulta, me tenéis en el foro del curso. Muchas gracias.

Síntesis de información en forma de gráficos

1.0 point possible (ungraded)
¿Qué instrucciones de Stata representarían un gráfico de puntos considerando la media de género (gndr) por países (cntry)?

Estadísticos más sofisticados



 Transcripción

Hola, soy Adela García Aracil. Aquí me tenéis de nuevo con la lección de estadísticos más sofisticados, más avanzados, que se puede realizar en Stata.

Hemos visto con el Stata, que podemos utilizar, aparte una vez ya abierta la base de datos, podemos obtener datos estadísticos descriptivos, a través de la opción Sum, con, también, con el Tabulate.

También hemos visto que podemos ah... ofrecer información a través de los gráficos. Si continuamos viendo las pestañas de la parte superior del programa Stata, vemos que después viene Statistics. Aquí es donde aparecerá, fijaros, como un desplegable com una cantidad inmensa de modelos estadísticos y econométricos a poder realizar. No voy a entrar en detalle en todos y cada uno de ellos, porque esto lo explicará la profesora Isabel Neira en el siguiente módulo y lo único que os puedo decir es que, en... Stata ofrece mucha ayuda para poder realizar cada uno de ellos, que no hace falta que os lo aprendáis de memoria.

Y que si algo se olvida, tenéis la opción Help. Ayuda siempre nos permite, no solamente saber la síntesis del comando que tenemos que aplicar para la realización de alguna regresión o de algún modelo econométrico, sino que a veces también, pues no sabemos que... que palabra, porque encima están en inglés, tenemos que poner en el comando. Imaginaros que queremos saber cuál es la correlación que existe entre dos variables.

Nosotros podemos perfectamente, fijaros aquí que tenemos buscar, le damos a la opción buscar, decimos buscar todo. Y ponemos aquí pues la palabra, por ejemplo, correlation. Ahí. Ahí va. Le damos a Ok y nos dará un listado, como podéis observar, de diferentes comandos donde pueda aparecer la palabra correlation.

Vamos buscando buscando... y decimos: ¡Bingo! ¡Aquí, la he encontrado! Entonces pinchamos, a lo que es, el color azulito. Y entonces, aquí nos explica cuál es la sintaxis de... el comando para analizar la correlación entre dos variables. Aquí lo tenéis sencillamente. Entonces, simplemente deciros que no os asustéis con el Stata. Que permite analizar muchas cosas. Y que... lo que es la opción ayuda, te garantiza, también, el poder no equivocarse, porque a veces dices: Me estoy equivocando y no lo he hecho bien. ¿De acuerdo? Pues lo dicho, los modelos econométricos más difíciles y más avanzados, los vamos a dejar a la profesora Isabel Neira. Y lo dicho, me podéis encontrar para consultas en el foro del curso. Muchas gracias.

Estadísticos más sofisticados

1.0 point possible (ungraded)
¿Qué programa utilizarías para hacer modelos econométricos?

Examen unidad 2

1.0 point possible (graded)
Stat/Transfer…..

problem

1.0 point possible (graded)
¿Qué comando de Stata se utiliza para saber la codificación de una variable?

problem

1.0 point possible (graded)
¿Qué comando de Stata se utiliza para obtener una síntesis de la información de una variable?

problem

1.0 point possible (graded)
El comando sum muestra

problem

1.0 point possible (graded)
Si queremos realizar un modelo econométrico en Stata y no conocemos el comando

Módulo 2: Manejo de Paquetes Estadísticos

Presentación módulo 2


Transcripción
Hola, soy Adela García Aracil. Voy a ser la responsable del módulo dos
del manejo de paquetes estadísticos.
En este módulo vamos a ver qué son y para qué se utilizan los paquetes
estadísticos, como el SPSS, el R. Haremos comparaciones con
las hojas de cálculo, como la hoja de cálculo de excel.
Haremos una lectura de base de datos utilizando específicamente
el programa estadístico Stata.
Continuaremos profundizando un poco con los comandos descriptivos
de este programa estadístico para, después, poder realizar
síntesis de información, tanto en forma de tablas, como gráficos.
Y, finalmente, mostraremos una breve introducción
de los estadísticos más sofistic... sofisticados o avanzados
que realiza el Stata. Entonces, con todo esto, espero que en...
disfruten de este módulo y les veo pronto. Gracias.



¿Qué son los paquetes estadísticos?


Transcripción

Hola, soy Adela García Aracil, estoy aquí para explicaros la lección que versa sobre los paquetes estadísticos.

Los paquetes estadísticos son programas informáticos que han sido diseñados para el análisis estadístico de datos. Tratan de aglutinar rutinas matemáticas que fueron pensadas, inicialmente, para ser utilizados desde lenguajes de programación como el Fortran y el C. Este conjunto de rutinas y subprogramas, se fueron perfeccionando con el tiempo, empezaron a funcionar de forma conjunta y, cada vez, ha sido más completos y, por lo tanto, permiten proporcionar más información; que es importante para los analistas, que sois vosotros mismos.

En... si pretendeis hacer un estudio, por ejemplo de... de qué depende el nivel salarial, pues podemos hacer que dependa de... pues sí el nivel educativo influye o no al salario.

Podemos hacer una representación gráfica, o hacer predicciones, o establecer hipótesis... Pues todas estas rutinas, se pueden hacer y se aglutinan, y forman, lo que se llama, los paquetes estadísticos. La evolución fue que, al principio, fueron diseñados para servidores grandes. Después, ya a media que fue incrementando la potencia de los ordenadores personales, pues entonces, ya existe una versión correspondiente para los PC's. Emm... Es difícil saber qué paquete estadístico es el más adecuado, porque, en algunos de ellos, hay que saber lenguaje de programación.

Y en cambio, para otros, se ha hecho más fácil su manejo porque se ha añadido una interfaz de usuario. Las ventajas es que, gracias a que tienen muchas... rapidez en la procesación de información, pues en tiempo muy corto hacemos muchas tareas.

La dificultad es que, tenemos tantos resultados que, a lo mejor, podemos obtener resultados contradictorios. Por lo tanto, el usuario tiene que estar... saber qué es lo que está haciendo. Y, como hemos comentado... he comentado antes, anteriormente, hay que tener, a veces, algún breve conocimiento sobre el lenguaje de programación para poder realizar los diferentes análisis.

De paquetes estadísticos tenemos tanto, para analizar datos cuantitativos, como para analizar datos cualitativos. Cuantitativos tenemos como el SPSS, el SAS, el Minitab, el R... Y para analizar datos cualitativos tenemos el Aquad, el Atlas.ti y el MaxQda entre otros.

¿Cuál escoger? Pues es difícil esta tarea, pero algunas veces nos marca pues el precio. Si nos fijamos en el costo, vemos que hay algunas versiones que son libres, de distribución, no tenemos que pagar licencia. En otras existen lo que es... ni más ni menos que... como dijéramos... el diseño del estudiante.

A veces tenemos que tener un mínimo de conocimiento requerido para poder utilizarlo. También tenemos, si nos fijamos, qué cantidad de volumen de datos pueden procesar, la facilidad de programación, entre otras. Si, os pongo aquí, como ejemplo, el SPSS que es muy utilizado en las ciencias sociales y en las empresas.

Permite administrar bases de datos de manera eficiente, hacer proyecciones... Está muy bien y es fácil de navegar a través de él. Sin embargo, a veces está mostrando un nivel excesivo de información, lo que puede confundirnos a vosotros. Aquí os muestro un poco, como es la interfaz del SPSS.

Por supuesto, el link para que veáis como poder acceder al software. También tenemos otro paquete estadístico que os muestro, como es el BMDP que cubre un amplio abanico de métodos estadísticos,
pero tiene un inconveniente que, para manejar datos, su capacidad es un poco limitada. Pero lo que tiene de... de a favor es que, al menos, los programas que estás ejecutando por separado, pueden ser beneficiosos para la entrada de otro programa que queramos hacer. Aquí tenéis también los links correspondientes para poder realizar la búsqueda de dicho software en las páginas web. El R es de fácil manejo.

Por lo menos, tiene libre acceso, el software es gratuito. Aunque, para algunos, es difícil su interpretación y su programación, porque tienen que saber un poco de lenguaje de programación. Veis aquí, en esta transparencia que os puesto, cuál sería el marco en el cuadro que sale cuando uno está con el R. Y en la parte inferior podéis observar, aquí, que es donde se establecen las instrucciones, ese lenguaje de programación que, los resultados, se ofrecen y se muestran en esta parte superior.

Y, finalmente, como otro ejemplo, os pongo el... el paquete estadístico que analiza datos cualitativos, que es como el Atlas.ti, que lo que permite es procesar la información... pues analizando los textos en pasajes y en citas, anotar comentarios o anotaciones, codificando... Es como si tuviéramos nosotros un papel y un lápiz de color, y fuéramos ahí estableciendo comentarios. Aquí veis, por ejemplo en este caso que os he puesto, cómo se dicen palabras que pueden aparecer en el texto, como citas, cuántas veces aparecen... Y esto, lo que nos permite, un análisis cualitativo del texto.

Otros software que os pongo, otros ejemplos, tanto para analizar datos cuantitativos como cualitativos. Y lo dicho, estoy a vuestra disposición en el foro del curso. Y muchas gracias.

¿Qué son los paquetes estadísticos?

1.0 point possible (ungraded)
¿Qué paquete estadístico se utilizaría para realizar investigación cualitativa?

Hojas de cálculo



Traductor
Hola, soy Adela García Aracil. En esta edición vamos a ver lo que son las hojas de cálculo. Una hoja de cálculo es una aplicación, a través de la cual, se puede manipular los datos agrupados en forma de tablas. Pueden ser, tanto datos numéricos, como alfanuméricos o de caracteres. En las tablas vemos que es un documento compuesto por filas y por columnas. Y, en la intersección de ambos, es lo que se llama y se conoce como celda. Normalmente, las operaciones que se utilizan en las hojas de cálculo, se realiza entre celdas.

Originalmente, las hojas de cálculo se crearon para manejar datos financieros, aunque, actualmente, se utilizan realizar tareas como administrar presupuestos, gestionar bases de datos, incluso hacer análisis estadísticos... Por eso, lo hemos puesto dentro de este programa para que podemos... vosotros podéis comparar entre, sí utilizar paquetes estadísticos, como hemos visto en la lección anterior; o una hoja de cálculo.

También se pueden realizar representaciones gráficas, como sectores... gráfica de sectores, histogramas, curvas... Las hojas de cálculo más conocidas, tenemos el Microsoft Excel, el StarOffice, el OpenCalc, Lotus 1 2 3, el Corel Quattro y el Kspread, entre otros.

Permítanme que os muestre, pues un poco, la apariencia que tiene las hojas de Excel. Si vemos, por ejemplo, la de StarOffice. También tenemos aquí el Kspread. Es decir, si nos damos cuenta, todas ellas tienen, más o menos, un formato parecido. Centrándonos, por ejemplo, en la hoja de excel, vemos que éste tiene una serie de funciones, que son las que nos permite hacer operaciones. Por ejemplo, si queremos realizar sumas, pues podemos, perfectamente, como veis aquí, cómo podemos decir, sumas desde dentro de una misma columna en diferentes celdas. Podemos también realizar sumas de celdas esparcidas, o realizar promedios y otras operaciones. Excel también permite hacer gráficos. Si observáis, tenemos ahí una opción, dentro de la hoja de excel, que nos permita hacer gráficos. Hay una ventana desplegable que nos permite elegir qué tipo de gráfico queremos ejecutar. 

Asimismo, excel también nos permite hacer estadística descriptiva, nos permite, de una manera simple, obtener resultados a través de las tablas, o también de gráficos, y esto lo podéis obtener, si os fijáis en la pestaña de arriba, hay una en la parte de herramientas; se abrirá una opción que será: análisis de datos. Y esto nos permite hacer la estadística descriptiva básica.

Os pongo aquí, como una... un ejemplo, donde veis aquí que tenemos un rango de entrada, que se pone qué celdas son las que queremos analizar. Y un rango de salida o, incluso, lo podemos hacer
que los datos salgan en una hoja nueva. Esto, alomejor puede ser que no lo tengais instalado en vuestra versión de excel, pero muchas operaciones se pueden obtener en la parte superior.

Tenéis la opción insertar y, dentro de insertar, tenéis funciones. Entonces se insertan funciones estadísticas. Asimismo, excel nos permite realizar, pues ejercicios de econometría. La econometría entendida como la aplicación de técnicas matemáticas y estadísticas a la economía, en unos tipos de problemas de análisis de datos, el desarrollo y la prueba de teorías y modelos. Es decir, lo que se plantea, es un modelo. 

Sabemos que hay una variable que depende de otra y, entonces, lo que hacemos es definir una función. A veces, no es necesario que este modelo esté bien definido, bien especificado, porque a veces no sabemos, si desconocemos, de qué depende una variable. ¿Qué relación vemos? Vemos relación, por ejemplo, entre distintas variables como: pues si el consumo que yo realizo depende de mi ingreso, o si el empleo que yo tengo depende del nivel de estudios o de la edad que yo tengo, si soy hombre o mujer... Son diferentes relaciones que se ven entre las variables. Excel permite hacer
tres principales usos de la econometría, como es la medición de parámetros, la prueba de hipótesis y la predicción.

Centrándonos en el primero, en la medición de parámetros, que es lo que llamamos estimación de modelos, podemos hacer diferentes análisis de regresión.

Lo que hacemos es que tenemos una variable dependiente, en este caso, la hemos llamado Y, y la tratamos de explicar por diferentes variables independientes, como tenemos aquí y que serían las X. Los modelos de regresión se pueden agrupar de diferentes formas  y clasificarlas. Nosotros lo podemos agrupar como modelos lineales y no lineales. Los lineales, tal como podemos observar, son aquellos donde la variable explicada, y que es la dependiente, depende de una combinación lineal de variables explicativas.

En cambio, los no lineales observamos que alguna de las variables independientes está no lineal, como podéis observar aquí, cómo está elevado al cuadrado. Y eso afectaría a la linealidad de las otras variables explicativas. Asimismo, se podemos obtener modelos de regresión simple, que es donde una... la variable explicativa, es una solamente, o modelos de regresión múltiple, donde vemos que pueden existir diferentes variables explicativas que afectan a la variable dependiente. Esto lo tenéis en la hoja de excel, en la pestaña de análisis de datos y, dentro de ella, la opción represión. Os pongo aqui un ejemplo donde podéis ver los resultados cómo saldrían. Perdón porque he pasado demasiado aprisa.

Cómo saldrian los resultados dentro de los... de la hoja de excel cuando hacemos análisis de regresión. Otras veces, lo que podemos hacer es, en vez de hacer la regresión con su información, hacer gráfico. Los gráficos, a veces, son muy intuitivos. Ya lo dicen: más vale una imagen que mil palabras. Esto lo tenemos entonces, en la pestaña del asistente de gráficos, dentro de la hoja de excel.

Y, por ejemplo, aquí os pongo otro ejemplillo también, donde vemos que se hace una regresión y esto está dentro de gráficos X Y de Scatter. Es decir, excel es una hoja, en este caso de cálculo, muy completa que nos permite hacer diferentes datos... diferentes análisis, tantos estadísticos descriptivos, como modelos de regresión y gráficos, que nos permiten analizar la información. Es una alternativa a los paquetes estadísticos que hemos visto anteriormente. Pues lo dicho, estoy con vosotros en el foro para cualquier consulta o duda. Y muchas gracias.

Hojas de cálculo

1.0 point possible (ungraded)
¿Qué función de la hoja de cálculo EXCEL utilizarías para calcular la media de un rango de datos?


Lectura de Bases de Datos I



Transcripción

Hola, soy Adela García Aracil. En esta lección os voy a explicar qué es la lectura de base de datos a través de un paquete estadístico.

Las bases de datos es un conjunto de datos, donde se pone, en un mismo contexto, se almacena mucha información para, después, poder utilizarla. Actualmente, la mayoría de las bases de datos están en formato digital y permiten un amplio rango de almacenamiento de datos. Se han creado, lo que se llama, los sistemas gestores de base de datos, que son programas que permiten almacenar los datos para, posteriormente, poder acceder a ellos de forma rápida y estructurada. Estos sistemas gestores de base de datos, lo que permiten son añadir, borrar, modificar y analizar los datos.

Y, lo que se hace, es que te permiten acceder de forma simple a dichos datos. Podemos... los datos, a medida que se han ido evolucionando las bases de datos, se han utilizado diferentes lenguajes de
moderación. Estos pueden ser jerárquicos, en red, relacionales, multidimensionales, de objeto... entre otros.

Lo que vemos es que, para poder acceder a las bases datos, necesitamos lenguajes de consulta. Que nos permiten interrogar a la base de datos. Podemos analizar los datos, pero no siempre todos los usuarios tienen el privilegio de poder actualizar datos. Es decir, si tenemos un... por ejemplo, una base de datos en una empresa sobre las personas, los trabajadores, pues algunos de ellos podrán ver sus datos personales, pero no, por ejemplo, las nóminas. Es decir se crearán claves de acceso o partes de las bases de datos estarán restringidas.

Como existen muchos paquetes estadísticos, como hemos visto hasta ahora, y cada uno de ellos, vemos, que trata la información de forma diferente. Hay un software que se llama el Stat Transfer
que, lo que nos permite, es... digeramos... exportar, importar datos y dar diseños de diferentes formatos de las bases de datos, acorde al paquete estadístico que queramos utilizar. Os he puesto... aquí tenéis, lo podéis ver, el... aquí en la transparencia, el link para poder acceder al Stat Transfer.

Esto lo que nos hace, como podéis comprobar aquí en la... en la en la pantalla, es, tenemos aquí... observamos que te dice: el fichero de entrada qué formato tiene. Pues podemos observar que puede ser en código access, o puede ser una excel o puede ser, por ejemplo, en MathLab.

Y, después, buscamos el fichero y le decimos qué salida, qué formato de salida, queremos que tenga el otro... la otra base de datos. La queremos transformar en Stata, o la queremos transformar en SPSS... a lo que queramos. Esto es mucho más fácil. Es verdad que los mismos paquetes estadísticos te permiten exportar o importar datos pero, que sepáis, que existe el Stat Transfer, que nos permite hacer esto con mucha más facilidad y ahorrarnos hacerlo manualmente.

Si nosotros nos centramos en lo que es, en el paquete estadístico Stata, podemos observar que cuando abrimos de Stata, diferenciamos y encontramos cinco ventanas diferentes. Déjadme mostrar en esta transparencia, como veis aquí, y os subrayo que tenéis aquí, pues 1, 2, 3, 4, y 5 ventanas. Podemos observar, en una ventana primera de aquí, en la número uno, es donde salen los comandos que hemos ido introduciendo. En la número dos nos dan los resultados.

En la número tres aparecen todas las variables que podemos tener en la base de datos. En la cuatro es donde escribimos nosotros los comandos e indicamos qué queremos hacer. Y la cinco nos describe, un poco, lo que es las variables que tenemos en la... en la ventana número tres. Esto lo podemos ver a través, por ejemplo, voy a haceros un ejemplillo, con el Stata que tengo yo aquí instalado en el ordenador. Observamos, por ejemplo, que si yo quiero abrir una base de datos, aquí tenemos el Stata y, vemos las cinco ventanas como se ha comentado, y le digo yo: abrir. Por ejemplo, abrir la base de datos.

Y entonces, efectivamente como podéis comprobar, tenemos aquí las variables. Aquí tenemos los comandos que estamos poniendo. Aquí tenemos, por ejemplo, las propiedades de cada una de las variables. Y, por ejemplo, si yo le digo esto aquí, que lo vamos a ver después, veo que me salen muchas variables al respecto. El Stata es el programa estadístico con el que nos vamos a centrar y vamos a hacer ejercicios, a lo largo del programa... del curso del MOOC, por el acceso y el manejo que... que nos facilita muchos análisis estadísticos.

Además, vamos a avanzar. Lo que quiero indicaros, para lo que es un paso previo del Stata, es tal como estábamos viendo anteriormente, que tenemos aquí en la parte superior del Stata, unos iconos que nos permiten hacer las diferentes operaciones de abrir una base de datos o guardar. Vemos que también podemos hacer, esto de aquí que veis es el log, es donde se pueden guardar los resultados. 

Imaginaros que yo le digo: muéstrame, por ejemplo... Perdonad que aquí cortelo que estaba haciendo. Si yo le digo: muéstrame, por ejemplo, la variable ciudad. La véis aquí. Hago doble clic y me aparece aquí abajo, ¿veis? la de ciudad. Le doy a intro y me aparece aquí una tabla con todos los datos de las ciudades que contiene esta base de datos en cuestión.

En particular, son treinta países. Si yo estos resultados, dices: Bueno, ¿qué hago con los resultados? ¿Copio y pego? Hay una opción dentro de stata que se llama: los ficheros log. Estos ficheros, los veis aquí, se abrió en otra pestañita.

En vez de SCM, le voy a decir que me lo haga en log. Voy a llamarle prueba, por ejemplo. Le doy a guardan. De tal forma que, si yo le digo otra vez lo mismo que he dicho antes. Puedo hacer perfectamente hacia atrás y me sale...Perdonad, a ver... ahí está. Me sale ahí. Yo, si después voy, como veis, al excel, busco donde he guardado en cuestión el fichero.

Le he llamado prueba log. Y ahí me sale, como veis, los resultados de lo que estábamos trabajando. Bueno, pues que sepáis que tenemos diferentes iconos dentro de la parte superior del... del Stata, que nos permite, pues tanto abrir, cerrar y poder manejar todas las las bases de datos. En los... en las próximas lecciones, vamos a trabajar un poco más con Stata.
Pues lo dicho, quedo a vuestra disposición, en los foros del curso me podéis encontrar. Y muchas gracias. Hasta pronto.

Lectura de Bases de Datos I

1.0 point possible (ungraded)
¿Para qué utilizaríamos un do-file en Stata?

Lectura de Bases de Datos II. Comandos Descriptivos

 Transcripción

Hola, soy Adela García Aracil. Aquí estoy de nuevo como vosotros. En esta lección vamos a ver la lectura de base de datos un poco más ampliada. Anteriormente, lo que vimos en el Stata era cómo se abría la base de datos. Continuamos con el Stata y lo que vamos a ver, son diferentes comandos. Entre ellos, destacamos los más básicos. Que es la descripción de los datos, el describe, el codebook, el edit y el list. Estos comandos básicos nos permiten observar la información que contiene la base de datos.

El describe, lo que hace es mostrar la información de todas las variables tal como se encuentra. ¿Qué nos ofrece? Nos ofrece el nombre de la variable, el tipo de almacenamiento de la variable, el formato y, cómo si si... y si se ha definido, perdón, alguna etiqueta para la variable. Asimismo, muestra el número de observaciones, el número de variables y el tamaño de la base de datos.

Aunque aquí yo os he puesto una pantalla apegada. Dejadme mostraros esto en el en modo real, volvemos, otra vez, aquí a mostrar el Stata, como habíamos hecho antes, habíamos abierto una base de datos. En concreto he abierto la base de datos de la European Social Survey, que esta es accesible en la página web. La podéis... acceder vosotros también.

Y entonces, lo que vamos a ver es, qué tipo de información contiene esta base de datos. Si nosotros le ponemos aquí describe, pero que también es lo mismo que poner desc. A ver si... vamos allá.

Que es el abreviado. Observamos, como os estaba comentando, fijaos aquí arriba. Tenemos el número de observaciones que tiene la base de datos, 54000. El número de variables, 626. Y el tamaño de la base de datos. A continuación, nos aparece un listado con todas las variables, su formato y, como os estaba diciendo, si está definida una etiqueta o no. Veréis que, a veces, en la pantalla de resultados del Stata no aparece todo. Fijaros como aquí aparece more. Le damos a la barra de espacio y nos va apareciendo más variables porque, en total, hemos dicho que tiene unas 600 y pico de variables. Si queremos detener esto porque ya estamos aburridos de tanta... ver este listado.

Fijaros aquí que tenemos un circuito rojito. Hacemos clic y lo que hacemos es detener la ejecución del comando. Esto que hemos hecho, simplemente tecleando aquí abajo, poniendo desc, como hemos puesto en la ventana de comandos.

Lo podemos hacer igual, lléndonos a la ventanita de aquí arriba, vemos que pone: Data, Describe data. Y entonces ponemos Describe data in memory or in a file. Y le decimos Ok. Y observaremos cómo nos sale otra vez el tamaño de la base de datos, el número de variables y otra vez la descripción de todas las variables. Por otra parte, tenemos, además del Describe, el Codebook. Si nosotros avanzamos, vamos a hacer aquí. Esto es lo mismo que os he puesto antes.

El Codebook es otra forma de obtener información. También presenta la formación indicando si la variable tiene definida una etiqueta, el formato, el rango de datos, la forma de codificación y el número de observaciones que no tienen dato para una variable. Lo que se llaman los missing values. Aunque de nuevo, aquí os he puesto, para que lo tengáis en la presentación, diferentes pantallazos de lo que hace el Codebook en lo que es en tiempo real. Vamos a volver otra vez al escritorio.

Y os presento, aquí, en la ventana de comandos pondremos simplemente codebook. Le damos a intro y fijaros como tenemos la misma información, por ejemplo, la variable país, que ya la hemos visto antes. A ver... donde la tenemos... la tenemos por aquí. ¡Ya me he pasado! Pues, o cualquier variable, podemos ver que tenemos aquí los rangos de cómo va, los ejemplos, cómo está codificada la variable y tenemos aquí, en este caso, valores missing, es decir, cero, no hay ninguno de el total de toda la base de datos que tenemos.

Esto asimismo, lo podemos ver también a través de la opción de aquí arriba de Data. Vemos el Describe... perdón. Nos vamos hacia abajo y tenemos ahí el Codebook que, en estos momentos, la verdad sea dicha, es que no lo veo. Pero no lo veo por aquí. ¡Aquí está! Fijaros, ahí está, esque está en pequeñito. Perdonad por el tamaño, ¿vale? Ahí lo tenemos, el Codebook, ¿de acuerdo? Bien, y otra forma de ver la información de las... de la base de datos es, otra vez, de la opción Edit. Edit nos permite ver la información como si fuera pues una hoja excel, ni más ni menos.

Si lo vemos, volvemos aquí, donde estábamos antes, pues yo pongo la palabra edit en la ventana de comandos, así, le doy a intro y fijaros como se abre otra ventana y ahí ya tenemos ya toda la información. Vamos, y fijaros como es por columnas y por... y por filas, tal como lo teníamos. Pero se nos ha abierto otra ventana, ¿de acuerdo? Que cerramos.

Y finalmente, tenemos lo que es la opción List. Esto, aquí os lo he puesto para que veáis diferentes. Y la List, lo que hace es... es igual... similar edit. Pero a lo mejor estamos acostumbrados, en vez de ver la información en una hoja de... de como si fuera una hoja de cálculo, pues nos gusta verlo más así en tipo cuadradito. Entonces, para no hacerlo porque el List si que le cuesta un poco más mostrar información.

Os enseño pues el pantallazo que... que puesto y fijaros como la información está así, en forma de cuadraditos para cada uno de los registros. Y bueno, pues esto es la fff... los comandos más básicos del Stata para poder visualizar lo que es la información que contiene una base de datos. Tanto el Describe, el Codebook, como el Edit y como List. Pues lo dicho, cualquier consulta me podéis encontrar en el foro del MOOC. Muchas gracias.

Lectura de Bases de Datos II. Comandos Descriptivos

1.0 point possible (ungraded)
¿Cuál es el comando que se utilizaría en Stata para mostrar la información de todas las variables de la base de datos?

Síntesis de información en forma de tablas

Transcripción

Hola, soy Adela García Aracil. Aquí estoy de nuevo. Vamos a continuar con el Stata. Hasta ahora, hemos visto la lectura de base de datos. Y, lo que vamos a hacer ahora, es mostrar la información, primero de todo, vamos a hacerla en forma de tablas. Para ello, el Stata tiene dos comandos: Uno que es el Sum, de... de lo que es hacer el summarize.

Y el tabulate, que es el Tab. Vamos a verlos. El sumarize, el comando Sum, lo que permite es mostrar las estadísticas básicas de las variables. Nos muestra el número de observaciones, el promedio, la desviación estándar... así como los valores mínimos y máximos. Todas estas estadísticas, nos las permite... mostrar, tanto para una variable o para todas las variables.

Aquí os he puesto un pantallazo, pero vamos a hacerlo porque siempre esto parece como que... la vida real es más bonita. Volvemos al escritorio, donde tenemos el... el... el programa Stata abierto con nuestra base de datos de la European Social Survey. Y nosotros ponemos aquí, bajo la ventana de comando. Ponemos sum, así tal cual. No ponemos ningún nombre variable ni nada. Y nos... observamos cómo van apareciendo las variables con la descripción de cada una de ellas.

Otra vez, como hay muchas variables, fijaros como aquí tenemos la opción de More para que, si queremos ver más, pues seguimos viendo, seguimos viendo o decimos, ya hemos visto lo que queríamos. Si queremos ver, por ejemplo, el resumen o las estadísticos descriptivos básicos de una variable. Por ejemplo, de la variable em... ci... em... ciudad, que hemos dicho antes.

O de la variable educación, ya que la tenemos aquí a mano, la tenemos aquí. Pues uno dice: bueno, pues la variable educación. Aquí vemos las observaciones para una de ellas: la media. Y es una variable que va de 1 a 99. Ese noventa y nueve está diciendo que hay valores missing values y, normalmente, los missing values están codificados con el número 9 o con el 99, según dependiendo de el rango de valores que adquiera la variable.

Bueno, esto que hemos hecho con el Sum, lo podemos hacer también aquí arriba donde vemos que tenemos los datos. Nos permite hacer también, perdón ahí, de escribir Data. Y, fijaros como aquí tenemos summary statistics. Nos haría exactamente lo mismo por ventanitas. Que no hay... no hace falta aprenderse el comando.

Bien, por otra parte, también tenemos, como hemos comentado al principio, lo que es el Tabulate. El Tabulate nos permite también mostrar información en forma de tabla. Aquí lo tenéis en grande, por ejemplo, para una sola variable, como hemos dicho, la variable género, pues en este caso va de 1 a 9 también.

Uno era para hombres, cero... dos para mujeres. El nueve es los missing values. Pues fijaros como abajo tenemos, en esta parte de aquí, los valores mostrados para la... con la opción tabla. Vemos que tenemos los valores de hombres, mujeres y el no answer. Esta... los missing values es lo que está codificado con valor 9. ¿De acuerdo? El... la opción Tabulate nos permite hacer pues mostrar información de forma diferente.

Como podemos ver, las observaciones totales, incluso nos permite ver los porcentajes de cada una de las categorías que representa la... la variable o que define la variable. ¿Vale? Como antes, pues incluso podemos obtener información cruzada. Vemos aquí, por ejemplo en este caso, os he puesto
para una sola variable, que es la variable educación, y os... abajo os he puesto el ejemplo de, para hacer dos variables cruzadas. En la parte de aquí de la... esta de aquí es la variable educación. Y aquí tenemos el género.

¿Vale? Podemos obtener, como vemos, tanto las frecuencias como los porcentajes de cada una de ellos. Aquí lo vemos, que esto se puede obtener tanto con... a través de comandos, como a través de las ventanas que nos ofrece el Stata. Observamos y aquí os he puesto el pantallazo. Cómo podemos obtener porcentajes de las frecuencias... en vez de verlos de las frecuencias, de la distribución de la variable. Observáis cómo la columna total está dando 100, que ese porcentaje de la distribución de nivel educativo entre hombres y mujeres. ¿De acuerdo?

Lo mismo lo podemos hacer pero el porcentaje, en vez de ser el 100% en las columnas, que sea en las filas. Como podemos observar, en esta parte de aquí, tal como tenéis en la presentación. Por lo tanto, para obtener información en forma de tablas, pues tenemos dos comandos, el Sum y el Table. Table nos permite perme... obtener información, tanto de las frecuencias, como en porcentajes. Pues lo dicho, cualquier consulta que tengáis, me encontrareis en los foros del curso.

Síntesis de información en forma de tablas

1.0 point possible (ungraded)
¿Qué debemos poner si queremos mostrar la información en tabla cruzada de dos variables (eisced = nivel educativo; gndr = género), pero mostrando ambos porcentajes en vez de frecuencias?

Síntesis de información en forma de gráficos



Transcripción
Hola, soy Adela García Aracil. Aquí estoy de nuevo.

Continuamos con el programa Stata y ahora vamos a ver, en esta lección, lo que es sintetizar la información pero en forma de gráficos.

Anteriormente lo hemos visto en forma de tablas, ahora en forma de gráficos. El Stata permite realizar gráficos de todo tipo. Y, ¿Cómo clasificar los gráficos? Pues los podemos hacer, o bien, aquellos que dices: Vamos a agruparlos por variables cualitativas, como serían los gráficos de sectores o los gráficos de barras; o bien, a... representando variables cuantitativas, como serían los gráficos de nube de puntos, los histogramas... entre otros.

También podemos realizar gráficos considerando, también, el tipo de variable, el número de dimensiones que representa. Es decir, tenemos, por ejemplo, unidimensionales, bidimensionales o multidimensionales, todo depende. Pues nada, que podemos ser y transformarnos en expertos a la hora de realizar gráficos con Stata.

El Stata permite hacer y reproducir diferentes gráficos, o bien, a través del comando Graph, que es el que contiene la mayor parte de gráficos, o otros comandos que son más específicos, como es el Dotplot o el Stem. El Dotplot es porque hace histogramas base de puntos y el Stem que realiza gráficos tanto de tallo y de hoja. También, el Stata te puede ofrecer gráficos a través de diferentes instrucciones gráficas, tras la realización de análisis estadísticos, como es el análisis factorial o los análisis de regresiones o la clusterización.

Estos gráficos, después de haber ejecutado estos análisis estadísticos, son como tenéis ahí, los comandos Greigen, el Rvplot o Clúster dendogram. Vamos a ver, la que es, la opción de gráfico, que es la... la que permite... la que tiene mayor modalidad a la hora de realizar gráficos. Como hemos comentado antes, los gráficos se pueden, por ejemplo, clasificar en diferentes modalidades.

Aquí tenemos, como podéis ver, las univariadas, como los gráficos de los sectores, gráficos de barras, gráficos de puntos o las bivariadas, que permite gráficos de dos dimensiones o los gráficos múltiples a través de una matriz.

La opción Graph la podemos obtener y la observamos en el escritorio... si tuviéramos... para no para no estar aquí mareando mucho, pobrecitos míos que estais aguantando bastante. Si veis aquí, tenemos arriba, en la parte superior del Stata, lo que es la opción gráficos. Y se nos abre un desplegable con todo lo que es la cantidad de diferentes opciones para hacer representaciones gráficas.

Por ejemplo, si nosotros que, volviendo al ejemplo que tenemos antes, tenemos aquí la variable género, como podemos observar. Entonces, vemos que tenemos los valores de hombres, mujeres y la representación... valores, perdón, observaciones que no... que... y no observaciones, perdón. Entonces vemos y hacemos un gráfico de sectores, aquí lo tenemos, simplemente poniendo la opción Graph
el Pie, que significa... para hacer lo que es el gráfico de sectores y las dos variables.

También podemos obtener el mismo resultado y fijaros como aquí, sería poner el comando Graph, el Pie porque es el tipo de sector, coma, y aquí tenemos la variable género de la base de datos de la European Social Survey y nos obtendríamos el mismo resultado. El porcentaje de hombres y el porcentaje de mujeres en color azul y rojo. Todas las que son... el diseño, la edición, el formato de los gráficos... se puede ir cambiando, pero como esto es mucho más complicado, pues lo dejamos para más adelante.

Podemos hacer también un gráfico... de sectores, no solamente por hombres y mujeres, sino que, además, para cada uno de los países. Os he puesto aquí, para que veáis, aquí abajo, es el mismo el mismo comando pero ampliando. Tenemos el Graph, el Pie porque es de sectores. Aquí tenemos la variable género ordenado, como veis aquí, by country. Y aquí tenemos, lo que es, la variable de país. Y entonces, nos ofrece, aquí tenéis todos los gráficos sectores para cada uno de los países, cómo de distribuye el porcentaje de hombres y mujeres en nuestra base de datos que estamos utilizando.
El gráfico de barras nos permite obtener la misma información.

He utilizando la misma información de hombres y mujeres para que veáis las diferencias entre unos y otros. Y os invito a que hagais la diferencia entre este gráfico de aquí arriba, con este comando donde ponemos lo que es el Graph la... el Bar de barras hombres y mujeres y, después, abajo, fijaros que hay una comita y se ha puesto la opción no label. Os invito a que hagáis la diferencia entre uno y el otro, para que veáis qué diferencia hay entre un gráfico y el otro con diferentes instrucciones. Aquí os he puesto otros ejemplos en el gráfico éste de barras, en el que vemos cómo podemos estar, tanto representando las frecuencias, que sería el primer caso; como en el segundo, que podemos ver que se están representando porcentajes. ¿De acuerdo? Aquí vemos la diferencia entre uno y otro. Así que, ya con esto que es lo más sencillito terminamos la forma de ver, sintetizar la información en tipo de gráficos. Y cualquier consulta, me tenéis en el foro del curso. Muchas gracias.

Síntesis de información en forma de gráficos

1.0 point possible (ungraded)
¿Qué instrucciones de Stata representarían un gráfico de puntos considerando la media de género (gndr) por países (cntry)?

Estadísticos más sofisticados



 Transcripción

Hola, soy Adela García Aracil. Aquí me tenéis de nuevo con la lección de estadísticos más sofisticados, más avanzados, que se puede realizar en Stata.

Hemos visto con el Stata, que podemos utilizar, aparte una vez ya abierta la base de datos, podemos obtener datos estadísticos descriptivos, a través de la opción Sum, con, también, con el Tabulate.

También hemos visto que podemos ah... ofrecer información a través de los gráficos. Si continuamos viendo las pestañas de la parte superior del programa Stata, vemos que después viene Statistics. Aquí es donde aparecerá, fijaros, como un desplegable com una cantidad inmensa de modelos estadísticos y econométricos a poder realizar. No voy a entrar en detalle en todos y cada uno de ellos, porque esto lo explicará la profesora Isabel Neira en el siguiente módulo y lo único que os puedo decir es que, en... Stata ofrece mucha ayuda para poder realizar cada uno de ellos, que no hace falta que os lo aprendáis de memoria.

Y que si algo se olvida, tenéis la opción Help. Ayuda siempre nos permite, no solamente saber la síntesis del comando que tenemos que aplicar para la realización de alguna regresión o de algún modelo econométrico, sino que a veces también, pues no sabemos que... que palabra, porque encima están en inglés, tenemos que poner en el comando. Imaginaros que queremos saber cuál es la correlación que existe entre dos variables.

Nosotros podemos perfectamente, fijaros aquí que tenemos buscar, le damos a la opción buscar, decimos buscar todo. Y ponemos aquí pues la palabra, por ejemplo, correlation. Ahí. Ahí va. Le damos a Ok y nos dará un listado, como podéis observar, de diferentes comandos donde pueda aparecer la palabra correlation.

Vamos buscando buscando... y decimos: ¡Bingo! ¡Aquí, la he encontrado! Entonces pinchamos, a lo que es, el color azulito. Y entonces, aquí nos explica cuál es la sintaxis de... el comando para analizar la correlación entre dos variables. Aquí lo tenéis sencillamente. Entonces, simplemente deciros que no os asustéis con el Stata. Que permite analizar muchas cosas. Y que... lo que es la opción ayuda, te garantiza, también, el poder no equivocarse, porque a veces dices: Me estoy equivocando y no lo he hecho bien. ¿De acuerdo? Pues lo dicho, los modelos econométricos más difíciles y más avanzados, los vamos a dejar a la profesora Isabel Neira. Y lo dicho, me podéis encontrar para consultas en el foro del curso. Muchas gracias.

Estadísticos más sofisticados

1.0 point possible (ungraded)
¿Qué programa utilizarías para hacer modelos econométricos?

Examen unidad 2

1.0 point possible (graded)
Stat/Transfer…..

problem

1.0 point possible (graded)
¿Qué comando de Stata se utiliza para saber la codificación de una variable?

problem

1.0 point possible (graded)
¿Qué comando de Stata se utiliza para obtener una síntesis de la información de una variable?

problem

1.0 point possible (graded)
El comando sum muestra

problem

1.0 point possible (graded)
Si queremos realizar un modelo econométrico en Stata y no conocemos el comando