Presentación módulo 3


Transcripción

Hola mi nombre es Isabel Leídas soy profesora de economia cuantitativa de la universidad de santiago de compostela y Doctor vinculado a Ingenio, soy la responsable de este módulo tres que como podéis observar se llama modelos Econométricos y lo primero que vamos hacer es introducir el concepto de modelo econométrico o el concepto de regresión, que se desarrollará en las siguientes elecciones de este módulo, como podéis observar vamos a introducir una serie de conceptos que son nuevos a no ser que algunos de vosotros tengais ya conceptos más de estadística, ¿no? son regresión a la media, causalidad, predicción, el tipo de muestras, estas serían los elementos básicos en los que tenemos que fijarnos cuando pensemos en nuestro modelo econométrico o en lo que es la regresión. 


Para empezar vamos a comentar un concepto en sí mismo interesante que es el origen de la palabra Regresión, es un término estadístico luego si tenemos tiempo a lo largo del módulo iremos viendo las diferencias entre la estadística y la econometría, incluso la psicometería o lo que es la modelización, pero la estadística es la base de la econometría es decir lo que hacemos es tomar la regresión que es un término que si Francis Galton introdujo ya hace mucho tiempo para ver la relación que existía entre la estatura de los padres y la de los hijos, todos sabemos que de padres altos también tenemos hijos altos, mientras que cuando los padres son más bajos lo normal es que los hijos sean más bajos, pero no cada vez más bajos o cada vez más altos, es decir, en media tendemos a tener una estatura pues por de de digámoslo así similar en los distintas sociedades, eso se llama regresión y por lo tanto de ahí surgió el término regresión a la media, evidentemente ahora se usa con otras connotaciones pero no quiere decir que no nos olvidemos de que cuando estemos hablando estemos hablando siempre de medias, es decir, nosotros vamos a compor... a explicar un comportamiento medio para toda una población.

Pero para hablar de eso, lo básico qué tenemos que hablar es de causalidad, es decir no podemos hacer una regresión cuando dos variables o dos circunstancias como en este caso sería estatura de los padres y estatura de los hijos no está relacionados, es evidente que en este caso si es un ejemplo para la medicina ¿no? 

Si representamos nuestras variables en lo que nosotros llamamos una nube de puntos lo que hacemos es más o menos crear una recta de regresión, es decir, que lo que hacemos es tomar las matemáticas, definir una recta, la relación entre dos variables y trazarla, evidentemente esto es un concepto muy simple porque si introducimos más de una variable, dos, tres, ya no puedo em... dibujar un plano sino que tendría que dibujar un hiper plano y es mucho más complicado de explicar pero pensemos entonces nuestros ejemplos sencillos: en una variable estatura de los padres y otra variable estatura de los hijos, y eso es lo que sería la recta de regresión.

Que más conceptos son relevantes, para qué sirve eso, es decir, puede servir para ver la relación entre esas dos variables pero también puedo predecir, es decir, volviendo al ejemplo original de la recta de regresión yo podía predecir cómo sería la estatura para un determinado niño cuyo padre mide uno ochenta y una madre mida uno setenta, evidentemente me voy a equivocar y eso nosotros es lo que llamamos errores que son errores de esta edición... de estimación perdón y errores de predicción.

¿Que vamos a pretender hacer? Cometer los menos errores posibles pero al igual que la estadística, cuando hacemos un contraste o cualquier prueba que estemos analizando vamos a cometer errores, eso es evidente, por eso nuestros métodos que ya estoy introduciendo muchas palabras nuevas que veremos a lo largo de estas lecciones, se llaman: Métodos de estimación y métodos de mínimos cuadrados que significa más o menos, minimizar la suma de cuadrados de errores, es decir, no perdamos de vista que vamos a cometer errores, que vamos a hacer una regresión a la media, que vamos a predecir y que lo utilizamos para algo que van a ser lo que nosotros llamamos ámbitos y muestras, es decir, en función de eso los ámbitos y muestras vamos a tener distintos tipos de modelos que nos van a tener que implicar distintas metodologías. 

Bueno por dónde vamos a empezar en este módulo, pues vamos a empezar hablando de modelo clásico, si no hablamos de modelo clásico no entendemos nada de la regresión y no entendemos nada de econometria.

A continuación, aunque no lo vamos a tratar en profundidad, hablaremos un poquito del modelo generalizado, que es con respecto al clásico y ya no vamos a entrar modelos dinámicos o modelos arima, que se refieren a series de tiempo ¿no? 

Como podéis observar en la transparencia, eso se hace más a nivel macro, es decir, si yo quiero estudiar datos económicos ,datos de un país, sería ese nivel, si bajo a un nivel más micro, es decir empresas, personas, el caso de antes de padres e hijos, tenemos que hablar de modelos micro y hay estarían los logic, provi, los datos de recuento, los multinivel, los datos de panel, es evidente que en un módulo de cinco lecciones no vamos a poder hablar de todo esto, hablaremos un poquito de la parte inicial y un poquito de los modelos micro para que tengáis un concepto amplio de lo que es la regresión y de lo que se pueden hacer con los modelos economicos.

Presentación módulo 3

1.0 point possible (ungraded)
¿Cuál es el principal uso de los modelos econométricos?

Conceptos básicos

 Transcripción

Hola soy Isabel Neira, Profesora de economía cuantitativa de la universidad de Santiago de Compostela, Doctor vinculado a Ingenio y responsable de este módulo tres de modelos econométricos en el que vamos a hablar de la lección dos que son conceptos básicos.

Antes de empezar a hablar de algunas cuestiones que hay que conocer para poder hablar de modelos, vamos a señalar que no es objetivo de las lecciones de este curso ni de este módulo enseñar a cómo hacer esto en un programa, es decir, sería complicado explicarlo en tampoco tiempo y explicar todo lo que hay que hacer y además hay un muchos tutoriales en internet como hacer esto en Stata, en Eviews, en Gretl, en un montón de programas.

Además como vamos a ir viendo, voy a ir comentando lo a largo del de la exposición, dependiendo del tipo de metodología que vayamos a usar tenemos que emplear uno u otro programa, con lo cual no nos obsesionemos con la parte mecánica, que habéis aprendido un montón a lo largo de estos módulos por ejemplo a través del Stata o del Spss sino y los conceptos que necesitáis manejar antes de poneros a hacer un modelo econométrico o una estimación y que son esos conceptos, pues esos conceptos son lo que empezamos siempre, cuando hablamos de modelos econométricos, que sería el modelo clásico ¿no? Antes os he hablado en en la introducción del modelo clásico y modelo generalizado, son conceptos que hay que empezar a conocer, es decir el modelo clásico tenemos una expresión matemática que es la ecuación que veis representada en la pantalla.

Como podéis observar tenemos letras griegas, letras más tradicionales la Y, la X y algo muy pequeñito que esta alli a la derecha de todo, que se el Epsilon, que es la perturbación aleatoria, veis que estoy diciendo muchas palabras nuevos. ¿Que son todos estos elementos? Bueno pues eso lo podéis ver, tenéis una pequeñita explicación en el curso, en lo que os explicamos lo que es la variable y, la variable dependiente, la variable x, ¿que son variables? supongo que ya conocemos estos términos de estadística ¿no?

Ahora vamos a ver un ejemplito: Beta son los parámetros, si recordáis lo que hemos comentado en el módulo 1, bueno la la lección uno, Beta va a ser igual para todos, es decir, no es exactamente una media pero es constante para todos los individuos con los que vamos a trabajar y la perturbación aleatoria, que es la culpable de todos los problemas de la econometria o de casi todos ¿no? está perturbacion es la que nos va a definir qué tipo modelos estamos hablando, clásico, generalizado, la que vamos a aproximar a través de los errores, nos olvidéis nunca de la perturbación aleatoria, bueno y b es el subíndice que hace referencia a T a las distintas observaciones, las cuales pueden ser temporales, atemporales, vamos a poner un ejemplo para que veáis, bueno en este ejemplo disponemos de veinticuatro meses de observaciones de las que tenemos datos de y, que nos en este caso le hemos llamado volumen de ventas, vosotros cuando trabajéis con un programa econométrico, estadístico, a las variables no vamos a llamarles y y x, le llamaremos pues como queramos o como nos sea más sencillo, pero a nivel matemático siempre vamos a tener la ecuación, entonces ese ecuación si la vamos expresar como y, x, beta, parámetros, bueno a nivel práctico tenemos el volumen de ventas en función de los gastos de comercialización y del precio de las materias primas.

Como veis es sencillito para tener un ejemplo porque veinticuatro datos realmente no es un modelo econométrico que podáis hacer una investigación o una estimación empírica, simplemente un ejemplo, pero tenemos datos de la variable y, de la variable x y de todas las variables x, es decir, aunque sirvan para predecir o aunque sirvan para causalidad vamos a obtener valores de la variable dependiente, no podemos por decirlo así, inventarnos nuestra variable dependiente, siempre tenemos que tener los datos de todas las variables.

Con esos datos que vamos a hacer, pues haremos una regresión en la que obtendremos unos parámetros que tenéis ahí, está es una salida de uno de los programas de ordenador de Eviews pero hay es muy similar a la que podéis tener en el Gretl, que este sofwer libre o en el Stata, básicamente son los que sirven para hacer modelo clásico o modelos de sencillos. Bueno, ¿que es importante? o ¿que debéis observar? debéis aprender lo que significan estas columnas que tenéis aquí, quizá la más importante y la que sabemos de modo... de momento son los coeficientes, eso esto que está aquí escrito son nuestros parámetros beta de la ecuación estimados a través de un método que se llama de estimación, es decir, estimar consiste obtener el valor de los parámetros.

Bueno no vamos a entrar ahora mismo en lo que significan los t o lo que significa la probabilidad porque eso ya lo veremos más adelante, son contrastes de hipótesis, aquí hay medidas de la bondad de ajuste pero por decirlo así lo que está hay escrito sería todo lo que tenemos que aprender de un modelo econométrico. ¿Cuáles son o cómo podemos hacer para realizar un modelo econométrico?

Tenemos que partir de la teoría, es decir, eso lo hemos explicado en la lección uno, sino disponemos de una teoría que relacione esas variables no tenemos nada que hacer, no podemos inventarnos el modelo, con esa teoría expresamos el modelo matemático, el que estemos hablando, si estamos en series de tiempo, series atemporales, etcétera.

A partir de ahí confrontamos el modelo con la realidad, los datos que hemos puesto en este ejemplitos, es decir, si realmente el volumen de ventas depende de los gastos de comercialización, si esas si tenemos varias soluciones y que son esas soluciones, pues aceptamos la teoría evidentemente si está bien puesta la hipótesis, rechazamos la teoría o podemos buscar, revisar la teoría o también revisar nuestros datos porque probablemente podamos tener errores de muestreo o otros problemas en la estimación. Con esto estaría los conceptos básicos que tenéis que saber de econometría, os recomendó... os recomiendo que utilicéis algún manual, hay varios como el guisan de econometría de Mcgraw Hill o de Guldritz, que su manual básico para aprender estas ideas antes de pasar a la siguiente elección porque vamos a ir hablando de modelos concretos. Cualquier duda que tengáis nos vemos en el foro del curso, muchas gracias.

Conceptos básicos

1.0 point possible (ungraded)
¿Qué obtienes con la regresión?

Hipótesis, contrastes, métodos de estimación

 Transcripción

Hola soy Isabel Neira, Profesor de Economía Cuantitativa de la universidad de Santiago de Compostela y Doctor vinculado a Ingenio, soy la responsable del módulo tres, de modelos econométricos y en esta lección tres vamos a hablar de unos, de algunos de los conceptos básicos
que vais a tener que estudiar o analizar antes de poneros a estimar un modelo econométrico que como hemos visto en la lección anterior, consiste en obtener los valores de sus parámetros beta, que relacionan la y con la x que viene a ser el objetivo de la econometría o de los modelos por decirlo de una manera resumida. ¿Que tenemos que saber al habla a modelos o que tenéis que estudia previamente antes de poneros a estimar en un programa de ordenador que como os he comentado en el módulo anterior, antes de poneros con el programita a sacar los valores de los beta y a sacar la esa relación, lo primero que tenemos que ver es qué tipo de relación estámos, que modelo tenemos que estimar. Bueno para ello tenemos una serie de hipótesis, contrastes, métodos de estimacion, propiedades de los estimadores, propiedades del modelo, que como podéis observar son muchas cosas que hay que estudiarse o analizar un poquito, para hacer un poquito de luz sobre este tema vamos a comentar algunas de estas cuestiones, como os hemos comentado o como habíamos visto en el apartado anterior, en la lección anterior, uno de los elementos más importantes es la perturbación aleatoria, entonces esa perturbación que está aquí arriba es la épsilon, esa épsilon tiene una serie de hipótesis que primero vamos a suponer que se cumple. ¿Que hipótesis son esas?

Pues son hipótesis matemáticas, de esperanza nula, homocedasticidad, incorrelación, estas dos últimas son muy importantes porque se pueden ver matricialmente a través de una única hipótesis, a través de la de la hipotesis de la V de épsilon y van a implicar que estemos hablando de un modelo clásico, de un modelo generalizado y también tenemos hipótesis referidas a los regresores que tienen que cumplirse, es decir, primero tenemos que ver si estamos en un modelo clásico o estamos en un modelo generalizado ¿no? 

Una vez que sepamos eso podremos utilizar algún método de estimación pero antes de llegar a un modelo econométrico lo primero que tenemos que hacer y que vais a ver en algunos de los módulos de este curso es el análisis descriptivo de las variables, nunca se puede estimar un modelo econométrico sin ver antes la correlación que quiero decir con eso, volviendo al ejemplo que teníamos de padres a hijos, lo normal es que la correlación entre la estatura los padres y la estatura de los hijos pues sea de cero ochenta o de cero noventa, si existe esa correlación puedo verla, ir un poquito más analizar a través del modelo la causalidad y ver en qué medida afecta el incremento de la estatura de los padres en la estatura de los hijos, es decir, si los padres fueran cinco centímetros más altos ¿Cuanto de altos más serían los hijos? pero para eso tengo que ver siempre el análisis descriptivo previo a las estimaciones, eso es básico, no me puedo poner a hacer una regresión sin antes analizar bien los datos y ver en qué consiste, no lo vamos a hacer aquí evidentemente por falta de tiempo.

Una vez que llegamos ya la estimación, que es lo que vimos antes, tenemos los parámetros, ese coeficiente que teníamos ahí, los beta que significan por ejemplo cuando aumento en una unidad la variable gastos de comercialización, la variable y aumenta en tantas unidades, es decir, la relación de la Y con las X, todo esto va a depender de las unidades de medida si estamos en logaritmos, si son miles, si son millones, si el tipo de modelo es lineal, si no es lineal, es decir de muchas serie de elementos, por eso no vamos a explicar exactamente aquí en qué consiste el beta porque dependiendo del tipo de metodología, del tipo de método que este estimando significa una cosa u otra, hay que tener mucho cuidado con eso y además cuando estamos hablando de estimaciones en este caso, por ejemplo es una muestra de veinticuatro meses podemos tener unas serie de problemas, unos y no otros, en este caso por ejemplo tenemos tres variables: explicativas gastos de comercialización, precio de la ma... del de precios y precios de las materias primas, esas variables van a tener una correlación, es decir, cuanto más gastos de comercialización tengo será porque vendo más y será porque también tengo más costes de personal o porque también tengo más costes de materias primas porque mi empresa es más grande por lógica ¿no?

Si veo los coeficientes de correlación y son altos no pasaría nada porque haya un coeficiente de correlación alto de  la Y con las X, eso no es que no pasa nada es que es genial, es como tiene que ser un coeficiente de correlación alto, que pasa que cuando yo hago mis modelos de regresión entre estas variables que son las explicativas también hay correlación, en economía, en medicina y en cualquier ciencia social o ciencia experimental, porque todas las variables están relacionadas.

Que quiero decir eso, que voy a tener problemas y eso es lo que nos condiciona pues el método de estimación que vamos a hacer, qué problemas vamos a tener, pues los más frecuentes son la autocorrelación que básicamente consiste en correlación entre los términos de la perturbación aleatoria y que provoca problemas en la estimación que tenemos que corregir, se da muestras temporales, es decir si yo lo que tengo son datos de familias o datos de empresas no tengo autocorrelación tendré otro problema que se llama heterocedasticidad. ¿Cuando será la heterocedasticidad?

Pues cuando no son todas las muestras iguales, es decir, por ejemplo si yo analizo el consumo en función de la renta supongo que seamos conscientes de que habrá familias con rentas altas y medias y bajas y no se comportan igual, eso hace que la perturbación aleatoria se comporte también diferente y provoque problemas como el de la heterocedasticidad que también os adelanto tiene solución, todo tiene solución, sólo que hay que buscarsela ¿no?

Y un problema también importante econometría y que vamos a ver en la siguentes dos elecciones es el de la multicolinealidad, es lo que acabamos de comentar, como las variables están relacionadas, siempre va a haber problemas siempre hay multicolinealidad, lo importante es el grado de multicolinealidad y si eso me está provocando que realmente mi estimación no sea válida o que se incorrecta o que tenga que omitir e introducir variables, eso nos lleva a un concepto del que no hemos hablado y con el que acabamos esta elección que es el número de variables, no hay un número de variables óptimo, ni un número de muestra pues mínimo, depende de si estamos hablando de serie temporal, de series atemporales, de series mixtas, cada tipo de estimación y cada tipo de modelo implica una mmm digamos muestra más pequeña o más grande y implicaría un tipo de problemática que tengamos que analizar, no vamos a tener que estudiar todo en todo, es decir, tenemos que definir primero cuál es nuestra muestra y cuáles son los problemas que se están planteando. Con esto acabaríamos estas hipótesis, contrastes  y métodos que son básicos para aprender a hacer la modelización econométrica, os espero en el foro si tenéis alguna duda, muchas gracias.

Hipótesis, contrastes, métodos de estimación

1.0 point possible (ungraded)
La perturbación aleatoria:

Modelos con variable dependiente cualitativa

 Transcripción

Hola soy Isabel Neira, profesora de economía cuantitativa de la universidad Santiago Compostela y doctor vinculado a ingenio.

En este módulo tres de modelos econométricos y en elección cuatro, vamos a empezar con un caso concreto que son los modelos con variable dependiente cualitativa, supongo que a estas alturas de curso o módulo ya sabemos que variable es una de las que estamos estudiando la dependiente es nuestra variable "Y" o nuestra variable a explicar y en este caso son variables que toma valores cualitativos, ¿que son esos valores? Pues por ejemplo, el hecho de estar feliz o no feliz o estar en una escala de felicidad de uno a diez que es una de las cosas que nosotros por ejemplo estudiamos a nivel empírico.

Si esto es una variable explicativa podríamos usar los métodos que hemos explicado en la lección anterior modelo clásico modelo generalizado, sin ningún problema, pero si esa variable dicotómica es por ejemplo cero uno tendríamos que usar un modelo como los logit y los probit, si es ordinal una escala de uno a diez como estábamos hablando en la que se señala el nivel de satisfacción, es decir, uno dos tres cuatro cinco seis cada vez más feliz pero tampoco sabemos exactamente si la distancia del uno al dos es la misma, que por ejemplo tener un euro o dos euros que si sabemos tenemos muy clara cuál es la distancia entre el uno y el dos.

La distancia entre entre una escala de medida el liquer o de cualquier otro tipo de sicología o de las que usamos para medir en términos de marketing, es más complicada tendríamos usar en este caso por ejemplo logit ordenado.

Tenemos varias posibilidades sin orden volvemos a un ejemplo de consumo, consumir la leche A la leche B la leche C para todos los productos tendremos que era un logit multinomial. Si esas variables son datos de recuento, por ejemplo, una empresa contratada un trabajador, dos trabajadores tres trabajadores, es decir un número concreto de personas de trabajadores que es diferente a estar poco satisfecho o muy satisfecho tendríamos que ir a las modelos que se llaman datos de recuento negint.

Si tenemos variables con distintos niveles jerárquicos por ejemplo un alumno que pertenece a una escuela el alumno a nivel individual, la escuela es un nivel jerárquico superior, su comunidad autónoma es otro nivel jerárquico superior, y el país es otro nivel jerárquico. Estaríamos hablando de multinivel sólo con variable dependiente cualitativa como podéis observar aquí tenemos una batería de modelos que tendríamos que estudiar, qué es lo relevante, saber cuál es la variable dependiente porque si yo estoy trabajando con datos descuento encuesta lo más normal es que me enfrenté a este tipo de modelos y sean los que tengan que estudiar. Evidentemente después de haber estudiado la lección la uno la dos y la tres de que son los modelos econométricos hipótesis etcétera.

Vamos a ver un poquito muy por encima qué significa esto de los modelos logit y probit de la probabilidad. Pues básicamente aunque no hemos visto mucha profundidad los modelos anteriores era cada vez que incrementa en una unidad la variable, por ejemplo, renta consumo más eso es el beta que tenéis aquí explicados decir en el caso anterior decíamos cada vez que aumente la estatura del padre es decir padres de cero cinco o de un centímetro pues aumentará la de los hijos en tanto aquí no. Porque como podéis observar aquí lo tenéis en el texto si queréis profundizar un poquito más,
estamos hablando de probabilidades y eso sí que es algo importante estamos hablando de probabilidades de que un evento sucedan términos estadísticos supongo que os acordáis de aquello que estudiamos de cuando tiene un dado probabilidad de que caiga la cara a o la cara b. Pues esto es lo mismo por ejemplo en este caso concreto vamos a poner una familia, que se compra una vivienda
la familia compra la vivienda uno o C estamos de acuerdo no bueno porque si es cero sería que alquiló que no la tiene pero yo no voy a tratar de estimar obtener el valor de esa familia se compra una vivienda sino la probabilidad de que la familia la compre. Eso es importante, no vamos a tener certezas sino probabilidades son modelos lo en los que la relación causal es completamente diferente.

Bueno por términos estadísticos que no vamos a profundizar aquí. Podemos estimar por mínimos cuadrados ordinarios lo que hemos visto en la recta en el módulo anterior, podemos hacer una relación lineal, si os acordáis de la recta de regresión que colocamos cuál es el problema que sin este eje tenemos el cero y si en este eje tenemos el 1 no hay nube de puntos como no hay nube de puntos
no podemos trazar una recta y decir es una relación lineal poder podemos pero el error que cometemos es bastante grande.

¿Que han hecho los estadísticos, los economistas, para solucionar esto? Han aproximado otras funciones como por ejemplo aquí tenemos esta que va haciendo uso una onda que esto implicaría que no es una relación lineal sino que para valores pequeños de x es decir cuando estoy en esta parte del eje cuando mi salario mensual es pequeñito. Vamos a suponer pues quinientos euros no me voy a comprar una casa a medida que voy aumentando mi nivel de renta. Voy a tener más probabilidades de comprar una casa, pero llega a un punto que, por ejemplo, si gano más de cinco mil euros al mes pues da igual que ganen cinco mil diez mil y quince mil. Voy a tener una casa esa es la idea la recta no es lineal se adapta mejor al tipo de datos y por lo tanto estamos, por ejemplo el modelo logit como hemos visto antes pueden ser probit otros muchas tipos de estimaciones.

Sin embargo a la hora de sacar esto un programa econométrico prácticamente los resultados como podéis observar en la tabla son los mismos es decir tengo coeficientes, estándar error, probabilidades, contrastes. Voy a tener que hacer contrastes dependiendo del tipo de muestra que esté haciendo en este caso no tengo que analizar por ejemplo autocorrelación, la heterocedasticidad podría ser un problema y aquí no porque sólo tengo una variable pero si tuviera más de una debería de analizar la probabilidad si veis aquí abajo tengo probabilidades observaciones con variable dependiente cero y uno diecinueve y veintiuno en este ejemplo concreto tendría que ver la probabilidad de equivocarme cuando digo que compra una casa o cuando no la compra.

Este sería un ejemplo de cómo hacer un modelo de datos de variable dependiente cuando cualitativa que son complejos son una metodología específica, que podéis seguir estudiando si vais a trabajar con datos de encuestas por ejemplo es muy importante con esto sería todo. Muchas gracias. Cualquier duda nos vemos.

Modelos con variable dependiente cualitativa

1.0 point possible (ungraded)
Cuando la variable dependiente es cualitativa:

Datos de panel

 

 Transcripción

En esta última elección del módulo tres modelos econométricos vamos a ver otro ejemplo de una metodología, más bien de un tipo de muestras que se usa mucho en la investigación empírica que prácticamente desde los años noventa o bueno finales de los noventa es una metodología reciente pero que ya se ha desarrollado mucho y que nos ayuda bastante a la hora de interpretarlos datos.

Porque como hemos visto antes hemos comentado que dependiendo de la muestra usar una u otra
metodología, entonces lo primero que vamos a hacer aquí que es que son los datos de panel, si tenemos disponibilidad de datos de panel de ordenadores y programas y si merece la pena el esfuerzo, de aprender esta metodología que eso va a ser lo que esto que a partir de este módulo profundizar en él. Que son datos de panel, pues básicamente cuando tenemos las muestras se como os acordáis de las elecciones anteriores los tipos demuestra que nosotros podemos tener son temporales que es una muestra temporal por una muestra temporal es evidentemente de años, dias, meses, etcétera y una muestra temporal es aquella que tenemos familias empresas. Que son los datos de panel por la mezcla de la parte temporal y la parte temporal existe en datos de panel en programas de ordenadores pues si cualquier programa tiene las comandos para poder hacerlos StarUp tiene toda el desarrollo, para datos de panel incluso para datos de panel dinámicos y cualquier tipo de estimación que queramos hacer el econometric vius también, es un programa que estima los datos de panel cret que como os comentaba antes. Es un un sofware libre merece la pena el esfuerzo pues como decía también a lo largo de este módulo, va a depender mucho de lo que queráis hacer porque la econometría es muy amplia y no nos podemos aprender todas las metodologías.

Yo os recomendaría que aprendáis aquellas metodologías que son útiles para nuestros datos, es decir, si tengo muestras pequeñas o muestras repetidas a lo largo del tiempo y tengo un panel pues entoces aprendo la metodología, tiene un libro específicamente dedicado a datos de panel en stata en el que se puede ir aprendiendo paso a paso, con más o menos, lo que son los datos de panel que esto es un poquito más complicado no voy a profundizar mucho pero como podéis ver aquí la ecuación se convierte en algo más largo que tiene sus índices de tiempo. y subíndices despacio y se refiere a la parte espacial, es decir atemporal, personas, empresas, por eso varía desde i igual a uno hasta ene y es la parte del tiempo que varía desde uno hasta t, es decir puede tener por ejemplo cuatro familias a lo largo de diez años cinco familias etcétera.

Para que estaban pensados originalmente los datos de panel pues estaban pensados para ene suficientemente grande y t pequeño es decir si yo tengo una muestra, por ejemplo, de España vamos a ver datos de cualquier variable cinco años con cinco años no puedo hacer una causalidad una serie temporal pero si cojo todos los países de la unión europea ya tengo un n pues más grande, para mí T pequeñito que son cinco años.

Es decir, cuarenta países por cinco años por son doscientos datos que es una muestra suficientemente grande y tenía un panel, voy a tener por ejemplo si analizo países pues voy a tener efectos que nosotros llamamos en economía, por ejemplo, efectos fijos que son hay efectos para cada individuo invariantes en el tiempo y hay efectos temporales invariantes entre los individuos.

Esos efectos fijos por ejemplo que sería pues serían el caso de que yo analizo que paises es o comunidades autónomas hay algo que hace que España o que la comunidad x que sea o la región x se comporte de manera diferente a las otras porque porque históricamente por las condiciones culturales etcétera. A eso le vamos a llamar efectos fijos efectos fijos esos efectos pueden ser también aleatorios esa es la base de los datos de panel. Prácticamente en economía se usaban casi siempre efectos fijos porque estamos suponiendo que se comportamiento de las países o de las regiones va a la ordenada al origen y por lo tanto es fijo.

Los efectos aleatorios son cuando con no conocemos la muestra de la que procede si son datos de encuesta y otro tipo de datos pero también hay contrastes como contraste de Hausman que nos permiten saber si estamos en efectos fijos o efectos aleatorios. Viendo un ejemplo pues aquí tenéis un ejemplo sencillo y los que tenemos costes de personal y empresa tenemos aquí una dos tres cuatro empresas y una serie de años si sólo tenemos cuatro empresas o sólo tenemos cinco años es una serie muy pequeña. Cuando juntamos toda como podéis ver aquí el número de observaciones crece y entoces podemos hacer una estimación más compleja que sería la de datos de panel. No debemos olvidarnos siempre que cuando eliminemos una fila se eliminan todas las variables es decir si no tengo datos alguna de las variables explicativas, me va a desaparecer de la regresión. Eso es importante que tengáis en cuenta, porque datos de panel uno de los elementos más importantes
si estamos hablando de paneles balance. Bueno porque casi todos prestan inglés equilibrados o desequilibrados balance que significa eso por ejemplo. En este caso que estamos analizando aquí es equilibrado porque tenemos los mismos datos de todos los años para las mismas empresas, no es necesario puedo tener para España, por ejemplo, tres datos y para Holanda diez datos y para el Reino Unido cinco datos, cinco periodos temporales es sería un panel desequilibrado que requiere buenos métodos de estimación más complejos.

Si la serie temporal como está aquí es pues más con períodos no no correlativos en el tiempo como está aquí ochenta y cinco noventa noventa y cinco noventa, podemos hacer un panel si la serie de años es correlativa también depende un poco de como estamos trabajando con la muestra y volviendo al ejemplo de ello que sacamos de los programas informáticos.

Aquí por ejemplo es unas volvemos a tener una salida de regresión en este caso del virus de star es similar en la que volvemos a tener los coeficientes el estándar error estadístico la probabilidad. Como hablamos al principio de los módulos eso es lo principal que hay que saber lo primero que hay que saber la bondad del ajuste. Siempre estamos utilizando medidas similares, es decir, compensa entonces aprender el modelo clásico la regresión los contrastes hipótesis las propiedades de los estimadores y luego ir complicando un poco las metodologías. Si estoy estudiando modelos logit p sí estoy estudiando datos de panel cómo sería en este caso. Esto es todo lo que queríamos comentar sobre datos de panel para tener una pequeña una pincelada.

 Gracias, cualquier cosa nos vemos en en el foro del curso.

Datos de panel

1.0 point possible (ungraded)
Los datos de panel:

Examen unidad 3

1.0 point possible (graded)
¿Cuál es el principal uso de los modelos econométricos?

problem

1.0 point possible (graded)
El modelo clásico

problem

1.0 point possible (graded)
Las hipótesis del modelo

problem

1.0 point possible (graded)
Los modelos logit y probit

problem

1.0 point possible (graded)
Los datos de panel

Módulo 3: Modelos Econométricos



Presentación módulo 3


Transcripción

Hola mi nombre es Isabel Leídas soy profesora de economia cuantitativa de la universidad de santiago de compostela y Doctor vinculado a Ingenio, soy la responsable de este módulo tres que como podéis observar se llama modelos Econométricos y lo primero que vamos hacer es introducir el concepto de modelo econométrico o el concepto de regresión, que se desarrollará en las siguientes elecciones de este módulo, como podéis observar vamos a introducir una serie de conceptos que son nuevos a no ser que algunos de vosotros tengais ya conceptos más de estadística, ¿no? son regresión a la media, causalidad, predicción, el tipo de muestras, estas serían los elementos básicos en los que tenemos que fijarnos cuando pensemos en nuestro modelo econométrico o en lo que es la regresión. 


Para empezar vamos a comentar un concepto en sí mismo interesante que es el origen de la palabra Regresión, es un término estadístico luego si tenemos tiempo a lo largo del módulo iremos viendo las diferencias entre la estadística y la econometría, incluso la psicometería o lo que es la modelización, pero la estadística es la base de la econometría es decir lo que hacemos es tomar la regresión que es un término que si Francis Galton introdujo ya hace mucho tiempo para ver la relación que existía entre la estatura de los padres y la de los hijos, todos sabemos que de padres altos también tenemos hijos altos, mientras que cuando los padres son más bajos lo normal es que los hijos sean más bajos, pero no cada vez más bajos o cada vez más altos, es decir, en media tendemos a tener una estatura pues por de de digámoslo así similar en los distintas sociedades, eso se llama regresión y por lo tanto de ahí surgió el término regresión a la media, evidentemente ahora se usa con otras connotaciones pero no quiere decir que no nos olvidemos de que cuando estemos hablando estemos hablando siempre de medias, es decir, nosotros vamos a compor... a explicar un comportamiento medio para toda una población.

Pero para hablar de eso, lo básico qué tenemos que hablar es de causalidad, es decir no podemos hacer una regresión cuando dos variables o dos circunstancias como en este caso sería estatura de los padres y estatura de los hijos no está relacionados, es evidente que en este caso si es un ejemplo para la medicina ¿no? 

Si representamos nuestras variables en lo que nosotros llamamos una nube de puntos lo que hacemos es más o menos crear una recta de regresión, es decir, que lo que hacemos es tomar las matemáticas, definir una recta, la relación entre dos variables y trazarla, evidentemente esto es un concepto muy simple porque si introducimos más de una variable, dos, tres, ya no puedo em... dibujar un plano sino que tendría que dibujar un hiper plano y es mucho más complicado de explicar pero pensemos entonces nuestros ejemplos sencillos: en una variable estatura de los padres y otra variable estatura de los hijos, y eso es lo que sería la recta de regresión.

Que más conceptos son relevantes, para qué sirve eso, es decir, puede servir para ver la relación entre esas dos variables pero también puedo predecir, es decir, volviendo al ejemplo original de la recta de regresión yo podía predecir cómo sería la estatura para un determinado niño cuyo padre mide uno ochenta y una madre mida uno setenta, evidentemente me voy a equivocar y eso nosotros es lo que llamamos errores que son errores de esta edición... de estimación perdón y errores de predicción.

¿Que vamos a pretender hacer? Cometer los menos errores posibles pero al igual que la estadística, cuando hacemos un contraste o cualquier prueba que estemos analizando vamos a cometer errores, eso es evidente, por eso nuestros métodos que ya estoy introduciendo muchas palabras nuevas que veremos a lo largo de estas lecciones, se llaman: Métodos de estimación y métodos de mínimos cuadrados que significa más o menos, minimizar la suma de cuadrados de errores, es decir, no perdamos de vista que vamos a cometer errores, que vamos a hacer una regresión a la media, que vamos a predecir y que lo utilizamos para algo que van a ser lo que nosotros llamamos ámbitos y muestras, es decir, en función de eso los ámbitos y muestras vamos a tener distintos tipos de modelos que nos van a tener que implicar distintas metodologías. 

Bueno por dónde vamos a empezar en este módulo, pues vamos a empezar hablando de modelo clásico, si no hablamos de modelo clásico no entendemos nada de la regresión y no entendemos nada de econometria.

A continuación, aunque no lo vamos a tratar en profundidad, hablaremos un poquito del modelo generalizado, que es con respecto al clásico y ya no vamos a entrar modelos dinámicos o modelos arima, que se refieren a series de tiempo ¿no? 

Como podéis observar en la transparencia, eso se hace más a nivel macro, es decir, si yo quiero estudiar datos económicos ,datos de un país, sería ese nivel, si bajo a un nivel más micro, es decir empresas, personas, el caso de antes de padres e hijos, tenemos que hablar de modelos micro y hay estarían los logic, provi, los datos de recuento, los multinivel, los datos de panel, es evidente que en un módulo de cinco lecciones no vamos a poder hablar de todo esto, hablaremos un poquito de la parte inicial y un poquito de los modelos micro para que tengáis un concepto amplio de lo que es la regresión y de lo que se pueden hacer con los modelos economicos.

Presentación módulo 3

1.0 point possible (ungraded)
¿Cuál es el principal uso de los modelos econométricos?

Conceptos básicos

 Transcripción

Hola soy Isabel Neira, Profesora de economía cuantitativa de la universidad de Santiago de Compostela, Doctor vinculado a Ingenio y responsable de este módulo tres de modelos econométricos en el que vamos a hablar de la lección dos que son conceptos básicos.

Antes de empezar a hablar de algunas cuestiones que hay que conocer para poder hablar de modelos, vamos a señalar que no es objetivo de las lecciones de este curso ni de este módulo enseñar a cómo hacer esto en un programa, es decir, sería complicado explicarlo en tampoco tiempo y explicar todo lo que hay que hacer y además hay un muchos tutoriales en internet como hacer esto en Stata, en Eviews, en Gretl, en un montón de programas.

Además como vamos a ir viendo, voy a ir comentando lo a largo del de la exposición, dependiendo del tipo de metodología que vayamos a usar tenemos que emplear uno u otro programa, con lo cual no nos obsesionemos con la parte mecánica, que habéis aprendido un montón a lo largo de estos módulos por ejemplo a través del Stata o del Spss sino y los conceptos que necesitáis manejar antes de poneros a hacer un modelo econométrico o una estimación y que son esos conceptos, pues esos conceptos son lo que empezamos siempre, cuando hablamos de modelos econométricos, que sería el modelo clásico ¿no? Antes os he hablado en en la introducción del modelo clásico y modelo generalizado, son conceptos que hay que empezar a conocer, es decir el modelo clásico tenemos una expresión matemática que es la ecuación que veis representada en la pantalla.

Como podéis observar tenemos letras griegas, letras más tradicionales la Y, la X y algo muy pequeñito que esta alli a la derecha de todo, que se el Epsilon, que es la perturbación aleatoria, veis que estoy diciendo muchas palabras nuevos. ¿Que son todos estos elementos? Bueno pues eso lo podéis ver, tenéis una pequeñita explicación en el curso, en lo que os explicamos lo que es la variable y, la variable dependiente, la variable x, ¿que son variables? supongo que ya conocemos estos términos de estadística ¿no?

Ahora vamos a ver un ejemplito: Beta son los parámetros, si recordáis lo que hemos comentado en el módulo 1, bueno la la lección uno, Beta va a ser igual para todos, es decir, no es exactamente una media pero es constante para todos los individuos con los que vamos a trabajar y la perturbación aleatoria, que es la culpable de todos los problemas de la econometria o de casi todos ¿no? está perturbacion es la que nos va a definir qué tipo modelos estamos hablando, clásico, generalizado, la que vamos a aproximar a través de los errores, nos olvidéis nunca de la perturbación aleatoria, bueno y b es el subíndice que hace referencia a T a las distintas observaciones, las cuales pueden ser temporales, atemporales, vamos a poner un ejemplo para que veáis, bueno en este ejemplo disponemos de veinticuatro meses de observaciones de las que tenemos datos de y, que nos en este caso le hemos llamado volumen de ventas, vosotros cuando trabajéis con un programa econométrico, estadístico, a las variables no vamos a llamarles y y x, le llamaremos pues como queramos o como nos sea más sencillo, pero a nivel matemático siempre vamos a tener la ecuación, entonces ese ecuación si la vamos expresar como y, x, beta, parámetros, bueno a nivel práctico tenemos el volumen de ventas en función de los gastos de comercialización y del precio de las materias primas.

Como veis es sencillito para tener un ejemplo porque veinticuatro datos realmente no es un modelo econométrico que podáis hacer una investigación o una estimación empírica, simplemente un ejemplo, pero tenemos datos de la variable y, de la variable x y de todas las variables x, es decir, aunque sirvan para predecir o aunque sirvan para causalidad vamos a obtener valores de la variable dependiente, no podemos por decirlo así, inventarnos nuestra variable dependiente, siempre tenemos que tener los datos de todas las variables.

Con esos datos que vamos a hacer, pues haremos una regresión en la que obtendremos unos parámetros que tenéis ahí, está es una salida de uno de los programas de ordenador de Eviews pero hay es muy similar a la que podéis tener en el Gretl, que este sofwer libre o en el Stata, básicamente son los que sirven para hacer modelo clásico o modelos de sencillos. Bueno, ¿que es importante? o ¿que debéis observar? debéis aprender lo que significan estas columnas que tenéis aquí, quizá la más importante y la que sabemos de modo... de momento son los coeficientes, eso esto que está aquí escrito son nuestros parámetros beta de la ecuación estimados a través de un método que se llama de estimación, es decir, estimar consiste obtener el valor de los parámetros.

Bueno no vamos a entrar ahora mismo en lo que significan los t o lo que significa la probabilidad porque eso ya lo veremos más adelante, son contrastes de hipótesis, aquí hay medidas de la bondad de ajuste pero por decirlo así lo que está hay escrito sería todo lo que tenemos que aprender de un modelo econométrico. ¿Cuáles son o cómo podemos hacer para realizar un modelo econométrico?

Tenemos que partir de la teoría, es decir, eso lo hemos explicado en la lección uno, sino disponemos de una teoría que relacione esas variables no tenemos nada que hacer, no podemos inventarnos el modelo, con esa teoría expresamos el modelo matemático, el que estemos hablando, si estamos en series de tiempo, series atemporales, etcétera.

A partir de ahí confrontamos el modelo con la realidad, los datos que hemos puesto en este ejemplitos, es decir, si realmente el volumen de ventas depende de los gastos de comercialización, si esas si tenemos varias soluciones y que son esas soluciones, pues aceptamos la teoría evidentemente si está bien puesta la hipótesis, rechazamos la teoría o podemos buscar, revisar la teoría o también revisar nuestros datos porque probablemente podamos tener errores de muestreo o otros problemas en la estimación. Con esto estaría los conceptos básicos que tenéis que saber de econometría, os recomendó... os recomiendo que utilicéis algún manual, hay varios como el guisan de econometría de Mcgraw Hill o de Guldritz, que su manual básico para aprender estas ideas antes de pasar a la siguiente elección porque vamos a ir hablando de modelos concretos. Cualquier duda que tengáis nos vemos en el foro del curso, muchas gracias.

Conceptos básicos

1.0 point possible (ungraded)
¿Qué obtienes con la regresión?

Hipótesis, contrastes, métodos de estimación

 Transcripción

Hola soy Isabel Neira, Profesor de Economía Cuantitativa de la universidad de Santiago de Compostela y Doctor vinculado a Ingenio, soy la responsable del módulo tres, de modelos econométricos y en esta lección tres vamos a hablar de unos, de algunos de los conceptos básicos
que vais a tener que estudiar o analizar antes de poneros a estimar un modelo econométrico que como hemos visto en la lección anterior, consiste en obtener los valores de sus parámetros beta, que relacionan la y con la x que viene a ser el objetivo de la econometría o de los modelos por decirlo de una manera resumida. ¿Que tenemos que saber al habla a modelos o que tenéis que estudia previamente antes de poneros a estimar en un programa de ordenador que como os he comentado en el módulo anterior, antes de poneros con el programita a sacar los valores de los beta y a sacar la esa relación, lo primero que tenemos que ver es qué tipo de relación estámos, que modelo tenemos que estimar. Bueno para ello tenemos una serie de hipótesis, contrastes, métodos de estimacion, propiedades de los estimadores, propiedades del modelo, que como podéis observar son muchas cosas que hay que estudiarse o analizar un poquito, para hacer un poquito de luz sobre este tema vamos a comentar algunas de estas cuestiones, como os hemos comentado o como habíamos visto en el apartado anterior, en la lección anterior, uno de los elementos más importantes es la perturbación aleatoria, entonces esa perturbación que está aquí arriba es la épsilon, esa épsilon tiene una serie de hipótesis que primero vamos a suponer que se cumple. ¿Que hipótesis son esas?

Pues son hipótesis matemáticas, de esperanza nula, homocedasticidad, incorrelación, estas dos últimas son muy importantes porque se pueden ver matricialmente a través de una única hipótesis, a través de la de la hipotesis de la V de épsilon y van a implicar que estemos hablando de un modelo clásico, de un modelo generalizado y también tenemos hipótesis referidas a los regresores que tienen que cumplirse, es decir, primero tenemos que ver si estamos en un modelo clásico o estamos en un modelo generalizado ¿no? 

Una vez que sepamos eso podremos utilizar algún método de estimación pero antes de llegar a un modelo econométrico lo primero que tenemos que hacer y que vais a ver en algunos de los módulos de este curso es el análisis descriptivo de las variables, nunca se puede estimar un modelo econométrico sin ver antes la correlación que quiero decir con eso, volviendo al ejemplo que teníamos de padres a hijos, lo normal es que la correlación entre la estatura los padres y la estatura de los hijos pues sea de cero ochenta o de cero noventa, si existe esa correlación puedo verla, ir un poquito más analizar a través del modelo la causalidad y ver en qué medida afecta el incremento de la estatura de los padres en la estatura de los hijos, es decir, si los padres fueran cinco centímetros más altos ¿Cuanto de altos más serían los hijos? pero para eso tengo que ver siempre el análisis descriptivo previo a las estimaciones, eso es básico, no me puedo poner a hacer una regresión sin antes analizar bien los datos y ver en qué consiste, no lo vamos a hacer aquí evidentemente por falta de tiempo.

Una vez que llegamos ya la estimación, que es lo que vimos antes, tenemos los parámetros, ese coeficiente que teníamos ahí, los beta que significan por ejemplo cuando aumento en una unidad la variable gastos de comercialización, la variable y aumenta en tantas unidades, es decir, la relación de la Y con las X, todo esto va a depender de las unidades de medida si estamos en logaritmos, si son miles, si son millones, si el tipo de modelo es lineal, si no es lineal, es decir de muchas serie de elementos, por eso no vamos a explicar exactamente aquí en qué consiste el beta porque dependiendo del tipo de metodología, del tipo de método que este estimando significa una cosa u otra, hay que tener mucho cuidado con eso y además cuando estamos hablando de estimaciones en este caso, por ejemplo es una muestra de veinticuatro meses podemos tener unas serie de problemas, unos y no otros, en este caso por ejemplo tenemos tres variables: explicativas gastos de comercialización, precio de la ma... del de precios y precios de las materias primas, esas variables van a tener una correlación, es decir, cuanto más gastos de comercialización tengo será porque vendo más y será porque también tengo más costes de personal o porque también tengo más costes de materias primas porque mi empresa es más grande por lógica ¿no?

Si veo los coeficientes de correlación y son altos no pasaría nada porque haya un coeficiente de correlación alto de  la Y con las X, eso no es que no pasa nada es que es genial, es como tiene que ser un coeficiente de correlación alto, que pasa que cuando yo hago mis modelos de regresión entre estas variables que son las explicativas también hay correlación, en economía, en medicina y en cualquier ciencia social o ciencia experimental, porque todas las variables están relacionadas.

Que quiero decir eso, que voy a tener problemas y eso es lo que nos condiciona pues el método de estimación que vamos a hacer, qué problemas vamos a tener, pues los más frecuentes son la autocorrelación que básicamente consiste en correlación entre los términos de la perturbación aleatoria y que provoca problemas en la estimación que tenemos que corregir, se da muestras temporales, es decir si yo lo que tengo son datos de familias o datos de empresas no tengo autocorrelación tendré otro problema que se llama heterocedasticidad. ¿Cuando será la heterocedasticidad?

Pues cuando no son todas las muestras iguales, es decir, por ejemplo si yo analizo el consumo en función de la renta supongo que seamos conscientes de que habrá familias con rentas altas y medias y bajas y no se comportan igual, eso hace que la perturbación aleatoria se comporte también diferente y provoque problemas como el de la heterocedasticidad que también os adelanto tiene solución, todo tiene solución, sólo que hay que buscarsela ¿no?

Y un problema también importante econometría y que vamos a ver en la siguentes dos elecciones es el de la multicolinealidad, es lo que acabamos de comentar, como las variables están relacionadas, siempre va a haber problemas siempre hay multicolinealidad, lo importante es el grado de multicolinealidad y si eso me está provocando que realmente mi estimación no sea válida o que se incorrecta o que tenga que omitir e introducir variables, eso nos lleva a un concepto del que no hemos hablado y con el que acabamos esta elección que es el número de variables, no hay un número de variables óptimo, ni un número de muestra pues mínimo, depende de si estamos hablando de serie temporal, de series atemporales, de series mixtas, cada tipo de estimación y cada tipo de modelo implica una mmm digamos muestra más pequeña o más grande y implicaría un tipo de problemática que tengamos que analizar, no vamos a tener que estudiar todo en todo, es decir, tenemos que definir primero cuál es nuestra muestra y cuáles son los problemas que se están planteando. Con esto acabaríamos estas hipótesis, contrastes  y métodos que son básicos para aprender a hacer la modelización econométrica, os espero en el foro si tenéis alguna duda, muchas gracias.

Hipótesis, contrastes, métodos de estimación

1.0 point possible (ungraded)
La perturbación aleatoria:

Modelos con variable dependiente cualitativa

 Transcripción

Hola soy Isabel Neira, profesora de economía cuantitativa de la universidad Santiago Compostela y doctor vinculado a ingenio.

En este módulo tres de modelos econométricos y en elección cuatro, vamos a empezar con un caso concreto que son los modelos con variable dependiente cualitativa, supongo que a estas alturas de curso o módulo ya sabemos que variable es una de las que estamos estudiando la dependiente es nuestra variable "Y" o nuestra variable a explicar y en este caso son variables que toma valores cualitativos, ¿que son esos valores? Pues por ejemplo, el hecho de estar feliz o no feliz o estar en una escala de felicidad de uno a diez que es una de las cosas que nosotros por ejemplo estudiamos a nivel empírico.

Si esto es una variable explicativa podríamos usar los métodos que hemos explicado en la lección anterior modelo clásico modelo generalizado, sin ningún problema, pero si esa variable dicotómica es por ejemplo cero uno tendríamos que usar un modelo como los logit y los probit, si es ordinal una escala de uno a diez como estábamos hablando en la que se señala el nivel de satisfacción, es decir, uno dos tres cuatro cinco seis cada vez más feliz pero tampoco sabemos exactamente si la distancia del uno al dos es la misma, que por ejemplo tener un euro o dos euros que si sabemos tenemos muy clara cuál es la distancia entre el uno y el dos.

La distancia entre entre una escala de medida el liquer o de cualquier otro tipo de sicología o de las que usamos para medir en términos de marketing, es más complicada tendríamos usar en este caso por ejemplo logit ordenado.

Tenemos varias posibilidades sin orden volvemos a un ejemplo de consumo, consumir la leche A la leche B la leche C para todos los productos tendremos que era un logit multinomial. Si esas variables son datos de recuento, por ejemplo, una empresa contratada un trabajador, dos trabajadores tres trabajadores, es decir un número concreto de personas de trabajadores que es diferente a estar poco satisfecho o muy satisfecho tendríamos que ir a las modelos que se llaman datos de recuento negint.

Si tenemos variables con distintos niveles jerárquicos por ejemplo un alumno que pertenece a una escuela el alumno a nivel individual, la escuela es un nivel jerárquico superior, su comunidad autónoma es otro nivel jerárquico superior, y el país es otro nivel jerárquico. Estaríamos hablando de multinivel sólo con variable dependiente cualitativa como podéis observar aquí tenemos una batería de modelos que tendríamos que estudiar, qué es lo relevante, saber cuál es la variable dependiente porque si yo estoy trabajando con datos descuento encuesta lo más normal es que me enfrenté a este tipo de modelos y sean los que tengan que estudiar. Evidentemente después de haber estudiado la lección la uno la dos y la tres de que son los modelos econométricos hipótesis etcétera.

Vamos a ver un poquito muy por encima qué significa esto de los modelos logit y probit de la probabilidad. Pues básicamente aunque no hemos visto mucha profundidad los modelos anteriores era cada vez que incrementa en una unidad la variable, por ejemplo, renta consumo más eso es el beta que tenéis aquí explicados decir en el caso anterior decíamos cada vez que aumente la estatura del padre es decir padres de cero cinco o de un centímetro pues aumentará la de los hijos en tanto aquí no. Porque como podéis observar aquí lo tenéis en el texto si queréis profundizar un poquito más,
estamos hablando de probabilidades y eso sí que es algo importante estamos hablando de probabilidades de que un evento sucedan términos estadísticos supongo que os acordáis de aquello que estudiamos de cuando tiene un dado probabilidad de que caiga la cara a o la cara b. Pues esto es lo mismo por ejemplo en este caso concreto vamos a poner una familia, que se compra una vivienda
la familia compra la vivienda uno o C estamos de acuerdo no bueno porque si es cero sería que alquiló que no la tiene pero yo no voy a tratar de estimar obtener el valor de esa familia se compra una vivienda sino la probabilidad de que la familia la compre. Eso es importante, no vamos a tener certezas sino probabilidades son modelos lo en los que la relación causal es completamente diferente.

Bueno por términos estadísticos que no vamos a profundizar aquí. Podemos estimar por mínimos cuadrados ordinarios lo que hemos visto en la recta en el módulo anterior, podemos hacer una relación lineal, si os acordáis de la recta de regresión que colocamos cuál es el problema que sin este eje tenemos el cero y si en este eje tenemos el 1 no hay nube de puntos como no hay nube de puntos
no podemos trazar una recta y decir es una relación lineal poder podemos pero el error que cometemos es bastante grande.

¿Que han hecho los estadísticos, los economistas, para solucionar esto? Han aproximado otras funciones como por ejemplo aquí tenemos esta que va haciendo uso una onda que esto implicaría que no es una relación lineal sino que para valores pequeños de x es decir cuando estoy en esta parte del eje cuando mi salario mensual es pequeñito. Vamos a suponer pues quinientos euros no me voy a comprar una casa a medida que voy aumentando mi nivel de renta. Voy a tener más probabilidades de comprar una casa, pero llega a un punto que, por ejemplo, si gano más de cinco mil euros al mes pues da igual que ganen cinco mil diez mil y quince mil. Voy a tener una casa esa es la idea la recta no es lineal se adapta mejor al tipo de datos y por lo tanto estamos, por ejemplo el modelo logit como hemos visto antes pueden ser probit otros muchas tipos de estimaciones.

Sin embargo a la hora de sacar esto un programa econométrico prácticamente los resultados como podéis observar en la tabla son los mismos es decir tengo coeficientes, estándar error, probabilidades, contrastes. Voy a tener que hacer contrastes dependiendo del tipo de muestra que esté haciendo en este caso no tengo que analizar por ejemplo autocorrelación, la heterocedasticidad podría ser un problema y aquí no porque sólo tengo una variable pero si tuviera más de una debería de analizar la probabilidad si veis aquí abajo tengo probabilidades observaciones con variable dependiente cero y uno diecinueve y veintiuno en este ejemplo concreto tendría que ver la probabilidad de equivocarme cuando digo que compra una casa o cuando no la compra.

Este sería un ejemplo de cómo hacer un modelo de datos de variable dependiente cuando cualitativa que son complejos son una metodología específica, que podéis seguir estudiando si vais a trabajar con datos de encuestas por ejemplo es muy importante con esto sería todo. Muchas gracias. Cualquier duda nos vemos.

Modelos con variable dependiente cualitativa

1.0 point possible (ungraded)
Cuando la variable dependiente es cualitativa:

Datos de panel

 

 Transcripción

En esta última elección del módulo tres modelos econométricos vamos a ver otro ejemplo de una metodología, más bien de un tipo de muestras que se usa mucho en la investigación empírica que prácticamente desde los años noventa o bueno finales de los noventa es una metodología reciente pero que ya se ha desarrollado mucho y que nos ayuda bastante a la hora de interpretarlos datos.

Porque como hemos visto antes hemos comentado que dependiendo de la muestra usar una u otra
metodología, entonces lo primero que vamos a hacer aquí que es que son los datos de panel, si tenemos disponibilidad de datos de panel de ordenadores y programas y si merece la pena el esfuerzo, de aprender esta metodología que eso va a ser lo que esto que a partir de este módulo profundizar en él. Que son datos de panel, pues básicamente cuando tenemos las muestras se como os acordáis de las elecciones anteriores los tipos demuestra que nosotros podemos tener son temporales que es una muestra temporal por una muestra temporal es evidentemente de años, dias, meses, etcétera y una muestra temporal es aquella que tenemos familias empresas. Que son los datos de panel por la mezcla de la parte temporal y la parte temporal existe en datos de panel en programas de ordenadores pues si cualquier programa tiene las comandos para poder hacerlos StarUp tiene toda el desarrollo, para datos de panel incluso para datos de panel dinámicos y cualquier tipo de estimación que queramos hacer el econometric vius también, es un programa que estima los datos de panel cret que como os comentaba antes. Es un un sofware libre merece la pena el esfuerzo pues como decía también a lo largo de este módulo, va a depender mucho de lo que queráis hacer porque la econometría es muy amplia y no nos podemos aprender todas las metodologías.

Yo os recomendaría que aprendáis aquellas metodologías que son útiles para nuestros datos, es decir, si tengo muestras pequeñas o muestras repetidas a lo largo del tiempo y tengo un panel pues entoces aprendo la metodología, tiene un libro específicamente dedicado a datos de panel en stata en el que se puede ir aprendiendo paso a paso, con más o menos, lo que son los datos de panel que esto es un poquito más complicado no voy a profundizar mucho pero como podéis ver aquí la ecuación se convierte en algo más largo que tiene sus índices de tiempo. y subíndices despacio y se refiere a la parte espacial, es decir atemporal, personas, empresas, por eso varía desde i igual a uno hasta ene y es la parte del tiempo que varía desde uno hasta t, es decir puede tener por ejemplo cuatro familias a lo largo de diez años cinco familias etcétera.

Para que estaban pensados originalmente los datos de panel pues estaban pensados para ene suficientemente grande y t pequeño es decir si yo tengo una muestra, por ejemplo, de España vamos a ver datos de cualquier variable cinco años con cinco años no puedo hacer una causalidad una serie temporal pero si cojo todos los países de la unión europea ya tengo un n pues más grande, para mí T pequeñito que son cinco años.

Es decir, cuarenta países por cinco años por son doscientos datos que es una muestra suficientemente grande y tenía un panel, voy a tener por ejemplo si analizo países pues voy a tener efectos que nosotros llamamos en economía, por ejemplo, efectos fijos que son hay efectos para cada individuo invariantes en el tiempo y hay efectos temporales invariantes entre los individuos.

Esos efectos fijos por ejemplo que sería pues serían el caso de que yo analizo que paises es o comunidades autónomas hay algo que hace que España o que la comunidad x que sea o la región x se comporte de manera diferente a las otras porque porque históricamente por las condiciones culturales etcétera. A eso le vamos a llamar efectos fijos efectos fijos esos efectos pueden ser también aleatorios esa es la base de los datos de panel. Prácticamente en economía se usaban casi siempre efectos fijos porque estamos suponiendo que se comportamiento de las países o de las regiones va a la ordenada al origen y por lo tanto es fijo.

Los efectos aleatorios son cuando con no conocemos la muestra de la que procede si son datos de encuesta y otro tipo de datos pero también hay contrastes como contraste de Hausman que nos permiten saber si estamos en efectos fijos o efectos aleatorios. Viendo un ejemplo pues aquí tenéis un ejemplo sencillo y los que tenemos costes de personal y empresa tenemos aquí una dos tres cuatro empresas y una serie de años si sólo tenemos cuatro empresas o sólo tenemos cinco años es una serie muy pequeña. Cuando juntamos toda como podéis ver aquí el número de observaciones crece y entoces podemos hacer una estimación más compleja que sería la de datos de panel. No debemos olvidarnos siempre que cuando eliminemos una fila se eliminan todas las variables es decir si no tengo datos alguna de las variables explicativas, me va a desaparecer de la regresión. Eso es importante que tengáis en cuenta, porque datos de panel uno de los elementos más importantes
si estamos hablando de paneles balance. Bueno porque casi todos prestan inglés equilibrados o desequilibrados balance que significa eso por ejemplo. En este caso que estamos analizando aquí es equilibrado porque tenemos los mismos datos de todos los años para las mismas empresas, no es necesario puedo tener para España, por ejemplo, tres datos y para Holanda diez datos y para el Reino Unido cinco datos, cinco periodos temporales es sería un panel desequilibrado que requiere buenos métodos de estimación más complejos.

Si la serie temporal como está aquí es pues más con períodos no no correlativos en el tiempo como está aquí ochenta y cinco noventa noventa y cinco noventa, podemos hacer un panel si la serie de años es correlativa también depende un poco de como estamos trabajando con la muestra y volviendo al ejemplo de ello que sacamos de los programas informáticos.

Aquí por ejemplo es unas volvemos a tener una salida de regresión en este caso del virus de star es similar en la que volvemos a tener los coeficientes el estándar error estadístico la probabilidad. Como hablamos al principio de los módulos eso es lo principal que hay que saber lo primero que hay que saber la bondad del ajuste. Siempre estamos utilizando medidas similares, es decir, compensa entonces aprender el modelo clásico la regresión los contrastes hipótesis las propiedades de los estimadores y luego ir complicando un poco las metodologías. Si estoy estudiando modelos logit p sí estoy estudiando datos de panel cómo sería en este caso. Esto es todo lo que queríamos comentar sobre datos de panel para tener una pequeña una pincelada.

 Gracias, cualquier cosa nos vemos en en el foro del curso.

Datos de panel

1.0 point possible (ungraded)
Los datos de panel:

Examen unidad 3

1.0 point possible (graded)
¿Cuál es el principal uso de los modelos econométricos?

problem

1.0 point possible (graded)
El modelo clásico

problem

1.0 point possible (graded)
Las hipótesis del modelo

problem

1.0 point possible (graded)
Los modelos logit y probit

problem

1.0 point possible (graded)
Los datos de panel