Pràctica 04 (2016)

Pràctica Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Estadística Aplicada - 3º curso
Asignatura Introducció a l'Econometria
Año del apunte 2016
Páginas 9
Fecha de subida 27/04/2016
Descargas 9
Subido por

Vista previa del texto

Introducció a l’Econometria Grau d’Estadística Aplicada Pràctica 4 Problema 1 En el full “Salaris” tenim dades sobre el Salari, els anys d’educació, Educ, els anys d’experiència, Exp, i el Sexe (0 si és home i 1 si és dona). Es pretén observar la relació que hi ha entre el Salari i la resta de variables.
+ . Volem estudiar si en aquest model hi ha (a) Considera el model = + canvi estructural en funció dels anys d’experiència.
Si hi hagués canvi estructural significaria que les serien diferents depenent de la i. En aquest cas, en el gràfic del model, s’observa que, si agaféssim només la primera o la segona meitat de les dades, la recta seria primer creixen i després decreixent. Per tant, podríem pensar que les del model canvien respecte abans i després d’aquest punt.
Salari respecte a Exper (amb ajust mínim-quadràtic) 45 Y = 8,35 + 0,0393X 40 35 30 Salari 25 20 15 10 5 0 0 10 20 30 Exper Fent amb gretl el test de chow: Regressió augmentada per al contrast de Chow MQO, emprant les observacions 1-528 Variable dependent: Salari 40 50 Coeficient Desv. Típica t-ràtio Valor p ---------------------------------------------------------const 6,05824 0,642188 9,434 1,28e-019 Exper 0,320984 0,0707708 4,536 7,13e-06 splitdum 4,38683 1,15431 3,800 0,0002 sd_Exper -0,356024 0,0781555 -4,555 6,51e-06 Mitj. de la vble. dep. 9,047538 Suma de quad. residus 13293,55 R-quadrat 0,046733 F(3, 524) 8,562822 Log-versemblança -1600,847 Criteri de Schwarz 3226,771 D.T. de la vble. dep.
D.T. de la regressió R-quadrat ajustat Valor p (de F) Criteri d'Akaike Crit. de Hannan-Quinn *** *** *** *** 5,144082 5,036802 0,041275 0,000015 3209,694 3216,379 Contrast de Chow de canvi estructural a l'observació 265 F(2, 524) = 10,4671 amb valor p 0,0000 Segons això, tenim el model = 6.06 + 0.32 dir, el model segons l’experiència seria: + 4.39 = 6.06 + 0.32 pels de menys experiència = 10.45 − 0.04 pels de més experiència − 0.36 , és a El contrast rebutja la hipòtesi de que els models siguin iguals, és a dir, que realment hi ha un canvi estructural.
Fent manualment el test de chow: ̂′ = &'()* = ̂ − ̂′ ̂ 2 ~ ̂′ ̂ −4 ,#$% − ( &', -. + &', .) 2 ~ &', -. + &', .
−4 ,#$% SQRTotal=13824.6418 SQRmenys=6843.2758 SQRmes=6480.4845 F=9.849393 Una F(2,524) té valor crític 3.01292 per tant, es rebutja la hipòtesi.
(b) Modifica el model de l’apartat (a), de manera que = 0( , ), però de manera que el model no tingui canvi estructural respecte a l’experiència.
El model que provarem serà amb l’experiència al quadrat tal que + 1 El test de Chow ara dona: Regressió augmentada per al contrast de Chow MQO, emprant les observacions 1-528 Variable dependent: Salari = + + Coeficient Desv. Típica t-ràtio Valor p ------------------------------------------------------------const 5,89562 0,957624 6,157 1,48e-09 *** Exper 0,384148 0,285403 1,346 0,1789 sq_Exper -0,00412120 0,0180431 -0,2284 0,8194 splitdum -2,07523 3,30974 -0,6270 0,5309 sd_Exper 0,0830187 0,367388 0,2260 0,8213 sd_sq_Exper -0,00439141 0,0184558 -0,2379 0,8120 Mitj. de la vble. dep. 9,047538 Suma de quad. residus 13170,85 R-quadrat 0,055532 F(5, 522) 6,138378 Log-versemblança -1598,399 Criteri de Schwarz 3234,413 D.T. de la vble. dep.
D.T. de la regressió R-quadrat ajustat Valor p (de F) Criteri d'Akaike Crit. de Hannan-Quinn 5,144082 5,023098 0,046485 0,000015 3208,798 3218,826 Contrast de Chow de canvi estructural a l'observació 265 F(3, 522) = 1,34598 amb valor p 0,2586 Segons això, tenim el model 2.075 − 0.083 − 0.004 = 5.896 + 0.384 − 0.004 , és a dir, el model segons l’experiència seria: = 5.896 + 0.384 − 0.004 = 7.971 + 0.301 pels de més experiència − pels de menys experiència El contrast accepta la hipòtesi de que els models siguin iguals, és a dir, que realment el model quadràtic ajusta bé totes les dades.
(c) Considera el model = + 45 + . Volem estudiar si en aquest model hi ha canvi estructural en funció dels anys d’educació.
Salari respecte a Educ (amb ajust mínim-quadràtic) 45 Y = -1,60 + 0,814X 40 35 30 Salari 25 20 15 10 5 0 6 8 10 12 14 16 18 Educ Regressió augmentada per al contrast de Chow MQO, emprant les observacions 1-528 Variable dependent: Salari Coeficient Desv. Típica t-ràtio Valor p -------------------------------------------------------const 2,90623 2,33526 1,244 0,2139 Educ 0,401673 0,206105 1,949 0,0518 * splitdum -5,89480 3,28568 -1,794 0,0734 * sd_Educ 0,513261 0,257024 1,997 0,0463 ** Mitj. de la vble. dep. 9,047538 Suma de quad. residus 11674,60 R-quadrat 0,162826 F(3, 524) 33,97186 Log-versemblança -1566,563 Criteri de Schwarz 3158,203 D.T. de la vble. dep.
D.T. de la regressió R-quadrat ajustat Valor p (de F) Criteri d'Akaike Crit. de Hannan-Quinn 5,144082 4,720145 0,158033 4,47e-20 3141,126 3147,811 Contrast de Chow de canvi estructural a l'observació 265 F(2, 524) = 2,39918 amb valor p 0,0918 (d) Modifica el model de l’apartat (b) de manera que = 0( 456 , manera que el model no tingui canvi estructural respecte a Educ i Exp.
, ), però de Model 9: MQO, emprant les observacions 1-528 Variable dependent: Salari const Coeficient -6,36473 Desv. Típica 1,26373 t-ràtio -5,0365 Valor p <0,00001 *** Educ Exper sq_Exper 0,933925 0,0846519 0,300976 0,0580931 -0,00462526 0,00130109 Mitj. de la vble. dep.
Suma de quad. residus R-quadrat F(3, 524) Log-versemblança Criteri de Schwarz 9,047538 10770,84 0,227634 51,47818 -1545,292 3115,660 11,0325 5,1809 -3,5549 <0,00001 <0,00001 0,00041 D.T. de la vble. dep.
D.T. de la regressió R-quadrat ajustat Valor p (de F) Criteri d'Akaike Crit. de Hannan-Quinn *** *** *** 5,144082 4,533767 0,223212 3,58e-29 3098,584 3105,269 Regressió augmentada per al contrast de Chow MQO, emprant les observacions 1-528 Variable dependent: Salari Coeficient Desv. Típica t-ràtio Valor p -----------------------------------------------------------const -2,27255 2,67247 -0,8504 0,3955 Educ 0,589159 0,214642 2,745 0,0063 *** Exper 0,293398 0,0851346 3,446 0,0006 *** sq_Exper -0,00496901 0,00178167 -2,789 0,0055 *** splitdum -3,80774 3,52650 -1,080 0,2808 sd_Educ 0,339284 0,260442 1,303 0,1932 sd_Exper -0,0393793 0,121290 -0,3247 0,7456 sd_sq_Exper 0,00240237 0,00286581 0,8383 0,4023 Mitj. de la vble. dep. 9,047538 Suma de quad. residus 10663,95 R-quadrat 0,235299 F(7, 520) 22,85778 Log-versemblança -1542,659 Criteri de Schwarz 3135,470 D.T. de la vble. dep.
D.T. de la regressió R-quadrat ajustat Valor p (de F) Criteri d'Akaike Crit. de Hannan-Quinn 5,144082 4,528531 0,225005 4,72e-27 3101,318 3114,688 Contrast de Chow de canvi estructural a l'observació 265 F(4, 520) = 1,30314 amb valor p 0,2677 Accepta que el model és bo, no hi ha canvi estructural.
(e) En la relació = 0( 456 , , ) que has proposat a l’apartat (d), existeix discriminació salarial per gènere? Regressió augmentada per al contrast de Chow MQO, emprant les observacions 1-528 Variable dependent: Salari Coeficient Desv. Típica t-ràtio Valor p --------------------------------------------------------------const -6,32991 1,59691 -3,964 8,41e-05 Educ 0,897477 0,108213 8,294 9,47e-016 Exper 0,456357 0,0762397 5,986 4,01e-09 sq_Exper -0,00724714 0,00176098 -4,115 4,49e-05 Sexo -0,0589139 2,45691 -0,02398 0,9809 Se_Educ 0,0732253 0,164091 0,4462 0,6556 Se_Exper -0,340595 0,112358 -3,031 0,0026 Se_sq_Exper 0,00615802 0,00251316 2,450 0,0146 Mitj. de la vble. dep.
9,047538 D.T. de la vble. dep.
*** *** *** *** *** ** 5,144082 Suma de quad. residus R-quadrat F(7, 520) Log-versemblança Criteri de Schwarz 9849,855 0,293677 30,88670 -1521,694 3093,541 D.T. de la regressió R-quadrat ajustat Valor p (de F) Criteri d'Akaike Crit. de Hannan-Quinn 4,352244 0,284169 8,78e-36 3059,388 3072,758 Contrast de Chow de diferència estructural respecte a Sexo F(4, 520) = 12,1554 amb valor p 0,0000 Rebutja que el model sigui bo, per tant, l’influencia del gènere sobre el salari és significativa, per tant, hi ha discriminació salarial per gènere, i seguirien els models: = −6.330 + 0.897 456 + 0.456 − 0.007 pels homes = −6.389 + 0.970 456 + 0.116 − 0.001 per les dones (f) Quin és l’efecte que té un any més d’educació sobre el salari d’un home? I sobre el salari d’una dona? Un any més d’educació, incrementa el salari un 0.897 en els homes i un 0.970 en les dones.
(g) Quin és l’efecte que té un any més d’experiència sobre el salari d’un home? I sobre el salari d’una dona? Un any més d’experiència, incrementa el salari un 0.449 en els homes i un 0.115 en les dones.
(h) Amb quants anys d’experiència s’arriba al màxim salari pels homes? I per les dones? 7 4 = 0.456 − 0.014 pels homes el salari màxim és 32.57 .
7 4 = 0.116 − 0.002 per les dones el salari màxim és 58 .
(i) Considera ara el model ln( ) = 0( 456 , , ).
Regressió augmentada per al contrast de Chow MQO, emprant les observacions 1-528 Variable dependent: l_Salari Coeficient Desv. Típica t-ràtio Valor p --------------------------------------------------------------const 0,559904 0,156711 3,573 0,0004 Educ 0,0831419 0,0106194 7,829 2,77e-014 Exper 0,0542236 0,00748168 7,248 1,54e-012 sq_Exper -0,000914373 0,000172811 -5,291 1,79e-07 Sexo -0,339660 0,241106 -1,409 0,1595 Se_Educ 0,0254153 0,0161029 1,578 0,1151 Se_Exper -0,0272652 0,0110261 -2,473 0,0137 *** *** *** *** ** Se_sq_Exper 0,000506625 0,000246626 Mitj. de la vble. dep. 2,063647 Suma de quad. residus 94,85612 R-quadrat 0,337469 F(7, 520) 37,83848 Log-versemblança -295,9815 Criteri de Schwarz 642,1157 2,054 0,0405 D.T. de la vble. dep.
D.T. de la regressió R-quadrat ajustat Valor p (de F) Criteri d'Akaike Crit. de Hannan-Quinn ** 0,521224 0,427101 0,328551 7,34e-43 607,9630 621,3331 Contrast de Chow de diferència estructural respecte a Sexo F(4, 520) = 14,5426 amb valor p 0,0000 Rebutja que el model sigui bo, per tant, l’influencia del gènere sobre el logaritme del salari és significativa, per tant, hi ha discriminació salarial per gènere, i seguirien els models: ln ( ) = 0.560 + 0.083 456 + 0.054 − 0.001 ln ( ) = 0.220 + 0.108 456 + 0.027 per les dones pels homes (j) Tria entre el model proposat a (d) i el proposat a (i).
Com que els models tenen la variable resposta en escales diferents, l’única manera de comparar-los és amb la log-versemblança. El model en (d) té una log-versemblança de -1545.292 i el model en (i) té una log-log-versemblança de -323.976, que seria una logversemblança de -1413.582 (perquè ); = ); ); − ====== );<) . La log-versemblança busca maximitzar, per tant, el millor model és el (i), ja que el seu valor és més elevat.
Problema 2 Escriu un guió d’instruccions en Gretl de manera que, fent simulacions de Monte Carlo, es pugui observar que: “Si fem omissió de variables rellevants en un model, l’estimador de MQO és un estimador que té biaix”.
Model real: < = 2 + 4> − 6>1 + Model per comparar: < = ? + ? > + Per estimar: > ~@(0,1) , >1 = 5> + @(0,1) , ~@(0,1) Fent els MQO d’un model que només té > de mida 500 dona: Model 2: MQO, emprant les observacions 1-500 Variable dependent: Y const X2 Coeficient 2,1373 -26,4277 Mitj. de la vble. dep.
Suma de quad. residus R-quadrat F(1, 498) Log-versemblança Criteri de Schwarz Desv. Típica 0,269779 0,263208 1,583027 18114,77 0,952927 10081,33 -1606,938 3226,305 t-ràtio 7,9224 -100,4058 Valor p <0,00001 <0,00001 D.T. de la vble. dep.
D.T. de la regressió R-quadrat ajustat Valor p (de F) Criteri d'Akaike Crit. de Hannan-Quinn *** *** 27,77030 6,031172 0,952833 0,000000 3217,876 3221,183 Ja es veu que el coeficients no són el que haurien de ser (donen 2.13 i -26.43 quan haurien de ser 2 i 4). Però això no té perquè implicar un biaix, potser només ha sortit malament aquest càlcul per aquesta generació de normals en concret, però amb altres valors serien correctes.
Per comprovar si té biaix s’ha de calcular moltes vegades i fer la mitjana dels coeficients trobats. Utilitzant per exemple N=1000 repeticions: Mitjana dels coeficients estimats const X2 2,06811 -26,3778 Desv. típ.
dels coeficients estimats 0,0444206 0,0439747 Mitjana de Desv. típ. de les desv. típ. les desv. típ.
estimades estimades 0,267696 0,261177 0,00201743 0,00196830 El biaix seria (estimat-real), és a dir, -26.3778-4=-30.3778 Fent el mateix però suposant per estimar que > ~@(0,1) , >1 = @(0,1) , ~@(0,1) dona: Mitjana dels coeficients estimats const X2 2,06811 3,62220 Desv. típ.
dels coeficients estimats 0,0444206 0,0439747 Mitjana de Desv. típ. de les desv. típ. les desv. típ.
estimades estimades 0,267696 0,261177 0,00201743 0,00196830 Fent el gràfic de distribució de freqüències (contrast contra la distribució normal) de les 1000 estimacions dels coeficients, es veu que efectivament els coeficients segueixen una normal.
10 a1 N(2,0681 0,044443) Estadístic per al contrast de normalitat: Khi-quadrat(2) = 0,295 [0,8627] 9 8 7 Densitat 6 5 4 3 2 1 0 1,95 2 2,05 2,1 2,15 2,2 a1 10 a2 N(-26,378 0,043997) Estadístic per al contrast de normalitat: Khi-quadrat(2) = 2,707 [0,2583] 9 8 7 Densitat 6 5 4 3 2 1 0 -26,55 -26,5 -26,45 -26,4 a2 -26,35 -26,3 -26,25 ...

Tags: