Estadística 1.2 (2013)

Apunte Catalán
Universidad Universidad de Barcelona (UB)
Grado Psicología - 1º curso
Asignatura Estadística
Año del apunte 2013
Páginas 4
Fecha de subida 11/04/2016
Descargas 19
Subido por

Vista previa del texto

ESTADÍSTICA (T1) DISTRIBUCIÓN MUESTRAL DE UN ESTADÍSTICO INTRODUCCIÓN Hemos conceptualizado anteriormente un estimador puntual como un estadístico obtenido en una muestra y que es función de los valores que la componen.
Por tanto, si consideramos que las muestras se han obtenido por muestreo aleatorio, los estadísticos que calculamos en estas muestras pueden (y de hecho deben) ser conceptualizados como variables aleatorias Bajo la denominación Distribución muestral de un estadístico recogemos el modelo teórico de probabilidad que, básicamente, describe el comportamiento de la variable aleatoria definida por el conjunto de estadísticos calculados a lo largo de las diferentes muestras de igual tamaño que podrían generarse a partir de una misma población Considerando un muestreo con reposición el numero de muestras sería de infinito La Distribución Muestral constituye un concepto teórico, ya que en la práctica únicamente generamos una muestra y calculamos sobre ella un estadístico ¿Qué utilidad tiene conocer las características de la Distribución Muestral de un Estadístico? - En primer lugar, evaluar las propiedades de los estimadores (que hemos planteado con anterioridad). Por ejemplo, a partir de la esperanza matemática, determinar si el estimador presenta sesgo o, mediante su variancia, analizar la eficiencia diferencial de dos estimadores - En segundo lugar, también nos permitirá establecer estimaciones por intervalo del parámetro poblacional, tal como veremos más adelante ¿Qué características presenta la Distribución Muestral de un Estadístico? - No se conocen las características de la distribución de todos los estadísticos, pero a partir de la Ley de los grandes números y el Teorema del límite central ha sido posible identificarlas de forma teórica para algunos estadísticos. Para los que no se conoce puede aproximarse mediante un proceso de simulación numérica (Montecarlo, Bootstrap...) ESTADÍSTICA (T1) DISTRIBUCIÓN MUESTRAL DE MEDIAS Conforme al teorema del límite central la distribución de muestreo del estadístico media es asintóticamente normal. Es decir, se ajusta a un modelo de probabilidad normal a medida que el tamaño de la muestra sobre la que se calcula el estadístico tiende a infinito (n  œ) N   X ; X  ˆ  x Donde µẌ representa la Media de la Distribución Muestral y σẌ sería la Desviación estándar de la Distribución Muestral, habitute también designada como Error Típico o Error Estándar de la Distribución Muestral (σẌ o también SEẌ) Los parámetros que caracterizan la Distribución Muestral del Estadístico son función de los parámetros de la Variable Aleatoria poblacional • Para la Media: E(x)     X • Para el Error típico:  • Si el muestreo se ha realizado con reposición o   X n bien a partir de una población infinita: • Caso que el muestreo se haya realizado a partir de una población finita y sin reposición: X   n Nn N 1 Donde µ y σ son respectivamente la media y la desviación estándar de la Variable Aleatoria medida en la población y la siguiente expresión: es el coeficiente de corrección por finitud Nn N 1 Puesto que la convergencia es asintótica, la aproximación a la distribución de probabilidad normal es buena para valores grandes de n siguiendo el teorema del límite central La convergencia se producirá con independencia de las características de la variable aleatoria en la población siempre que al menos la media y variancia poblacionales sean finitas En el caso de que el valor de n sea pequeño, para garantizar que las características distribucionales de la Distribución Muestral de Medias coinciden con las anteriormente descritas, será necesario que la Variable Aleatoria se distribuya normalmente en la población origen de la muestra. El cumplimiento de esta condición es por sí sola garantía suficiente en cualquier caso (sea cual sea el tamaño muestral) Como elemento a destacar, obsérvese cómo el error típico presenta una relación inversa con el tamaño de la muestra. Conforme aumenta esta última, disminuirá el error estándar de la Distribución Muestral DISTRIBUCIÓN MUESTRAL DE SUMAS Conforme al teorema del límite central, la distribución de muestreo del estadístico suma también es asintóticamente normal SumX N  SumX ; SumX  Por lo que respecta a sus parámetros, en un muestreo con reemplazo a partir de una población finita serían: E(SumX )   SumX  n  SumX  n En caso de que el muestreo se haya realizado a partir de una población finita y sin reposición:  SumX  n Nn N 1 ESTADÍSTICA (T1) DISTRIBUCIÓN MUESTRAL DE PROPORCIONES Conforme al teorema del límite central, la distribución de muestreo del estadístico proporción también es asintóticamente normal N   P ; P  ˆ  p Por lo que respecta a sus parámetros, en un muestreo con reemplazo a partir de una población finita serían: E(p)   p   p   (1   ) n En el caso de que el muestreo se haya realizado a partir de una población finita y sin reposición: p   (1   ) N  n n N 1 En realidad, el teorema del límite central es aplicable a la distribución de muestreo del estadístico proporción únicamente si los productos nπ y n(1- π) son iguales o superiores a 5. Con este estadístico sería más adecuado caracterizar la distribución de muestreo mediante el modelo de probabilidad Binomial para poblaciones finitas con reposición o el modelo Hipergeométrico para poblaciones finitas sin reposición. Esto es así puesto que estos modelos de probabilidad establecerían la distribución de muestreo exacta del estadístico OTRAS DISTRIBUCIONES MUESTRALES Las Distribuciones muestrales para algunos estadísticos se hallan especificadas y son conocidas bajo determinadas circunstancias. A continuación identificaremos los parámetros (para muestreo infinito o con reposición), las características distribucionales y los requerimientos que deben cumplirse para algunos casos: « Distribución Muestral de la Desviación estándar o Para n100 la distribución muestral es casi normal E(s)   s   muy aproximadamente o para el error típico tenemos dos expresiones: - Si la distribución de la variable aleatoria a nivel poblacional es aproximadamente normal - En caso de que no lo sea  s  «  4  (2 )2 4n2 s  Distribución Muestral de la Mediana - Para n30 y población aproximadamente normal la distribución muestral es muy aproximadamente normal E(Md)   Md    Md    2n = 1.2533 n Existe también una expresión de cálculo del Error Estándar en base a indicadores de posición:  Md  X(i )  X( j ) 2 3  n  3n  i  int   1 2    n  3n  j  int   1 2   2n ESTADÍSTICA (T1) « « Distribución Muestral de los Cuartiles o Para n30 y variable aleatoria con distribución aproximadamente normal, la distribución muestral es aproximadamente normal E (Q1 ) Q E (Q3 ) Q 1 Q  Q = 1 n 3 3 Distribución Muestral de los Deciles o Para n30 y variable aleatoria con distribución aproximadamente normal, la distribución muestral es aproximadamente normal E(Di ) D  D = 1 9 D  D = 3 « 1.3626 1.7094 n 1.3180 7 n D i ; D2   D8 = ; D4   D6 = 1.4288 n 1.2680 n Distribución Muestral de los Rangos Semiintercuartiles o Para n30 y variable aleatoria con distribución aproximadamente normal, la distribución muestral es aproximadamente normal 0.7867 µQ es casi igual al Rango Semiintercuartil en la población  Q = n « Distribución Muestral de la Variancia o Para n 100 la distribución muestral es casi normal E(s2 )   s2   2 (n-1)/n convergiendo en  2 a medida que aumenta n 2 si la variable Aleatoria a nivel n poblacional es aproximadamente normal s  2 2 s  2 « 4  (2 )2 n caso de que no lo sea Distribución Muestral de la Variancia - Independientemente del valor de n, para variable aleatorias con distribución normal en la población  s2 / 2 (2 ) Donde V =n-1 « Distribución Muestral del Coeficiente de Variación o Para variables aleatorias con distribución normal (o casi normal) y n 100 la distribución muestral es normal con E(CV )  CV   /  CV   / 2n 1+2( / )2 ...