Estadística II 1.2 (2013)

Apunte Catalán
Universidad Universidad de Barcelona (UB)
Grado Psicología - 1º curso
Asignatura Estadística
Año del apunte 2013
Páginas 7
Fecha de subida 11/04/2016
Descargas 16
Subido por

Vista previa del texto

ESTADÍSTICA (T1) INFERENCIA ESTADÍSTICA. MUESTREO Y ESTIMADORES INTRODUCCIÓN Por medio de la estadística descriptiva caracterizamos una o varias variables aleatorias, ya sea conjunta o separadamente. Dadas diversas medidas, que pueden corresponder a una parte de la población, datos muestrales, o a la totalidad de los individuos de la misma, el objetivo es resumir o sintetizar la información, haciendo ésta más comprensible.
Si se realiza un análisis descriptivo sobre datos muestrales, no existe otro objetivo que describir la información contenida en los datos de la muestra, sin realizar ningún tipo de extrapolación. Por tanto, los análisis estadísticos sólo se refieren al conjunto de los datos muestrales.
En muchas ocasiones el interés no reside tanto en describir un determinado conjunto de datos muestrales como utilizar la información contenida en la muestra para conocer alguna característica de la variable o variables aleatorias en la población.
Por supuesto, nada mejor que realizar un análisis a partir de la totalidad de los individuos de la población, pero eso no siempre es posible en términos de costes, ya sean económicos o temporales. De hecho, en muchas ocasiones es imposible obtener mediciones para la totalidad de los individuos de la población.
En consecuencia, se desprende la necesidad de un tipo de razonamiento cuyo objetivo sea realizar extrapolaciones sobre los parámetros de las variables aleatorias en la población a partir de una parte de los individuos pertenecientes a la misma. O sea, utilizar la información contenida en los datos muestrales para realizar inferencias sobre el valor de los parámetros para el conjunto de los individuos de la población. Este es el objetivo de la inferencia estadística y, para alcanzar ese objetivo, debemos conocer cómo obtener muestras que representen adecuadamente al conjunto de individuos de la población de referencia.
Dentro de la inferencia estadística puede distinguirse entre estimación y decisión.
El proceso mediante el cual se obtiene información sobre el valor de los parámetros de las variables aleatorias en la población a partir de datos muestrales se denomina estimación. En este proceso de estimación se utilizan índices y coeficientes estadísticos, conocidos como estimadores, para obtener información sobre el valor de los parámetros. Estos estimadores, que utilizan la información contenida en la muestra, proporcionan un valor concreto que se denomina estadístico.
Dado un valor del estadístico, puede realizarse una estimación del parámetro conocida como estimación puntual o por punto o, alternativamente, una estimación denominada estimación por intervalo. En el primer caso, se iguala el valor del parámetro a aquel correspondiente al estadístico. En el segundo, se proporciona un intervalo o conjunto de valores probables para el parámetro.
La decisión estadística tiene por objetivo tomar decisiones sobre determinadas características de una o varias variables aleatorias en la población. Las técnicas de la inferencia estadística permiten poner a prueba una hipótesis, dados unos datos muestrales. Por tanto, son precisas las estimaciones obtenidas en las muestras para tomar una decisión.
Las pruebas de decisión estadística pueden agruparse en técnicas de conformidad y técnicas de relación.
Las pruebas o técnicas de conformidad permiten contrastar hipótesis que se refieren a características de las variables aleatorias, ya sea sobre el valor de alguno de sus parámetros o la forma de sus distribuciones. Así, podemos diferenciar entre pruebas paramétricas y no paramétricas.
Mediante las técnicas de relación es posible contrastar si dos o más variables aleatorias son independientes o no. También aquí podemos diferenciar entre pruebas paramétricas y no paramétricas.
ESTADÍSTICA (T1) MUESTREO DE POBLACIONES FINITAS Por la imposibilidad de obtener la información o de realizar la medición de determinadas características para la totalidad de individuos que componen una población, es necesario, en general, realizar un estudio a partir de un subconjunto de individuos de la misma.
La muestra, que así se denomina cualquier subconjunto de individuos de la población, debe ser representativa de la misma, siempre que se pretenda utilizar la información obtenida en la muestra para realizar extrapolaciones o inferencias a la población de referencia.
Para garantizar la representatividad de la muestra, debemos procurar que en la misma no existan factores que puedan provocar la existencia de sesgo en los resultados extrapolados desde la muestra a la población.
En consecuencia, se precisan procedimientos que eviten o minimicen la existencia de sesgo y, en la medida de lo posible, garanticen la representatividad de la muestra; o sea, las técnicas de muestreo de poblaciones finitas.
Nos referiremos al muestreo de poblaciones finitas, que es aquel que se precisa, por ejemplo, cuando se realiza un estudio o sondeo de opinión.
Una población finita está compuesta por un número finito de individuos. Mediante el término marco se entiende la lista por medio de la cual se identifica a cada uno de los individuos de la población. Un número asignado a cada individuo de la población puede ser una forma de elaborar la lista.
La variable de estudio es aquella característica de la población que se quiere estudiar. En una investigación puede incluirse tantas variables de estudio como interese.
Si el estudio se realiza sobre la totalidad de la población, se denomina censo.
Mediante N se denota el total de individuos de la población, también refiriéndose como tamaño poblacional.
El total de individuos que componen una muestra se denomina tamaño muestral y se denota mediante n.
Dado un tamaño poblacional, pueden obtenerse distintas muestras. El total de las diferentes muestras se denomina espacio muestral universal. Como son muchas las muestras que componen el espacio muestral universal, pues incluye todas las muestras posibles, independientemente de su tamaño, es preciso tomar una parte del mismo.
Se entiende por espacio muestral una parte del espacio muestral universal. Las muestras de un tamaño concreto son una parte del espacio muestral universal.
Una vez especificado un espacio muestral, el muestreo de poblaciones finitas tiene por objetivo obtener muestras para alcanzar precisas inferencias sobre las características de las variables aleatorias en la población de referencia.
Los procedimientos mediante los cuales se obtienen las muestras se denominan diseños o planes de muestreo. Estos se tratarán a continuación.
• Muestreo aleatorio simple. MAS(N, n) – Es una característica de este plan de muestreo que la probabilidad de que cualquier individuo pertenezca a la muestra es igual a 1/N. Si se prefiere, la probabilidad de obtener cualquier muestra m de tamaño n es p m  1 N   n – – • • ESTADÍSTICA (T1) El denominador es igual al total de muestras posibles de tamaño n sin reposición.
Para obtener una muestra mediante este procedimiento se ordenan las muestras del espacio muestral y se obtiene una de ellas al azar. También puede obtenerse mediante la selección al azar individuo a individuo de forma secuencial. En ambos casos se utilizan números pseudoaleatorios.
Muestreo aleatorio inverso. MAI(k) – En ocasiones se desea estudiar un atributo que se sabe se presenta con una baja probabilidad en la población. El problema es que quizá no se obtenga ningún elemento con ese atributo en la muestra, dando como resultado que no existe en la población, cuando eso es falso con total certeza.
– En este caso puede utilizarse un muestreo aleatorio inverso. Los individuos se seleccionan al azar sin reposición, pero la selección de la muestra no finaliza hasta que se han obtenido k individuos que poseen el atributo que se estudia.
– Se desprende que en este plan de muestreo el tamaño de la muestra es una variable aleatoria. No puede fijarse al inicio un tamaño muestral, pues está determinado por la aparición del k-ésimo individuo que posee el atributo.
Muestreo aleatorio sistemático. MS(N, k, a) – Como todos los diseños de muestreo aleatorios, todo individuo de la población tiene idéntica probabilidad de pertenecer a la muestra.
– Para obtener los elementos o individuos de la muestra, primero es preciso enumerar a los mismos, desde 1 hasta N. A continuación se fija el valor k o paso, siendo k < N. En ocasiones se toma k = N/n. Se selecciona al azar un número entero, denotado mediante a (este valor puede tomar valores entre 1 y k, ambos inclusive), que corresponde al individuo inicial seleccionado.
– Una vez realizadas estas operaciones previas, se obtienen los elementos que pertenecerán a la muestra mediante a, a  k , a  2k ,..., M ; • N k  M  N Muestreo aleatorio estratificado. MAE(k) – La estratificación es una partición de la población en k grupos, bloques, subpoblaciones o estratos constituidos por individuos que poseen unos atributos comunes y, al menos en parte, distintos del resto; o sea, los identifican.
– Mediante la estratificación se logra una homogeneización de la población. Los estratos interesan si se supone que la característica estudiada toma valores distintos en los diversos estratos.
– En un muestreo aleatorio estratificado no se realiza un plan de muestreo distinto de los ya mencionados, sino uno de los anteriores, obteniéndose las muestras para cada estrato mediante un plan de muestreo independiente.
– Las siguientes expresiones relacionan los tamaños de la población y la muestra con aquellos de los estratos i k N   Ni i 1 i k y n   ni i 1 ESTADÍSTICA (T1) – Se denomina peso del estrato a Wi  – Ni N – El muestreo aleatorio estratificado se realiza mediante asignación proporcional o asignación no proporcional.
– Si en cada estrato se selecciona un número de individuos que, respecto al tamaño de la muestra, mantiene una proporción igual al peso del estrato, es un muestreo aleatorio estratificado por asignación proporcional. Requiere que se conozcan los pesos de los estratos en la población.
– Cuando en cada estrato se selecciona un número de individuos que no mantiene, respecto al tamaño de la muestra, una proporción igual al peso del estrato, se realiza un muestreo aleatorio estratificado por asignación no proporcional.
– ¿Cuándo utilizar uno u otro tipo de muestreo aleatorio estratificado? Si no se conoce el tamaño de cada estrato, la respuesta a la pregunta es trivial, pues sólo podemos recurrir al no proporcional. Si sabemos el tamaño de cada estrato, y el objetivo es conocer una característica de una variable aleatoria para el conjunto de la población, nos interesa una asignación proporcional, pues obtendremos resultados más precisos. Pero si el objetivo es conocer el valor de la característica en cada estrato, es irrelevante la asignación proporcional, siendo de interés procurar que se logre un preciso conocimiento del valor de la característica en cada estrato.
– Un ejemplo de muestreo aleatorio estratificado es aquel en que, dentro de un estudio de márketing, se desea conocer la proporción de personas que, con una edad igual o superior a 25 años, leen semanalmente una determinada revista. Se sabe o conjetura que la proporción de personas que leen esa revista depende del sexo, la edad, el nivel de formación y la situación laboral. ¿Cómo se realizaría la estratificación? – En el anterior ejemplo debe notarse que la población de referencia está definida por la edad.
Existen varios atributos que definen estratos, como son el sexo y la situación laboral. Ambos pueden tomar dos valores y, por tanto, definen ya 4 posibles estratos. Pero también debe considerarse el nivel de formación. Aceptemos que se establece que esta característica de los individuos puede tomar los valores sin estudios, estudios primarios, estudios secundarios o estudios superiores. El cruce de los cuatro anteriores estratos y los cuatro valores correspondientes al nivel de formación nos conduce a considerar 16 estratos. Todavía deben considerarse los intervalos de edad, que podemos establecer en 7 (25-35, 36-45, 46-55, 5665, 66-75, 76-85, 86-). En total existirán 112 estratos. Como muestra este ejemplo, unas pocas características de los individuos nos conducen a un número muy elevado de estratos.
Muestreo aleatorio por conglomerados. MAC(p) – Hasta el momento nos hemos referido a planes de muestreo en los cuales la selección de los elementos de la muestra se realiza a partir del marco o enumeración de los individuos de la población. En ocasiones es posible evitar este largo proceso al estar los individuos agrupados en grupos naturales o conglomerados (árboles en parcelas agrícolas, personas en unidades de una organización o individuos que habitan en un mismo barrio).
– Dentro de los distintos conglomerados pueden existir otros conglomerados y repetirse este proceso de división en varias ocasiones. Por esta razón, como veremos, el muestreo por conglomerados puede considerarse multietápico, en el sentido de que en cada etapa se muestrea entre las unidades disponibles. Mediante p denotaremos el número de etapas.
– – ESTADÍSTICA (T1) La unidades seleccionadas en la primera etapa se conocen como conglomerados o unidades primarias; las muestreadas en la segunda etapa, unidades secundarias; las seleccionadas en la tercera etapa, unidades terciarias; y así sucesivamente. Los elementos sobre los que se obtiene la información, independientemente del número de etapas, se denominan unidades finales.
– Muestreo por conglomerados monoetápico o de una etapa. En este caso p=1. En primer lugar debe identificarse el total de conglomerados y, posteriormente, se seleccionan al azar aquellos conglomerados que constituirán la muestra. Un ejemplo puede ser, dada una pequeña población, los conglomerados que forman las distintas unidades familiares. Una vez seleccionados al azar algunos conglomerados, también puede obtenerse la muestra definitiva seleccionando aleatoriamente entre los individuos pertenecientes a esos conglomerados.
– Muestreo por conglomerados bietápico o en dos etapas. En este caso p = 2. Se trata de un plan de muestreo donde, dentro de cada conglomerado, puede realizarse una partición en otros conglomerados o, si se prefiere, subconglomerados. Se realiza una selección aleatoria de las unidades primarias y, dentro de éstas, de las secundarias. Por último, también pueden seleccionarse aleatoriamente los individuos para formar las unidades finales o tomar la totalidad de los conglomerados secundarios. Un ejemplo es aquel en el cual, en una gran ciudad, los individuos se hallan en barrios y, a su vez, se agrupan en unidades familiares.
– Muestreo por conglomerados multietápico o de varias etapas. El número de etapas p depende de la cantidad de subdivisiones. Por ejemplo, un plan de muestreo de este tipo puede realizarse en una ciudad donde sus habitantes se estructuran en distritos, barrios y unidades familiares.
Muestreo no aleatorio. Los planes de muestreo que se han mencionado hasta el momento se fundamentan en la obtención mediante procedimientos probabilistas de los individuos que forman una muestra. Son, por tanto, los planes de muestreo que deben realizarse. Pero, en ocasiones, no se utilizan, ya sea porque no pueden afrontarse los costes o, si se investiga determinados procesos básicos en seres humanos, pueda suponerse la equivalencia entre los diferentes individuos de la población. Se utilizan, entonces, otras técnicas de muestreo no fundamentadas en la selección aleatoria. En cualquier caso, estas técnicas deben, en la medida de lo posible, evitarse.
– Muestreo intencional. Se seleccionan los individuos en la medida que disponen de una determinada característica. Un ejemplo es aquel en el cual se realiza un estudio del tiempo de reacción y sólo interesan individuos con elevados niveles de extraversión.
– Muestreo accidental. Los individuos son seleccionados para pertenecer a la muestra de una forma casual. Por ejemplo, cuando un encuestador se sitúa en una zona y, sin más criterio, encuesta aquellas personas que aceptan ser encuestadas.
– Muestreo por cuotas. La población se divide en cuotas o estratos. La selección de los individuos que forman la muestra no es aleatoria, aunque sí se respetan los estratos de la población, ya sea proporcionalmente o no.
– En cualquier caso, es conveniente evitar el muestreo no probabilista. No debe olvidarse nunca que la inferencia estadística requiere el muestreo probabilista. En estudios de opinión, actitudes, valores, creencias y, en general para la totalidad de investigaciones, no podrá obviarse el muestreo aleatorio.
ESTADÍSTICA (T1) ESTIMADORES PUNTUALES • Un estimador puntual es una función de los valores de la variable aleatoria obtenidos en la muestra y, por tanto, dependiente de los valores que han sido obtenidos mediante el muestreo aleatorio. En consecuencia, los valores obtenidos mediante el estimador, o los estadísticos, son también medidas de una variable aleatoria. En otros términos, los estimadores son variables aleatorias y, por tanto, tienen una función de distribución teórica.
• Se define un estimador puntual de la forma siguiente • La forma que adopte la función f conduce a distintos estimadores puntuales. Dado un parámetro puede proponerse uno u otros estimadores del mismo. No todos los estimadores puntuales que puedan ser propuestos son óptimos. Por ejemplo, la media aritmética es un estimador más eficiente (menor dispersión) del parámetro de localización que la semisuma del menor y el mayor valor de la muestra.
• Mediante el razonamiento estadístico aplicado a la inferencia estadística es posible garantizar un adecuado proceso de estimación, pero es imposible asegurar una acertada estimación de los parámetros de las variables aleatorias.
• Por la razón expuesta en el párrafo anterior, se requiere conocer aquellas propiedades de los estimadores que los convierten en especialmente adecuados para utilizarlos en la inferencia estadística.
• Además, el mayor o menor cumplimiento de estas propiedades óptimas nos permiten analizar varios estimadores puntuales y conocer aquel más adecuado.
• Estas propiedades deseables para los estimadores puntuales son la inexistencia de sesgo, consistencia, eficiencia relativa, suficiencia y mínima varianza. Debe añadirse que resulta también conveniente que los estimadores sean resistentes y robustos.
• Estimador puntual insesgado. Se dice que un estimador puntual es insesgado, o carente de sesgo, del parámetro cuando E ˆ   •  ˆ  f  x1 , x2 ,..., xn    – Se define el sesgo de un estimador como Sesgo ˆ  E ˆ   – Es importante que un estimador carezca de sesgo; o sea, que su esperanza matemática sea igual al valor del parámetro. Eso no quiere decir que en toda estimación el valor obtenido mediante el estimador será igual al parámetro, pero sí que en promedio el valor del estimador coincide con aquel del parámetro.
Estimador puntual consistente. Un estimador puntual es consistente si, cuando el tamaño muestral tiende a infinito, la probabilidad de que el estimador puntual coincida con el parámetro se aproxima a uno. Una definición formal de consistencia es lím Pr ob   c   1;   ˆ   n  – En la anterior expresión denota el error de estimación o precisión y c cualquier constante.
Puede advertirse que la consistencia es una propiedad asintótica. O sea, es una propiedad que se analiza mediante el cálculo de un límite.
– De manera informal, la propiedad establece que si n es suficientemente grande, el error cometido con un estimador puntual consistente será menor que cualquier constante fijada previamente.
• ESTADÍSTICA (T1) Estimador puntual eficiente. Se dice que un estimador puntual es el más eficiente cuando tiene la menor varianza de todos los posibles estimadores puntuales no sesgados.
– La eficiencia es una propiedad que se establece de forma comparativa, de forma que, dados dos o más estimadores puntuales, escogeremos aquel con mayor eficiencia relativa. La eficiencia relativa entre dos estimadores se define como   Var ˆsila razón anterior es menor que 1, es preferible el primer Dados dos estimadores sin sesgo,   ef ˆ1 ,ˆ2  – Var ˆ1 2 estimador; pero, si la razón es superior a 1, es conveniente utilizar el segundo estimador. Si la razón es igual a 1, el criterio no decide.
– Cuando los estimadores son sesgados, la eficiencia se define en términos del error cuadrático medio. También será útil este criterio cuando, por ejemplo, un estimador es más sesgado que el otro (que quizá carezca de sesgo), pero el primero tiene menor varianza que el segundo.
– Se define el error cuadrático medio de un estimador puntual como      2 ECM ˆ  E  ˆ     Var ˆ  Sesgo 2 ˆ   • – Adviértase que, en el caso de un estimador no sesgado, el error cuadrático medio coincide con la varianza del estimador. Este criterio combina sesgo y varianza para decidir sobre cuál es el mejor estimador.
– Dados dos estimadores, se tomará aquel con un menor error cuadrático medio.
Estimador puntual de mínima varianza. El criterio del error cuadrático medio es insuficiente, pues, aunque elijamos el estimador puntual más eficiente, quizá sea todavía muy poco eficiente. Por tal motivo es preciso un criterio o medida absoluta de la eficiencia.
– La cota de Cramer-Rao proporciona una medida absoluta de eficiencia para todo estimador 1 puntual del parámetro   ln f  x;  2  E        Var ˆ  n En la anterior expresión n denota el tamaño muestral y f(x; ) la función de densidad de la variable aleatoria en la población. Si la varianza del estimador iguala la cota mínima, se dice que es un estimador de varianza mínima.
 – • Estimador puntual suficiente. Un estimador puntual del parámetro es suficiente si utiliza toda la información de la muestra para la estimación del parámetro de la población. O sea, si toda la información que se obtiene del parámetro depende de los datos de la muestra, siendo la estimación obtenida independiente de .
• Estimadores puntuales resistentes y robustos. Muchos estimadores puntuales resultan eficientes bajo ciertas condiciones, como que la variable aleatoria se distribuya normalmente. No es así cuando las distribuciones poseen colas muy densas y, por tanto, pueden aparecer valores alejados con mayor frecuencia. Estos valores alejados alteran la estimación. Por tal razón, es conveniente que los estimadores sean resistentes a la presencia de valores anómalos y robustos frente al incumplimiento de ciertas condiciones.
...