PRÁCTICA 6 (2015)

Apunte Español
Universidad Universidad Pompeu Fabra (UPF)
Grado Medicina - 2º curso
Asignatura Bioestadística
Año del apunte 2015
Páginas 7
Fecha de subida 20/04/2016
Descargas 6
Subido por

Vista previa del texto

BIOESTADÍSTICA PRÁCTICA 6: Estimación de parámetros estadísticos poblacionales Datos de partida Se trabajará sobre los mismos datos de partos atendidos en el Hospital del Mar que ya se utilizaron en prácticas anteriores.
Las poblaciones suelen ser conjuntos de individuos muy amplios a partir de las cuales no es posible obtener datos directamente. En esta práctica, únicamente con fines didácticos, se considerará que esta tabla constituye en sí misma la población objeto de estudio. De ese modo, podremos calcular parámetros poblacionales (lo cual no es posible en la inmensa mayoría de los estudios) y compararlos con estimadores obtenidos sobre distintas muestras que extraeremos de la población.
Objetivos de la práctica Obtención de estimadores de parámetros estadísticos poblacionales sobre diferentes muestras y comparación con los valores de los parámetros poblacionales correspondientes. Cálculo de intervalos de confianza (IC).
Protocolo 1. Ejecuta la aplicación SPSS y abre el fichero “partos6.sav” que se encuentra en la carpeta “prácticas” del Tema 6. Los datos son básicamente los mismos que se utilizaron en prácticas anteriores, pero se han eliminado los nacimientos correspondientes a niños prematuros y los datos que se identificaron como erróneos.
2. Comenzaremos por determinar el valor de la media poblacional en la tabla. Selecciona el comando “Analizar>>>Estadísticos descriptivos>>>Descriptivos”. En el cuadro de diálogo, selecciona el peso del recién nacido (“pesnado”) y pulsa Aceptar. Anota el valor de la media y de la desviación estándar.
Estadísticos descriptivos POBLACIONAL N pesnado 5707 N válido (según lista) 5707 Mínimo 1180 Máximo 6530 Media 3227,82 Desv. típ.
471,702 3. Selecciona una muestra aleatoria de esta población. Usa el comando “Datos>>>Seleccionar casos” y en el cuadro de diálogo pulsa el botón en el apartado “Muestra aleatoria de casos”. Aparecerá un nuevo cuadro de diálogo. Selecciona “Exactamente 50 casos de los primeros 5707 casos” y pulsa aceptar.
4. Ahora vamos a determinar la media muestral. Usa el comando “Analizar>>>Estadísticos descriptivos>>>Descriptivos” para obtener la media y la desviación estándar de esta muestra. Repite todo el proceso de generación de muestras aleatorias y obtención de muestras 10 veces y anota todos los valores de las medias obtenidas en una tabla (Excel).
Los intervalos de confianza 95% para cada una de las medidas se obtienen a partir de las fórmulas* Estadísticos descriptivos MUESTRAL 1/10 N Mínimo pesnado 50 N válido (según lista) 50 2540 Máximo 4060 Media 3277,90 Desv. típ.
404,913 ! El hecho de seleccionar a 50 personas 10 veces distintas, introduce el concepto de sesgo=la posible aparición de persona fuera de los valores medios poblacionales. Cuando mayor es la muestra (o número de veces que se repite) menor es el sesgo, es decir, mayor parecido entre los valores muestrales y poblacionales.
! La media y DT poblacional es cada vez distinta debido a que se escogen muestras de 50 personas de forma aleatoria.
Después de repetirlo 10 veces con muestras aleatorias de 50 personas: Media   DT   3277,9   404,913   3198,12   428,512   3362,9   369,046   3292,78   386,543   3172,6   466,518   3245,9   558,752   3252,3   431,683   3237,8   425,231   3195,7   505,583   3139,6   501,9   5. Calcula estos valores usando Excel y construye dos gráficos que muestren los valores máximos y mínimos del intervalo de confianza para cada muestra, uno para los estimadores obtenidos con la desviación estándar poblacional y otro con los obtenidos con la desviación estándar muestral.
* Primero debemos calcular los límites de confianza superior e inferior muestrales (LC sup y LC inf).
De la fórmula: - x = media muestral - z =aplicable a 2,01 - n = 50 individuos (son los individuos utilizados para estimar la media) - s = DT de la muestra analizada NOTA: En el Excel: - Límite Superior !=media+2,01*DT/(arrel(50) - Límite Inferior !=media-2,01*DT/arrel(50) Límite Superior Límite Inferior Luego calculamos los límites de confianza superior e inferior poblacionales (LC sup y LC inf). De la fórmula: - x = media poblacional (en un estudio real este valor no se tiene realmente) - σ = DT poblacional (valor que en un estudio tampoco se tiene) - z = aplicable a 1,9 (es sobre toda la “muestra” que suponemos que es nuestra población) - n = también usamos este valor porque lo que calculamos es la estimación de la media (aproximación al valor de la media) NOTA: En el Excel: - Límite Superior !=media+1,96*DT/(arrel(50) - Límite Inferior !=media-1,96*DT/arrel(50) DT= 471,701= desviación típica poblacional Luego podemos calcular los valores máximos y mínimos de los valores de confianza: MUESTRA Límite superior Límite inferior 3393,0 3162,8 3319,9 3076,3 3467,8 3258,0 3402,7 3182,9 3305,2 3040,0 3404,7 3087,1 3375,0 3129,6 3358,7 3116,9 3339,4 3052,0 3282,3 2996,9 POBLACIÓN Límite superior Límite inferior 3408,6 3147,2 3328,9 3067,4 3493,6 3232,2 3423,5 3162,0 3303,3 3041,9 3376,6 3115,2 3383,0 3121,6 3368,5 3107,1 3326,4 3065,0 3270,3 3008,9 IC  Muestral   IC  Poblacional   3600,0   3600,0   3500,0   3500,0   3400,0   3400,0     3300,0   Límite  superior   3300,0   3200,0   Límite  inferior   3100,0   3200,0   Límite  inferior   3100,0   3000,0   3000,0   2900,0   2900,0   2800,0   2800,0   2700,0   2700,0   1   2   3   4   5   6   7   8   9   10   Límite  superior   1   2   3   4   5   6   7   8   9   10   6. Observa en cuantas de las muestras analizadas el intervalo de confianza encierra el valor poblacional de la media que has calculado al principio de la práctica. Anota los resultados.
El valor de la media poblacional corresponde a 3227,82. Dicho valor se encierra en un total de 9 muestras.
7. Contesta al cuestionario de la práctica 6 que encontrarás en Moodle.
Cuestionario 1. Anota el valor de la media poblacional Respuesta: 3227,82 2. Anota el valor de la desviación estándar poblacional Respuesta: 471,702 3. Pega aquí las tablas con los valores de los IC que as calculado usando desviaciones poblacionales y muestrales (incluye solo las posiciones decimales adecuadas)     muestral   poblacional Media DT LC(superior) LC(inferior) LC(superior) LC(inferior) IC muestral IC poblacional 3277,9 404,9 3393,0 3162,8 3408,6 3147,2 230,2 261,5 3198,1 428,5 3319,9 3076,3 3328,9 3067,4 243,6 261,5 3362,9 369,0 3467,8 3258,0 3493,6 3232,2 209,8 261,5 3292,8 386,5 3402,7 3182,9 3423,5 3162,0 219,8 261,5 3172,6 466,5 3305,2 3040,0 3303,3 3041,9 265,2 261,5 3245,9 558,8 3404,7 3087,1 3376,6 3115,2 317,7 261,5 3252,3 431,7 3375,0 3129,6 3383,0 3121,6 245,4 261,5 3237,8 425,2 3358,7 3116,9 3368,5 3107,1 241,7 261,5 3195,7 505,6 3339,4 3052,0 3326,4 3065,0 287,4 261,5 3139,6 501,9 3282,3 2996,9 3270,3 3008,9 285,3 261,5 *Única muestra cuyo intervalo muestral no encierra el valor de la media poblacional 4. En cuantos de los IC que has calculado el valor de la media poblacional se encuentra dentro del intervalo Es correcto Como lo interpretas En un total de 9 IC que hemos calculado, el valor de la media poblacional se encuentra dentro de dichos intervalos.
Interpretamos que en 9 de cada 10 muestras el valor poblacional estará encerrado en los intervalos de confianza. Por lo tanto estamos seguros en un 90% que el valor de la media poblacional se encuentra entre dichos intervalos. Como nuestro IC es del 95%, la relación 9 de cada 10 muestras es bastante correcta, no obstante, para obtener el 95% haría falta estudiar más muestras (p/ej.: en la práctica en vez de realizarlo 10 veces lo hacemos 1000, entonces obtendríamos el 95%. ) Mi conclusión es que, cuanto mayor es la muestra estudiada, menor es el sesgo y se obtienen IC más precisos a los valores poblacionales.
5. Anota las diferencias que observes entre los IC calculados con la desviación estándar muestral y la poblacional. Cuales crees que son los más correctos La diferencia entre los IC calculados con la desviación estándar muestral y poblacional es que en la poblacional la diferencia entre límite superior e inferior de los intervalos de confianza siempre es la misma ya que depende de la desviación estándar poblacional o el valor de σ que en este caso es igual a 471,701. En el caso de la diferencia entre el limite superior e inferior de los IC muestrales varia ya que el valor de s es diferente conforme cogemos muestras de 50 individuos aleatoriamente.
Los más correctos son los IC poblacionales ya que nos ofrecen el valor exacto, no obstante, los IC muestrales nos ofrecen una estimación de los valores reales. Como normalmente los IC poblaciones no se pueden obtener ya que no disponemos de la desviación estándar poblacional, concluimos que contra mayor sea la muestra estudiada más precisos serán los intervalos obtenidos al valor poblacional.
...