PRÁCTICA 5 (2015)

Apunte Español
Universidad Universidad Pompeu Fabra (UPF)
Grado Medicina - 2º curso
Asignatura Bioestadística
Año del apunte 2015
Páginas 7
Fecha de subida 20/04/2016
Descargas 5
Subido por

Vista previa del texto

BIOESTADÍSTICA PRÁCTICA 5: Distribuciones de probabilidad de variables continuas Objetivos: - Familiarizarse con las distribuciones de probabilidad normal y t de Student, como herramientas para calcular la probabilidad Protocolo: 1. Descarga de la carpeta “prácticas” del Tema 5 el archivo de comandos “practica5.R”. Abre R y selecciona Archivo>>>Interpretar código fuente. Este comando importa una serie de funciones escritas para esta práctica. Si tienes curiosidad puedes examinar el contenido del archivo y/o modificarlo a tu gusto.
2. Imagina que estás estudiando una variable que sigue una distribución normal. ¿Cómo se refleja esto en los valores de esa variable que puedo medir en muestras? La función “muestreo (n)” te permite simular los valores de esa variable en muestras de distintos tamaños (n), representados en forma de histogramas. Teclea varias veces ! Cogemos a 20 individuos. Cuanto mayor sea el tamaño de la muestra más se ajusta a la distribución normal. Cada barra es la frecuencia de individuos que se encuentran entre un intervalo. Esta área tendría que ser igual a la integral de la curva normal. Esta integral nos ofrece la probabilidad.
> muestreo (20) ! Muestreo (20) A B El gráfico A es diferente a B porque al aplicar nuevamente el muestreo (20) se cogen otros individuos diferentes a los cogidos en A ! Se observa que la frecuencia de cada barra no se ajusta a la integral de la curva. Esto es debido a que la muestra es muy pequeña. La muestra de 20 individuos no sigue una distribución normal. Si aumentamos el muestreo observamos lo siguiente: ! Muestreo (25) v Muestreo (30) v Muestreo (40) v Muestreo (150) v Muestreo (35) v Muestreo (500) ! Se observa que a medida que vamos aumentando el tamaño de la muestra, la frecuencia de cada barra se va ajustando más a la integral de la curva.
3. Cada vez que llames a la función obtendrás valores distintos. En cada histograma se representa una distribución normal, como referencia.
4. Aumenta progresivamente el tamaño de la muestra y anota cómo cambia.
5. La distribución normal puede representarse gráficamente usando el comando “normal(x,sd)”, donde x es la media de la variable aleatoria y sd su desviación estándar. Prueba a llamarla con distintos valores de x y sd. Como verás, la forma no cambia, solo la escala.
> normal (0,1) > normal (10,5) > normal (3082,450) v Normal (0,1) v Normal (10,5) v Normal (3082,450) 6. La distribución normal permite calcular la probabilidad de que la variable tome valores dentro de un cierto intervalo. Esto puede hacerse calculando el área encerrada bajo la curva, en el gráfico de densidad de probabilidad o leyendo la altura en un gráfico de probabilidad acumulada.
Por ejemplo, para una variable con media 560 y desviación estándar 24, calcula la probabilidad de obtener valores menores de 590.
# calculamos el valor estandarizado restando la media y dividiendo por sd > (590-560)/24= 1,25 7. Se obtiene como valor normalizado 1.25 #calculamos la probabilidad acumulada como > pnorm(1.25)= 0.8943502 8. Este valor nos indica la probabilidad de obtener valores menores y corresponde a la superficie encerrada bajo la curva desde menos infinito hasta 1.25 en el gráfico de densidad. Para verlo gráficamente usando los comandos # como área bajo la curva, desde menos infinito hasta este valor > dnormGRAPH(1.25) #como valor de la integral de la curva anterior > pnormGRAPH(1.25) Área bajo la curva desde –infinito à1,25 9. Usa estos comandos con distintos valores 10. Calcula las siguientes probabilidades y anota los resultados: - Variable con media=725 y sd=40 ! Probabilidad de encontrar valores menores de 700: - (700-725)/40 = -0,625 - Pnorm(0.625) = 26,59%= 0,266 dnormGRAPH(0.625) |pnormGRAPH(0.625) Integral de la curva anterior Área bajo la curva desde –infinito à-0,625 Integral de la curva anterior Eje y= probabilidad Eje x= Valor ! Probabilidad de encontrar valores mayores de 780 - (780-725)/40 = 1.375 - Pnorm(1.375) = 91,54%= 0.9154343 (por tanto 100-91,54 = 8,46% de encontrar valores mayores de 780, pues la pnorm es la probabilidad acumulada desde menos infinito hasta el valor indicado) - Variable con media=0.15 y sd=0.05 ! Valores menores de 0.10 - (0.10-­‐0.15)/0.05  =  -­‐1   - Pnorm(-­‐1)  =  15,87%=  0.1586553   - dnormGRAPH(-­‐1)  /  pnormGRAPH(-­‐1)               ! Valores mayores de 0.20 - (0.20-0.15)/0.05 = 1 - Pnorm(1) = 0.8413447= 84,13% (por tanto 100-84,13% = 15,87%) o 1-0,8413= 0,1587 ! Valores entre 0.10 y 0.20 - 100-15,87-15,87 = 68.26% (le restamos la probabilidad de encontrar valores por debajo de 0.10 y de encontrar valores por encima de 0.20) 11. Otro modo de usar la distribución es encontrar el valor para el cual se obtiene una cierta probabilidad.
Por ejemplo, en teoría hemos visto que para una variable normalizada con media 0 y sd 1, el 95% de la probabilidad está entre -1.96 y 1.96. Esto quiere decir que hay un 2.5% de probabilidad en cada lado. Esto puede comprobarse usando el comando qnorm con el valor 0.975 > qnorm (0.975)= 1.959964 Y representarse con qnormGRAPH > qnormGRAPH (0.975) 12. Prueba estos comandos con otros valores 13. Por último usa el comando tstudent (dof) para representar la distribución t de Student con distintos grados de libertad. Teclea y ve disminuyendo el valor del número de grados de libertad, anotando los cambios que observes.
" tstudent (100) v TStudent (100) v TStudent (5) v TStudent (1) v TStudent (0.5) ! Se observa que a medida que disminuimos el nº de grados de libertad la campana se hace más estrecha.
! La diferencia entre la distribución normal y la t student es básicamente que son funciones distintas en las que la distribución normal no depende del nº de casos mientras que la t Student sí. El efecto de la estrechez de la campana es que obtendremos probabilidades más cercanas a la media.
14. No cierres la aplicación y contesta el cuestionario de la práctica 5 que encontrarás en Moodle QUESTIONARIO: 1. Al usar el comando muestreo. ¿Qué representa el histograma? ¿Se parece a la curva teórica? ¿A partir de qué tamaño de muestra la semejanza es más aparente? El histograma, es decir las barras, representan la frecuencia de individuos que se encuentran entre un determinado intervalo. El histograma se parece a la curva teórica dependiendo del tamaño de la muestra. A muestras muy pequeñas como de 20 individuos el histograma prácticamente no se corresponde a la curva teórica. No obstante cada vez dichas muestras son más grandes esta correspondencia es evidente. Aproximadamente con una muestra de 500 individuos se observa que el histograma corresponde bastante bien a la curva teórica.
2. Probabilidad calculada para valores menores de 700 (3 decimales) 0,266 3. Probabilidad calculada para valores mayores de 780 (3 decimales) 0,085 4. Probabilidad calculada para valores menores de 0.10 (3 decimales) 0,159 5. Probabilidad calculada para valores mayores de 0.20 (3 decimales) 0,159 6. Probabilidad calculada para valores entre 0.10 y 0.20 (3 decimales) 0,683 7. ¿Por qué se usa un valor de 0,975 en qnorm para comprobar los límites que encierran el 95% de la probabilidad? El 95% de los individuos se encuentran entre -1,96 y +1,96 desviaciones estándar. Cogiendo como probabilidad de la media 0,5 La desviación estándar -1,96 corresponde a la probabilidad 0,25 mientras que la desviación estándar +1,96 corresponde a 0,975 Como la probabilidad es acumulada el 0,975 se obtiene del 0,25 del principio más el 0,95 que se quiere obtener.
8. ¿Qué diferencias observas entre la distribución normal y la t de Student? ¿Para cuantos grados de libertad estas diferencias son más aparentes? Se observa que cuando las muestras son muy grandes la distribución normal y la t student son parecidas. No obstante cuanto más pequeña es la muestra más diferencias se observan entre las dos.
Las diferencias más aparentes se observan ante grades de libertad pequeños por ejemplo de 1. Ante dicho grado de libertad se observa que la campana que representa la t Student se hace más estrecha ...

Comprar Previsualizar