PRÁCTICA 12 (2015)

Apunte Español
Universidad Universidad Pompeu Fabra (UPF)
Grado Medicina - 2º curso
Asignatura Bioestadística
Año del apunte 2015
Páginas 10
Fecha de subida 20/04/2016
Descargas 7
Subido por

Vista previa del texto

Bioestadística 2º Medicina UPF-UAB Práctica 12: Pruebas no paramétricas Objetivos Uso de herramientas para comprobar la normalidad de las variables. Aplicación de pruebas no paramétricas de contraste de hipótesis en R y SPSS.
Protocolo Carga en R el fichero con los datos de partos que ya hemos utilizado en otras prácticas anteriores. Puedes encontrar el fichero “partos3.csv”. Cópialo a una carpeta con un nombre corto y sencillo como por ejemplo “C:/tmp” y usa el siguiente comando (cambia el nombre de la carpeta si tienes el fichero en otro sitio) > partos <- read.csv ("C:/temp/3.csv",header=TRUE, sep=";") Representa un histograma y un gráfico Q-Q. Para el gráfico Q-Q usa el comando qqnorm y qqline.
Comenta los resultados. ¿Puede considerarse que los pesos de los niños siguen una distribución normal? El histograma podemos ver que tiene una forma de campana, donde la gran mayoría de las muestras acumula en unos valores medios y a medida que nos alejamos del centro de la campana va disminuyendo la cantidad de niños con esos valores de peso, sin embargo encontramos una cantidad anormal de niños con bajo peso, habiendo menos de los que esperaríamos en una distribución normal, por lo que no sigue una distribución normal. En el gráfico Q-Q podemos comprobar que los valores se ajustan a una recta excepto la cantidad de niños con bajo peso que se desajustan ya que hay menos de los que esperaríamos y quedan por debajo de la Bioestadística 2º Medicina UPF-UAB recta normal. Con estas dos pruebas podemos concluir que la variable del peso de los niños no sigue una distribución normal ya que se aparta dicha distribución sobretodo en los niños de bajo peso.
A continuación vamos a reinvestigar una serie de problemas que ya hemos visto en prácticas anteriores, pero aplicando pruebas no-paramétricas. Puedes usar SPSS o R, pero no hace falta que uses ambos.
En cada caso deberás anotar en tu informe: • Número del problema.
• Prueba de contraste de hipótesis no-paramétrica utilizada.
• Comparación con los resultados obtenidos con pruebas paramétricas, indicando la prueba paramétrica equivalente.
• Resultados y conclusiones.
• Copia de la salida de R (en el caso de que uses R).
Aplicación de pruebas no-paramétricas en R U de Mann-Whitney, comando wilcox.test() Wilcoxon, comando wilcox.test(), seleccionando la opción de datos apareados (paired=TRUE) Kruskal-Walis, comando kruskal.test() Coeficiente de correlación de Spearman, comando cor, con la opción metodo=spearman Aplicación de pruebas no-paramétricas en SPSS Las pruebas no paramétricas se acceden a través de la opción: Analizar>>>Pruebas no paramétricas, menos en el caso de la correlación no paramétrica, que se accede a través del menú Analizar>>>Correlaciones>>>Bivariadas y seleccionando correlación de Spearman en vez de correlación de Pearson.
Bioestadística 2º Medicina UPF-UAB 1. Parece lógico pensar que los bebes de bajo peso al nacer tiendan a crecer más rápidamente que los que nacen con mayor peso. Para comprobarlo se han recolectado los datos de la siguiente tabla, que proporciona los valores del peso al nacer en 32 bebes y el aumento de peso (como % del peso al nacer) entre los días 70 y 100 de vida.
• Peso al nacer (oz.) Aumento de peso entre días 70-100 (% sobre peso al nacer) 72 68 Analizar>>>Correlaciones>>>Bivariadas 112 63 seleccionando correlación de Spearman en vez 111 66 107 72 119 52 92 75 126 76 80 118 81 120 84 114 115 29 118 42 128 48 128 50 123 69 116 59 125 27 126 60 122 71 126 88 127 63 86 88 142 53 132 50 87 111 123 59 133 76 106 72 103 90 118 68 114 93 94 91 Importamos la tabla en el programa SPSS.
y de correlación de Pearson.
Prueba de contraste de hipótesis no-paramétrica utilizada: Usaremos el coeficiente de correlación de Spearman ya que es la prueba no-paramétrica usada para comparar dos variables cuantitativas. Su prueba paramétrica equivalente es el coeficiente de correlación de Pearson.
Bioestadística 2º Medicina UPF-UAB • Comparación con los resultados obtenidos con pruebas paramétricas, indicando la prueba paramétrica equivalente (SPSS): Correlaciones PEARSON Pesoalnacer Pesoalnace Correlación de Pearson Aumentopeso 1 -,668 Sig. (bilateral) ,000 N Aumentopeso ** Correlación de Pearson 32 32 ** 1 -,668 Sig. (bilateral) ,000 N 32 32 **. La correlación es significativa al nivel 0,01 (bilateral).
Correlaciones SPEARMAN Rho de Spearman Pesoalnacer Coeficiente de correlación Sig. (bilateral) N Aumentopeso Pesoalnace Coeficiente de correlación Sig. (bilateral) N Aumentopeso 1,000 .
-,596 ** ,000 32 32 ** 1,000 -,596 ,000 .
32 32 **. La correlación es significativa al nivel 0,01 (bilateral).
• Resultados y conclusiones: Tanto usando el coeficiente de correlación de Pearson, como usando el de Spearman el valor de p < 0,05, por lo que podemos rechazar la hipótesis nula con ambos métodos y afirmar que existe una correlación entre el peso de los niños al nacer y su aumento de peso.
Sin embargo, la diferencia que podemos observar es que usando Pearson obtenemos una mayor correlación lineal (r = -0,668) que usando Spearman (r = -0,596), indicándonos que en el coeficiente de correlación de Pearson las variables covarían negativamente de forma más intensa que con Spearman.
Bioestadística 2º Medicina UPF-UAB 2. Se pensó que un programa de ejercicios regulares moderadamente activos podría beneficiar a los pacientes que habían sufrido previamente un infarto de miocardio. Once individuos participaron en un estudio para comprobar este argumento. Antes de que empezara el programa, se determinó la capacidad de trabajo de cada persona midiendo el tiempo que se tomó para alcanzar una tasa de 160 latidos por minuto mientras caminaba sobre una rueda de andar. Después de 25 semanas de ejercicio controlado, se repitieron las medidas en la rueda de andar y se registró la diferencia en tiempo para cada sujeto. Resultaron los siguientes datos: • Antes Después 1 7,6 14,7 2 9,9 14,1 3 8,6 11,8 4 9,5 16,1 5 8,4 14,7 6 9,2 14,1 7 6,4 13,2 8 9,9 14,9 9 8,7 12,2 10 10,3 13,4 11 8,3 14,0 Prueba de contraste de hipótesis no-paramétrica utilizada: Usaremos la prueba de Wilcoxon de los rangos sin signo que es la prueba no-paramétrica usada para comparar la tendencia central en datos apareados. Su prueba paramétrica equivalente es la t de student apareada.
• Comparación con los resultados obtenidos con pruebas paramétricas, indicando la prueba paramétrica equivalente (SPSS): Rangos WILCOXON Después - Antes Rangos negativos Rangos positivos a. Después < Antes b. Después > Antes N Rango Suma de promedio rangos 0 a ,00 ,00 11 b 6,00 66,00 c Empates 0 Total 11 Bioestadística 2º Medicina UPF-UAB c. Después = Antes Estadísticos de contraste b Después Antes Z -2,934 Sig. asintót. (bilateral) a ,003 a. Basado en los rangos negativos.
b. Prueba de los rangos con signo de Wilcoxon > grupo1<-c(7.6,9.9,8.6,9.5,8.4,9.2,6.4,9.9,8.7,10.3,8.3) > grupo2<-c(14.7,14.1,11.8,16.1,14.7,14.1,13.2,14.9,12.2,13.4,14) > t.test(grupo1,grupo2,paired=TRUE) Paired t-test data: grupo1 and grupo2 t = -11.4749, df = 10, p-value = 4.445e-07 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -6.122862 -4.131684 sample estimates: mean of the differences -5.127273 > wilcox.test(grupo1,grupo2,paired=TRUE) Wilcoxon signed rank test data: grupo1 and grupo2 V = 0, p-value = 0.0009766 alternative hypothesis: true location shift is not equal to 0 Bioestadística 2º Medicina UPF-UAB NOTA: la diferencia entre las pruebas paramétricas y las no paramétricas es que la primeras, para poder aplicarse, deben pasar mucho “filtros” como por ejemplo seguir una distribución normal. En el caso de las no paramétricas, no exigen cumplir todos los “filtros” de las paramétricas, pero a cambio pierden potencia estadística.
NOTA: Potencia estadística à Capacidad para encontrar diferencias cuando las hay. Capacidad de rechazar hipótesis nula. Depende la N, de la variable y de la prueba estadística a utilizar. En general las pruebas no paramétricas tienen menos potencia estadística.
3. Se tratan cuatro grupos de pacientes con diferentes fármacos antihelmínticos. Tras un período de 15 días de tratamiento se lleva a cabo un recuento de larvas vivas en heces. Los resultados fueron: • 1 2 3 4 279 378 172 381 338 275 335 346 334 412 335 340 198 265 282 471 303 286 250 318 Prueba de contraste de hipótesis no-paramétrica utilizada: Usaremos la prueba de Kruskel-Wallis que es la prueba no-paramétrica usada para comparar la tendencia central de dos o más grupos, y en este caso queremos comparar la de 4 grupos. Su prueba paramétrica equivalente es ANOVA.
• Comparación con los resultados obtenidos con pruebas paramétricas, indicando la prueba paramétrica equivalente: Rangos Rango grupo larvasvivasheces N promedio 1,00 5 8,40 2,00 5 10,60 3,00 5 7,20 4,00 5 15,80 Total 20 Bioestadística 2º Medicina UPF-UAB Estadísticos de contraste a,b larvasvivashece KRUSKEL s Chi-cuadrado 6,205 gl 3 Sig. asintót.
,102 a. Prueba de Kruskal-Wallis b. Variable de agrupación: grupo ANOVA larvasvivasheces Suma de cuadrados • Media gl cuadrática Inter-grupos 27234,200 3 9078,067 Intra-grupos 63953,600 16 3997,100 Total 91187,800 19 F 2,271 Sig.
,119 Resultados y conclusiones: El valor de p usando la prueba de Kruskal-Wallis es de 0,102 (p > 0,05) por lo que no podemos rechazar la hipótesis nula y no podemos afirmar que haya una relación significativa entre el tipo de fármaco usado y el número de larvas vivas en heces.
Por tanto, ninguno es mejor ni peor. El valor de P usando ANOVA es ligeramente mayor (p = 0,119) que el obtenido con Kruskal-Wallis (p = 0,102), pero en ambos casos p es mayor que 0,05 por lo que no podemos rechazar la hipótesis nula con ninguna de las dos pruebas.
4. Dos grupos de ratas hembra fueron sometidas a dietas con alto y bajo contenido de proteínas y se determinó el aumento de peso en cada rata entre los días 28 y 84. Los resultados fueron: Aumento peso para dieta con alto contenido prot Aumento de peso para dieta con bajo contenido prot 134 70 146 118 104 101 119 85 124 107 161 132 107 94 83 Bioestadística 2º Medicina UPF-UAB 113 129 97 123 • Prueba de contraste de hipótesis no-paramétrica utilizada: Usaremos la prueba de Mann-Whitney que es la prueba no-paramétrica usada para comparar la tendencia central de dos grupos independientes. Su prueba paramétrica equivalente es la t de student (datos apareados independientes).
• Comparación con los resultados obtenidos con pruebas paramétricas, indicando la prueba paramétrica equivalente: Rangos Dieta Aumentopeso N Rango Suma de promedio rangos 1,00 12 11,71 140,50 2,00 7 7,07 49,50 Total 19 Estadísticos de contraste MANN-WHITNEY b Aumentopeso U de Mann-Whitney 21,500 W de Wilcoxon 49,500 Z -1,733 Sig. asintót. (bilateral) Sig. exacta [2*(Sig.
unilateral)] a. No corregidos para los empates.
b. Variable de agrupación: Dieta ,083 ,083 a Bioestadística 2º Medicina UPF-UAB Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas Prueba T para la igualdad de medias 95% Intervalo de F Aumentopeso Se han asumido Sig.
t ,015 ,905 1,891 gl 17 Diferencia Error típ.
confianza para la Sig.
de de la diferencia (bilateral) medias diferencia ,076 19,00000 10,04528 varianzas iguales No se han asumido varianzas iguales • Inferior Superior - 40,19368 2,19368 1,911 13,082 ,078 19,00000 9,94400 - 40,46907 2,46907 Resultados y conclusiones: El valor de p usando Mann-Whitney es de 0,083 (p > 0,05) por lo que no podemos rechazar la hipótesis nula y no podemos afirmar que los tipos de dieta estén relacionados con el aumento de peso.
Usando t de Student para datos apareados independientes el valor de P es menor (p = 0,076) que el obtenido con Mann-Whitney (p = 0,083), pero en ambos casos no se puede rechazar la hipótesis nula.
...