HH (2007)

Otro Portugués
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Bioquímica - 5º curso
Asignatura HH
Año del apunte 2007
Páginas 17
Fecha de subida 19/10/2014
Descargas 31
Subido por

Vista previa del texto

PRÀCTICA 2 – Bioestadística 1. Estudi sobre el Leptograpsus variegatus A la taula crabs de la mateixa llibreria MASS, trobareu informació sobre diverses mesures de dos tipus de cranc de l’espècie Leptograpsus variegatus. Feu un estudi comparatiu de tres variables a escollir per tal d’analitzar les diferències entre les mitjanes per sexes i per colors.
> library(MASS) > attach(crabs) VARIABLE CL Test de normalitat > boxplot(CL[sex=="F"],CL[sex=="M"]) # Hipòtesi nul·la ( ) = dades normals; Hipòtesi alternativa ( # Comprovarem i ) = dades no normals.
en mascles i femelles per la variable CL.
# Comprovarem la normalitat de les dades en femelles.
1 > hist(CL[sex=="F"]) > qqnorm(CL[sex=="F"]);qqline(CL[sex=="F"]) # Els gràfics ens donen una idea de la normalitat de les dades, amb el test Shapiro podrem comprovar si podem considerar-les o no normals.
> shapiro.test(CL[sex=="F"]) Shapiro-Wilk normality test data: CL[sex == "F"] W = 0.9882, p-value = 0.5217 # Com que p>0.05, acceptem la hipòtesi nul·la de normalitat, les nostres dades són normals.
# Comprovarem la normalitat de les dades en mascles.
2 > hist(CL[sex=="M"]) > qqnorm(CL[sex=="M"]);qqline(CL[sex=="M"]) > shapiro.test(CL[sex=="M"]) Shapiro-Wilk normality test data: CL[sex == "M"] W = 0.9859, p-value = 0.3707 # Com que p>0.05, acceptem la hipòtesi nul·la de normalitat.
Test d’igualtat de variàncies 3 # Tant mascles com femelles són normals, de manera que podem aplicar el test de la variància per saber si tenen iguals variàncies o no. Entenem com a hipòtesi nul·la que les variàncies són iguals i com a hipòtesi alternativa que les variàncies són diferents.
> var.test(CL[sex=="F"],CL[sex=="M"]) F test to compare two variances data: CL[sex == "F"] and CL[sex == "M"] F = 0.8049, num df = 99, denom df = 99, p-value = 0.282 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.5415881 1.1963089 sample estimates: ratio of variances 0.8049265 # Com que p>0.05 acceptem la hipòtesi nul·la, de manera que acceptem que les variàncies són iguals, de manera que podem aplicar el test.t indicant-ho.
Test d’igualtat de mitjanes # En aquest test entenem com a hipòtesi nul·la que no existeixen diferències entre les mitjanes de CL per mascles i femelles, mentre que la hipòtesi alternativa diu que sí que hi ha diferències.
> t.test(CL[sex=="F"],CL[sex=="M"],var.equal=T) Two Sample t-test data: CL[sex == "F"] and CL[sex == "M"] t = -1.4854, df = 198, p-value = 0.139 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 4 -3.4703888 0.4883888 sample estimates: mean of x mean of y 31.360 32.851 # Com que p>0.025 podem acceptar la hipòtesi nul·la. D’aquesta manera, observem que per les dades de la variable CL les mitjanes no varien segons el sexe.
VARIABLE FL Test de normalitat > boxplot(FL[sex=="F"],FL[sex=="M"]) # Hipòtesi nul·la ( ) = dades normals; Hipòtesi alternativa ( # Comprovarem i ) = dades no normals.
en mascles i femelles per la variable FL.
# Comprovarem la normalitat de les dades en femelles.
> hist(FL[sex=="F"]) 5 > qqnorm(FL[sex=="F"]);qqline(FL[sex=="F"]) > shapiro.test(FL[sex=="F"]) Shapiro-Wilk normality test data: FL[sex == "F"] W = 0.9878, p-value = 0.4939 # Com que p>0.05, acceptem la hipòtesi nul·la de normalitat.
# Comprovarem la normalitat de les dades en mascles.
6 > hist(FL[sex=="M"]) > qqnorm(FL[sex=="M"]);qqline(FL[sex=="M"]) > shapiro.test(FL[sex=="M"]) Shapiro-Wilk normality test data: FL[sex == "M"] W = 0.9902, p-value = 0.6801 # Com que p>0.05, acceptem la hipòtesi nul·la de normalitat, de manera que tant mascles com femelles són normals.
Test d’igualtat de variàncies 7 > var.test(FL[sex=="F"],FL[sex=="M"]) F test to compare two variances data: FL[sex == "F"] and FL[sex == "M"] F = 1.0435, num df = 99, denom df = 99, p-value = 0.8326 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.7021198 1.5509059 sample estimates: ratio of variances 1.043514 # Com que p>0.05 acceptem la hipòtesi nul·la, de manera que les variàncies són iguals.
Test d’igualtat de mitjanes > t.test(FL[sex=="F"],FL[sex=="M"],var.equal=T) Two Sample t-test data: FL[sex == "F"] and FL[sex == "M"] t = -0.61, df = 198, p-value = 0.5426 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -1.2783367 0.6743367 sample estimates: mean of x mean of y 15.432 15.734 # Com que p>0.025 acceptem la hipòtesi nul·la, de manera que acceptem que les mitjanes són iguals, no hi ha diferència entre les mitjanes de FL en mascles i femelles.
8 VARIABLE RW Test de normalitat > boxplot(RW[sex=="F"],RW[sex=="M"]) # Hipòtesi nul·la ( ) = dades normals; Hipòtesi alternativa ( # Comprovarem i ) = dades no normals.
en mascles i femelles per la variable RW.
# Comprovarem la normalitat de les dades en femelles.
> hist(RW[sex=="F"]) > qqnorm(RW[sex=="F"]);qqline(RW[sex=="F"]) 9 > shapiro.test(RW[sex=="F"]) Shapiro-Wilk normality test data: RW[sex == "F"] W = 0.9877, p-value = 0.4889 # Com que p>0.05 acceptem la hipòtesi nul·la, de manera que acceptem que les dades són normals.
# Comprovarem la normalitat de les dades en mascles.
> hist(RW[sex=="M"]) > qqnorm(RW[sex=="M"]);qqline(RW[sex=="M"]) 10 > shapiro.test(RW[sex=="M"]) Shapiro-Wilk normality test data: RW[sex == "M"] W = 0.9868, p-value = 0.4246 # Com que p>0.05 acceptem la hipòtesi nul·la, de manera que les dades de RW són normals tant en mascles com en femelles.
Test d’igualtat de variàncies > var.test(RW[sex=="F"],RW[sex=="M"]) F test to compare two variances data: RW[sex == "F"] and RW[sex == "M"] F = 1.6092, num df = 99, denom df = 99, p-value = 0.01878 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 1.082745 2.391666 sample estimates: ratio of variances 11 1.609212 # Com que p<0.05 rebutgem la hipòtesi nul·la i acceptem l’alternativa, de manera que les variàncies són diferents. D’aquesta manera, a l’hora d’aplicar el t.test no podrem tenir en compte la igulatat de variàncies.
Test d’igualtat de mitjanes > t.test(FL[sex=="F"],FL[sex=="M"]) Welch Two Sample t-test data: FL[sex == "F"] and FL[sex == "M"] t = -0.61, df = 197.91, p-value = 0.5426 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -1.2783394 0.6743394 sample estimates: mean of x mean of y 15.432 15.734 # Com que p>0.025 acceptem la hipòtesi nul·la, de manera que no hi ha diferència entre les mitjanes de mascles i femelles per la variable RW.
12 2. Estudi sobre hàbits d’estudiants A la taula survey de la llibreria MASS, (la informació de la qual trobareu a http://cran.rproject.org/web/packages/MASS/MASS.pdf), tenim una col·lecció de dades d’un grup d’estudiants d’estadística de la Universitat d’Adelaide.
> library(MASS) > attach(survey) a) La dependència entre l’edat dels estudiants i el sistema mètric utilitzat. Pot ser convenient repartir els alumnes en grups d’edat utilitzant quantils.
> q1<-quantile(Age,0.25) > q2<-quantile(Age,0.5) > q3<-quantile(Age,0.75) > summary(M.I[Age<q1]) Imperial Metric 22 26 NA's 11 > summary(M.I[Age<q2]) Imperial Metric 42 56 NA's 18 > summary(M.I[Age<q3]) Imperial Metric 53 98 NA's 25 > summary(M.I[Age>=q3]) Imperial Metric 15 43 NA's 3 # Hem fet un recompte dels sistemes mètrics emprats en cada quantil. A partir d’aquí podem formar una matriu, tenint en compte que a q2 cal restar-li q1 i que a q3 cal restar-li q2 per tal de no repetir dades.
> Imperial<-c(22,20,11,15) > Metric<-c(26,30,42,43) > SistMetricMatriu<-rbind(Imperial,Metric) > dimnames(SistMetricMatriu)=list(c("Imperial","Metric"),c("Age<q1","Age<q2","Age<q3", "Age>=q3")) 13 > SistMetricMatriu Age<q1 Age<q2 Age<q3 Age>=q3 Imperial 22 20 11 15 Metric 26 30 42 43 > mosaicplot(SistMetricMatriu) # Els gràfics ens ajuden a entendre la independència (segons l’alineació), però per a saber si són o no independents les dades farem el test de chi quadrat, on la hipòtesi nul·la és que les dades són independents i la hipòtesi alternativa és que les dades no ho són.
> chisq.test(SistMetricMatriu) Pearson's Chi-squared test data: SistMetricMatriu X-squared = 9.664, df = 3, p-value = 0.02165 # Com que p<0.05 rebutgem la hipòtesi nul·la, de manera que el test ens mostra que les dades no són independents entre elles, sinó que són dependents. Així, podem dir que hi ha dependència entre l’edat dels estudiants i el sistema mètric utilitzat.
14 b) La igualtat o no entre les mitjanes del pam de la mà amb la que escriuen els alumnes i l’altra. Utilitzeu tests unilaterals i bilaterals dels dos tipus i discutiu-ne els resultats.
És adequat aquest test per aquestes variables? > boxplot(Wr.Hnd, NW.Hnd) # El gràfic ens ajuda a veure si les dades són o no normals, però per a confirmar-ho farem el test Shapiro per a cada cas (mà amb la que escrius i mà amb la que no escrius), on la hipòtesi nul·la diu que les dades són normals.
> shapiro.test (Wr.Hnd) Shapiro-Wilk normality test data: Wr.Hnd W = 0.9807, p-value = 0.002682 > shapiro.test (NW.Hnd) Shapiro-Wilk normality test data: NW.Hnd W = 0.9839, p-value = 0.009087 # Observem que en ambdós casos p<0.05, de manera que les dades no són normals, acceptarem la hipòtesi alternativa.
15 # Ara cal comprovar que . D’aquesta manera podrem comprovar si les variàncies són iguals: > var.test (Wr.Hnd, NW.Hnd) F test to compare two variances data: Wr.Hnd and NW.Hnd F = 0.9124, num df = 235, denom df = 235, p-value = 0.483 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.7061286 1.1790402 sample estimates: ratio of variances 0.912444 # Com que p>0.05 -> acceptem la hipòtesi nul·la, de manera que les variàncies són iguals i això podem indicar-ho en el t.test.
# Apliquem el t.test bilateral: > t.test(Wr.Hnd, NW.Hnd, var.equal=T) Two Sample t-test data: Wr.Hnd and NW.Hnd t = 0.4882, df = 470, p-value = 0.6257 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.2615164 0.4343977 sample estimates: mean of x mean of y 18.66907 18.58263 # Com que p>0.025 acceptem la hipòtesi nul·la, és a dir, que les mitjanes són iguals, fet que indica que no hi ha diferència entre les mitjanes del pam de la mà amb la que escriuen els alumnes i l’altra.
16 # Apliquem el t.test unilateral, on la hipòtesi alternativa defensa que la diferència de les mitjanes és menor que 0.
> t.test(Wr.Hnd,NW.Hnd,alternative="less") Welch Two Sample t-test data: Wr.Hnd and NW.Hnd t = 0.4882, df = 469.017, p-value = 0.6872 alternative hypothesis: true difference in means is less than 0 95 percent confidence interval: -Inf 0.3782799 sample estimates: mean of x mean of y 18.66907 18.58263 # Com que les mitjanes són iguals no té sentit fer un test unilateral, de manera que el test unilateral no és necessari.
17 ...