Práctica 5 (2016)

Pràctica Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Estadística Aplicada - 3º curso
Asignatura Simulació, Remostreig i Aplicacions
Año del apunte 2016
Páginas 5
Fecha de subida 27/04/2016
Descargas 3
Subido por

Vista previa del texto

Pra´ctica 5: Pruebas Permutacionales (II) Anna Olmo, 1363013 March 23, 2016 1 Ejercicio 1 Considera dos poblaciones X e Y . Para la primera poblaci´on se han anotado las siguientes medidas: 121, 123, 126, 128.5 y 129 mientras que para la segunda poblaci´on se han anotado estas otras medidas: 153, 154, 155, 156 y 158. Queremos comparar la varianza de ambas poblaciones, bajo un enfoque permutacional.
> X<-c(121,123,126,128.5,129) > Y<-c(153,154,155,156,158) 1.1 1.
Considera el estad´ıstico: S = xj .
> SX<-sum(abs(X-median(X))[1:4]);SX [1] 10.5 > SY<-sum(abs(Y-median(Y))[1:4]);SY [1] 4 Realiza una prueba de permutaciones bas´andote en S. ¿A qu´e conclusi´on llegas? > > > > + + + + + > require(combinat) SXp<-0 SYp<-0 for(i in 1:120){ newX<-permn(X)[[i]] newY<-permn(Y)[[i]] SXp[i]<-sum(abs(newX-median(newX))[1:4]) SYp[i]<-sum(abs(newY-median(newY))[1:4]) } mean(SXp) [1] 10.8 > mean(SYp) [1] 5.6 Para X, da pr´ acticamente lo mismo haciendo el c´alculo que haciendo las permutaciones, as´ı que el test de permutaciones es acertado.
Para Y , da bastante diferente haciendo el c´alculo que haciendo las permutaciones, as´ı que el test de permutaciones es bastante malo.
1.2 2.
Considera el estad´ıstico: δ = i(m − i)(Xi+1 − Xi ).
1 > > + + > deltaX<-0 for(i in 1:(length(X)-1)){ deltaX<-deltaX+i*(length(X)-1)*(sort(X)[i+1]-sort(X)[i]) } deltaX [1] 70 > > + + > deltaY<-0 for(i in 1:(length(Y)-1)){ deltaY<-deltaY+i*(length(Y)-1)*(sort(Y)[i+1]-sort(Y)[i]) } deltaY [1] 56 Realiza una prueba de permutaciones bas´andote en δ. ¿A qu´e conclusi´on llegas? ¿Son consistentes los resultados en a y b? > > > > + + + + + + + + + + + + + + + > require(combinat) deltaXp<-0 deltaYp<-0 for(i in 1:120){ newX<-permn(X)[[i]] newY<-permn(Y)[[i]] deltaXp<-0 j<-1 while(j<length(newX)){ deltaXp<-deltaXp+j*(length(newX)-1)*(sort(newX)[j+1]-sort(newX)[j]) j<-j+1 } deltaYp<-0 j<-1 while(j<length(newY)){ deltaYp<-deltaYp+j*(length(newY)-1)*(sort(newY)[j+1]-sort(newY)[j]) j<-j+1 } } mean(deltaXp) [1] 70 > mean(deltaYp) [1] 56 Tanto para X como para Y , da lo mismo haciendo el c´alculo que haciendo las permutaciones, as´ı que el test de permutaciones es acertado.
2 Ejercicio 2 Los datos table.R guardan informaci´ on sobre la relaci´on entre el h´abitat y la frecuencia observada de 12 tipos diferentes de caracoles C. nemoralis. La informaci´on fue recogida de la siguiente manera: los observadores 2 escogieron diferentes zonas del sud de Inglaterra por las que fueron anotando el tipo de h´abitat de cada una de ellas y la frecuencia observada de 12 tipos diferentes de caracoles. Ellos quer´ıan ver si el tipo de h´ abitat influ´ıa en el tipo de caracol que encontraba.
2.1 1.
Realiza la prueba Chi-cuadrado de independencia e interpreta adecuadamente los resultados. Seg´ un esta, ¿influye el h´ abitat en la distribuci´ on de los 12 tipos de diferentes caracoles? > 2.2 2.
Bajo un enfoque permutacional, calcula el p-valor aproximado de la prueba de independencia para dar respuesta a la pregunta planteada en a. Considera 50000 permutaciones. ¿Son consistentes los resultados de a y b? > 3 Ejercicio 3 Considera la base de datos iris. Una prueba est´andard para evaluar la diferencia entre dos medias multivariantes es la conocida prueba T 2 de Hotelling. El estad´ıstico de dicha prueba se define de la siguiente manera: T 2 = n1 n2 (x¯1 − x¯2 ) Sp−1 (x¯1 − x¯2 )n1 + n2 .
Esteestadsticopuedetransf ormarseenunaFusandolarelacinF=(n1 + n2 − m − 1)T 2 (n1 + n2 − 2)m siendo una Fm,n1 +n2 −m−1 .
> data(iris) 3.1 1.
Construye una funci´ on para calcular la prueba T 2 de Hotelling. Realiza una prueba cl´asica para comparar las Iris Setosa y las Iris Versicolor.
Funci´ on del estad´ıstico T 2 : > T2Hotelling<-function(x1,x2){ + n1<-nrow(x1) + n2<-nrow(x2) + mx1<-apply(x1,2,mean) + mx2<-apply(x2,2,mean) + S1<-sqrt(abs(var(x1))) + S2<-sqrt(abs(var(x2))) + Sp<-( (n1-1)*S1+(n2-1)*S2 ) / ( n1+n2-2 ) + ( t(n1*n2*(mx1-mx2)) %*% solve(Sp) %*% (mx1-mx2) ) / ( n1+n2 ) + } 3 Funci´ on del estad´ıstico F : > T2toF<-function(x1,x2,nvar){ + n1<-nrow(x1) + n2<-nrow(x2) + m<-nvar + T2<-T2Hotelling(x1,x2)[1,1] + Fest<-( (n1+n2-m-1)*T2 ) / ( (n1+n2-2)*m ) + par1<-m + par2<-n1+n2-m-1 + pvalue<-df(Fest,par1,par2) + list("F"=Fest,"pvalue"=pvalue) + } Prueba: > T2toF( subset(iris,Species=="setosa")[,1:4],subset(iris,Species=="versicolor")[,1:4],ncol(iris) ) $F [1] 237.6212 $pvalue [1] 1.904226e-52 La prueba rechaza que Iris Setosa e Iris Versicolor sean iguales.
3.2 2.
Realiza una prueba permutacional basada en el estad´ıstico F y compara los resultados con los del apartado anterior.
> > > > > + + + + > iris2<-iris[1:100,] datos<-0 test<-0 p.val<-0 for(i in 1:1000){ datos<-iris2[c(sample(1:100)),] test<-T2toF(datos[1:50,1:4],datos[51:100,1:4],ncol(iris2)) p.val[i]<-test$pvalue } sum(p.val>=0.05)/1000 # num de tests que aceptan [1] 0.181 Solo un 20% de las pruebas han aceptado que sean iguales, por tanto, esto confirma que no podemos afirmar que Iris Setosa e Iris Versicolor sean iguales.
4 ...

Tags: