3.2. Tests d'Hipòtesis (2015)

Resumen Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Gestión Aeronáutica - 1º curso
Asignatura Estadística
Año del apunte 2015
Páginas 9
Fecha de subida 10/03/2015
Descargas 4
Subido por

Descripción

Tests d'hipòtesis, test de comparació de mitjanes, test de comparació de proporcions, tests khi-quadrat

Vista previa del texto

TEMA 3.2 – TEST D’HIPÒTESIS 1. Formulació del test H0= Hipòtesi nul·la µ=µ0 (25 en el exemple) Hi/HA=Hipòtesi alternativa µ≠µ (25≠ en el exemple) X=Concentració de l’enzim en els treballadors ~N(µ, 𝜎 2 )=N(µ=25, 𝜎 2 = 45) 2. Elecció de l’estadístic de la prova (=test) 𝑋̅ −µ 𝜎⁄ ~N(0,1) 𝑛 3. Determinació de la regió de rebuig o significativa α = nivell de significació = 0,05 α⁄ = 0,025 2 4. Conclusió de l’estadística: Avaluem l’estadístic suposant que H0 és correcta µ=25, 𝑥̅ =20 𝑋̅ −µ Z=𝜎 ⁄ 𝑛 √ ̅̅̅̅ 20−25 = √45 ⁄ √10 = -2,36 Cau a la regió significativa i per tant rebutgem H0 i acceptem l’alternativa. La hipòtesi és incorrecte µ=25, 𝑥̅ =22 𝑋̅ −µ Z=𝜎 ⁄ 𝑛 √ ̅̅̅̅ 22−25 = √45 ⁄ √10 = -1,41 Cau a la regió de rebuig. No hi ha evidència que ens permeti rebutjar la hipòtesi nul·la H0. El possible error s’anomena error de tipus II=𝛽  COMENTARIS o Hi ha dos tipus de tests  Test bilateral: H0→ µ=µ0 / HA → µ≠µ0 Un test bilateral és equivalent a determinar un interval de confiança I= 𝑋̅ ± 𝑎 ̅̅̅̅ ± 1′96 I= 20 √45 ̅̅̅ ± 1′96 I= ̅22 √45 √10 √10 𝜎 √𝑛 a-N(0,1) = (15,8-24’2) ∄ 25 = (17,8-26’2) ∃ 25  Test unilateral: H0→ µ=µ0/HA → µ<µ0 \ H0→ µ=µ0 / HA → µ>µ0 o El valor de 𝛼 és una decisió de l’observador (o experimentador) o P-valor = probabilitat d’obtenir un valor tant o més extrem que l’observat realment = probabilitat d’equivocar-nos si rebutgem la hipòtesi nul·la (probabilitat d’error de tipus I) 𝑥̅ =20 p-valor = P(z< -2’36) + P(z> 2’36) = 0’0182 𝛼 > p-valor → Rebutgem H0 𝛼 < p-valor → No podem rebutjar H0 𝑥̅ =22 p-valor = P(z< -1’41) + P(z> 1’41) = 0’1586 𝛼 < p-valor → No podem rebutjar H0 Test sobre la mitjana de població µ 𝑋̅ −µ A. Z=𝜎 B.
C.
~N(0,1) ⁄ 𝑛 √ 𝑋̅ −µ T=𝑠 ~ T(n-1) ⁄ 𝑛 √ ̅ 𝑋 −µ Z=𝑆 ~N(0,1) ⁄ √𝑛 (𝜎 és coneguda i X ~N(µ, 𝜎2) (𝜎 és desconeguda i X ~N(µ, 𝜎2) (𝜎 és desconeguda, X arbitraria però n≥30) Exemple 1: La divisió de camions de gran tonatge d’una empresa d’automoció vol determinar el nivell de contaminació acústica provocada per un nou model de camió. Amb aquest objectiu es mesura el nivell de soroll de 6 d’aquests camions amb el motor funcionant a 3000 rpm obtenint els següents resultats (en dB) 85,4 86,8 86,1 85,3 84,8 86,0 A partir d’aquestes dades, hi ha evidència estadística que el nivell mitjà de soroll d’aquest model de camió funcionant a 3000 rpm és superior a 85 decibels? Suposeu: 𝛼 = 0,05 𝑖 ∶ 𝛼 = 0,01 1. Test H0→ µ=85 HA→ µ>85 X= nivell de soroll d’un camió 2. Estadístic de la prova 𝑋̅ −µ T=𝑠 ⁄ 𝑛 √ ~ T(n-1)=t(5) 3. Regió de rebuig t(5) 𝛼 = 0,05 → 𝑎 = 2,0150 (𝐵𝑢𝑠𝑐𝑎𝑟 𝑎 𝑙𝑎 𝑇𝑎𝑢𝑙𝑎 𝑑𝑒 𝑡 𝑑𝑒 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 5 − 0,950) 𝛼 = 0,01 → 𝑎 = 3,3649 (𝐵𝑢𝑠𝑐𝑎𝑟 𝑎 𝑙𝑎 𝑇𝑎𝑢𝑙𝑎 𝑑𝑒 𝑡 𝑑𝑒 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 5 − 0,990) 4. Avaluació estadístic suposant que H0 és correcte ̅ −µ X T=s ⁄ n √ ̅̅̅̅̅̅̅̅ 85,73−85 = 0,709 ⁄ √6 = 2,53 Si 𝛼 = 0,05 l’estadístic cau a la regió significativa i rebutgem H0 Si 𝛼 = 0,01 l’estadístic Exemple 2: En un estudi sobre el nombre de dies d’hospitalització per intervencions quirúrgiques a l’àrea de traumatologia d’un gran hospital s’han examinat els historials clínics de n=150 pacients obtenint un valor mitjà de 𝑥̅ =4,6 dies amb una desviació típica de s=2,3. Proporcionen aquestes dades evidència suficient de que la mitjana de dies d’hospitalització d’aquest tipus de pacient és major que 4? Considereu 𝛼 = 0,05 𝑖 𝛼 = 0,01. Quin és el p-valor de la prova? 1. Test H0: µ=4 HA: µ>4 X= dies hospitalització 2. Estadístic de la prova N=150>30 (gran) 𝑋̅ −µ Z= 𝑠 ⁄ 𝑛 √ ~N(0,1) 3. Regió de rebuig N(0,1) 𝛼 = 0,05 (𝑝𝑒𝑟 𝑠𝑜𝑡𝑎 1 − 𝛼 ) → 𝑎 = 1,64( 𝑇𝑎𝑢𝑙𝑎 𝑁𝑜𝑟𝑚𝑎𝑙 − 0,9495) 𝛼 = 0,01 (𝑝𝑒𝑟 𝑠𝑜𝑡𝑎 1 − 𝛼 ) → 𝑎 = 2,32 (𝑇𝑎𝑢𝑙𝑎 𝑁𝑜𝑟𝑚𝑎𝑙) 4. Avaluació estadístic suposant que H0 és correcte ̅ −µ X Z=s ⁄ n √ ̅̅̅̅ 46−4 =23 ⁄ √150 = 3,195 Si 𝛼 = 0,05 Acceptem l’alternativa HA Si 𝛼 = 0,01 Acceptem l’alternativa HA MATEIXA CONCLUSIÓ 5. p-valor= probabilitat d’obtenir un valor de l’estadístic tant o més extrem de 3,195. (Mirem a la taula de la normal 3,195, dibuixem la regió crítica i calculem probabilitat. Com el test és unilateral només hi haurà la cua superior) P(Z>3,195)= 1-P(Z<3,195)=1-0,993= 0,0007 Exemple 3: En una mostra de 100 vols intercontinentals d’una certa companyia aèrea es constata que en 23 d’ells s’ha proporcionat menjar específic a passatgers amb necessitats especials. Podem concloure que la proporció de vols intercontinentals que precisen de menjar específic és superior a 0,20? Considereu 𝛼 = 0,05 𝑖 𝛼 = 0,01. Quin és el p-valor de la prova? 1. Test Fet important: 𝑝̂−𝑝0 𝑝0(1−𝑝0) √ 𝑛 ~N(0,1) Si nP0 (1-p0)≥ 18 Com a mínim np0>5 i n(1-p0)>5 n=100 𝑝̂ = 0,23 H0: p=0,20 HA: p>0,20 2. Estadístic Np0(1-p0) = 100 0,23*0,77= 17,71 (Acceptable) <18 𝑝̂−𝑝0 Z= 𝑝0(1−𝑝0) √ 𝑛 3. Regió de rebuig N(0,1) 𝛼 = 0,05 (𝑝𝑒𝑟 𝑠𝑜𝑡𝑎 1 − 𝛼 ) → 𝑎 = 1,64( 𝑇𝑎𝑢𝑙𝑎 𝑁𝑜𝑟𝑚𝑎𝑙 − 0,9495) 4. Avaluació estadístic. Calculem Z suposant que H0 és correcte Z= ̂ −0,20 0,23 = 0,75 0,20(1−0,20) 100 √ NO podem rebutjar la hipòtesi nul·la TEST DE COMPARACIÓ DE MITJANES Fet important Si X1 i X2 són variables nominals; X1 ~ N( µ,𝜎 2 ) on 𝜎1 i 𝜎2 conegudes Si són independents llavors Z= (𝑋̅1 −𝑋̅2 )−(µ1 −µ2 ) 𝜎2 𝑖 ~N(0,1) √ + µ2 𝑛1 𝑛2 Exemple 1 S’ha analitzat la concentració d’àcid úric en sèrum en dues mostres d’individus, la primera formada per 12 persones afectades d’una determinada nefropatia i la segona formada per 15 persones sanes. S’ha obtingut X1 = 4,5mg/100ml i X2 = 3,4mg/100ml. Se sap que les distribucions són normals i que 𝜎1 = 𝜎2 = 1. Podem concloure, amb nivell de significació 𝛼 = 0,05, que aquesta malaltia renal altera la concentració d’àcid úric en sang? 1. Test H0: µ1 - µ2 = 0 HA: µ1 - µ2 ≠ 0 (µ1 - µ2 > 0 ; µ2 - µ1 >0) n1 = 12 n2 = 15 𝑋̅1 = 4,5 𝑋̅2 = 3,4 𝜎1 = 1 El test que volem estudiar és bilateral 𝜎2 = 1 2. Estadístic de la prova Z= (𝑋̅1 −𝑋̅2 )−(µ1 −µ2 ) 𝜎2 𝑖 ~N(0,1) √ + µ2 𝑛1 𝑛2 3. Regió de rebuig: Determinació de la regió crítica N(0,1) 𝛼 = 0,05 𝛼⁄ = 0,025; a= 1’96 2 4. Conclusió de l’estadístic: Avaluem l’estadístic suposant que H0 és cert H0 és estadístic Z= (45−3)−0 1 12 √ + 1 15 ~N(0,1) = 2’84 Sí que hi ha diferència 5. p-valor: Probabilitat d’error si rebutgem H0 Probabilitat d’obtenir resultat tant o més extrem que l’observat realment p-valor = 2*0,0023 = 0,0043 Fet important Si X1 i X2 són observacions independents i normals Xi ~ N(µi, 𝜎 2i) on 𝜎 1 i 𝜎 2 són desconegudes però podem suposar que són iguals; llavors: T= (𝑋̅1 − 𝑋̅2 )−(µ1 − µ2 ) 2 2 𝑛1 𝑛2 ~t(n1+n2 – 2) on 𝑆𝑃2 = (𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆12 𝑆 𝑆 √ 𝑝+ 𝑝 Exemple 2: COPIAR EXEMPLE DEL MOODLE 1. Test H0: µ1 - µ2 = 0 HA: µ1 - µ2 > 0 (𝑛1 +𝑛2 −2) 2. Estadístic de la prova T= (𝑋̅1 − 𝑋̅2 )−(µ1 − µ2 ) 2 2 𝑛1 𝑛2 ~t(n1+n2 – 2) on 𝑆𝑃2 = (𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆12 𝑆 𝑆 √ 𝑝+ 𝑝 (𝑛1 +𝑛2 −2) 3. Regió significativa t(75+80-2)= t(153) 𝛼 = 0,05 Regió significativa = 0,95 4. Conclusió de l’estadístic: Avaluem l’estadístic suposant que H0 és cert 𝑆𝑃2 = T= (𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆12 (𝑛1 +𝑛2 −2) (3380,1)−(0−3356,50) 97,16 97,16 + 75 80 = 97,16 = 14,89 Rebutgem H0 √ Fet important Si X1 i X2 són observacions independents i Xi ~ N(µi, 𝜎 2i) però 𝜎1 i 𝜎 2 són desconegudes i 𝜎1 ≠ 𝜎2; llavors: T= (𝑋̅1 − 𝑋̅2 )−(µ1 − µ2 ) 𝑆2 𝑆2 √ 1+ 2 𝑛1 𝑛2 ~t(Student) Fet important Si X1 i X2 són observacions referides al mateix experiment o individu i Xi ~ N(µi,𝜎2i) llavors XD = X1 – X2 i efectuem el test aplicat a la variable XD ~N(µD = µ1 - µ2, 𝜎 2D) Exemple 1 En un gabinet de psicologia es vol determinar si un determinat fàrmac psicoactiu té efectes sobre la capacitat de concentració. Amb aquest objecte es demana a 6 voluntaris que mecanografiïn textos d’una determinada extensió, abans i després d’haver pres el fàrmac. Al comptar el nombre d’errades de cada un dels sis voluntaris s’han obtingut els següents resultats ABANS 12 15 9 10 7 18 DESPRÉS 13 21 12 11 6 19 DIFERÈNCIA 1 6 3 1 -1 1 XD = X2 – X1 ~N(µD , 𝜎 2D) Podem concloure que aquest fàrmac produeix alteracions en la capacitat de concentració? Se suposa normalitat i es pren α = 0.05 .
1. Test H0: µD=0 HA: µD ≠ 0 2. Estadístic T= 𝑥𝐷 −µ𝐷 𝑆𝐷 ⁄ √𝑛 = 1,883−0 = 2,4014 ⁄ √6 1,87 3. Regió de rebuig t(5) 𝛼 = 0,05 𝛼⁄ = 0,025; a = 2,0150; -a = -2,0150 2 Exemple 2 En un estudi sobre el possible increment de l’altura en el pas d’una generació a la següent s’ha considerat una mostra de 10 mares amb les seves corresponents filles obtenint els resultats indicats a la taula: Alç. mare 165 160 170 162 173 157 178 168 173 170 Alç. filla 173 168 173 167 175 168 173 170 174 170 A partir d’aquesta taula, podem concloure amb nivell de significació 𝛼 = 0,05 que l’altura de les filles és superior a la de les mares?(análisis de datos excel) TEST DE COMPARACIÓ DE PROPORCIONS Considerem dues poblacions i examinem una característica amb proporcions P1 i P2. A partir de dues mostres de mides n1 i n2 obtenim les proporcions mostrals 𝑃̂1 i ̂2 𝑃 Fet important Si n1 i n2 són grans i p1 = p2 ̂1 − p ̂2 p ̅ (1−p ̅) p ̅ (1−p ̅) p √ n + n 1 2 𝑛1 𝑝̂1 + 𝑛2 𝑝̂2 ~N(0,1) ; 𝑃̅ = 𝑛1 + 𝑛2 Exemple 3 Es vol comparar l’eficàcia de dos tractaments diferents A i B que s’apliquen als afectats d’una certa malaltia. El tractament A s’aplica a 150 malalts i el tractament B a un grup de 200 malalts obtenint el següent resultat: n Individus curats Tractament A = 150 21 Tractament B = 200 48 Podem concloure a partir d’aquestes dades i amb nivell de significació 𝛼 = 0,05 que el tractament B és més eficaç? 1. Test H0: P1 = P2 H A: P1 < P2 2. Estadístic de la prova ̂1 − p ̂2 p ̅ (1−p ̅) p ̅ (1−p ̅) p √ n + n 1 2 ~N(0,1) ; 𝑃̅ = 𝑛1 𝑝̂1 + 𝑛2 𝑝̂2 𝑛1 + 𝑛2 3. Regió de rebuig 𝛼 = 0,05; 𝑎 = −1′64 4. Conclusió de l’estadístic: Avaluem l’estadístic suposant que H0 és correcte Z= 21 48 + 150 200 1 1 √0,197 ( + ) 150 200 = -2,33 Rebutgem H0 ...

Tags: