Tema 7. Teoria clàssica del contrast d'hipòtesi (2015)

Apunte Catalán
Universidad Universidad Pompeu Fabra (UPF)
Grado Medicina - 2º curso
Asignatura Bioestadística
Año del apunte 2015
Páginas 6
Fecha de subida 03/02/2015
Descargas 8
Subido por

Vista previa del texto

Tema 7. Teoria estadística del contrast d’hipòtesis L’estadística inferencial estudia la població a partir d’una mostra representativa mitjançant dos tipus de mètodes estadístics: l’estimació de paràmetres poblacionals i les proves de contrast d’hipòtesis. L’estimació de paràmetres poblacionals s’ha vist al tema anterior, i aquest es centrarà en les proves de contrast d’hipòtesis. Aquestes proves permeten comprovar la versemblança d’una hipòtesi formulada sobre la població a partir d’un estudi dut a terme en una o més mostres representatives. Per exemple, verificar si el nivell mig de colesterol en la població catalana masculina és superior al de la població catalana femenina.
1. HIPÒTESI NUL· LA I CONTRASTADA Les proves de contrast d’hipòtesi s’inicien amb una observació sobre una mostra i pretenen contrastar dues hipòtesis alternatives: • H0 o hipòtesi nul·la Expressa la probabilitat de que l’observació duta a terme en la mostra sigui únicament fruit de l’atzar.
• Ha o hipòtesi contrastada o alternativa Indica que l’observació duta a terme reflexa la situació real en la població.
L’objectiu és descartar la hipòtesi nul·la calculant la seva probabilitat per poder acceptar la hipòtesi a contrastar i determinar que l’observació és estadísticament significativa.
2. PROVES DE CONTRAST D’HIPÒTESIS Un mètode per acceptar o refusar hipòtesis és realitzar una prova de contrast d’hipòtesis, basada en estimar la versemblança de l’observació realitzada assumint que és certa una de les hipòtesis i calcular aquesta probabilitat.
Exemple Imaginem que mesurem la incidència de càncer de mama entre un grup de 100 dones fumadores i no fumadores.
Es plantegen dues hipòtesis: - H0 Les dones fumadores i les no fumadores tenen el mateix risc de contraure el càncer.
- Ha Les dones fumadores i les no fumadores tenen diferent risc de contraure el càncer.
Per acceptar la hipòtesi alternativa cal descartar la hipòtesi nul·la, que indica que les diferències observades són únicament fruit de l’atzar.
Fuma No fuma Els resultats semblen no ser compatibles amb la Càncer 50 0 hipòtesis nul·la, per tant H0 és molt poc poblable i pot No càncer 0 50 ser refusada.
Càncer No càncer Fuma 40 10 No fuma 10 40 Els resultats semblen no ser molt compatibles amb la hipòtesis nul·la. H0 és poc poblable i pot ser refusada.
Càncer No càncer Fuma 28 22 No fuma 22 28 Els resultats semblen no permetre descartar la hipòtesi nul·la. H0 pot ser o no refusada 3. EL VALOR P La metodologia de les proves de contrast d’hipòtesis es basen en calcular objectivament la probabilitat (p) d’obtenir un resultat com l’observat en la mostra o més extrem únicament per atzar, suposant que la hipòtesi nul·la H0 sigui certa.
El valor p pot prendre valors entre 0 i 1, indicant 0 que la hipòtesi nul·la és impossible i 1 que H0 és segura. En aquesta escala s’estableix un valor anomenat risc (α) per sota del qual es refusarà la hipòtesi nul·la i s’acceptarà la hipòtesi contrastada.
El risc, per tant, és un llindar de probabilitat que s’imposa per definir la certesa d’una prova, és a dir, per afirmar una de les dues hipòtesis, H0 o Ha.
- Si p < risc Es refusa la hipòtesi nul·la i s’accepta la contrastada.
No és probable que l’observació sigui fruit de l’atzar.
- Si p > risc S’accepta la hipòtesi nul·la i es refusa la contrastada.
És probable que l’observació sigui fruit de l’atzar.
El nivell del risc és arbitrari i en bioestadística normalment s’accepta un risc α del 0,05 (5%). Un resultat d’una prova que sigui significatiu a nivell de confiança del 95% indica que la probabilitat que l’observació duta a terme en la mostra sigui deguda l’atzar és inferior a 0,05. Si l’experiència es repetís 100 vegades, per tant, en 5 o menys ocasions s’obtindria un resultat com l’observat.
El valor p es defineix com la probabilitat d’obtenir un resultat com l’observat o més extrem per atzar en cas que la hipòtesi nul·la sigui certa. El valor p, per tant, no és la probabilitat de H0 sinó la versemblança d’H0 a la vista d’un cert resultat experimental.
= ≥ | 4. ESTADÍGRAF DE CONTRAST I REGLA DE DECISIÓ Utilització de taules Les proves de contrast d’hipòtesis normalment utilitzen distribucions de probabilitat per calcular el valor de p. Els valors de les variables observats en la mostra s’introdueixen en una fórmula per normalitzar-los, obtenint-se un estadígraf de contrast o estadístic de prova que es compara amb la distribució de probabilitat.
Els mètodes que utilitzen taules busquen valors crítics en la distribució de probabilitat, de manera que per un cert nivell de confiança es defineixen dues zones.
• Zona de refús (Ia i Ib) El valor observat és significativament diferent de 0. H0 pot ser refusada.
• Zona d’acceptació (II) El valor observat no és significativament diferent de 0. H0 no pot ser refusada.
Aquests mètodes, per tant, permeten únicament concloure si les observacions són o no significatives per un cert nivell de confiança.
Utilització de programes informàtics Els mètodes que utilitzen els programes d’ordinador generalment calculen l’àrea sota la corba de la funció de probabilitat corresponent i proporcionen directament el valor de p. En aquest cas la regla de decisió implica comparar directament el valor de p amb el valor del risc (α). Per exemple, si la prova es realitza amb un nivell de confiança el 95% i el valor de p és menor que 0,05 podrà determinar-se que la prova és estadísticament significativa.
Si bé l’ordinador utilitza internament els estadígrafs per calcular p i aquests per tant no són estrictament necessaris, per tradició la major part dels programes segueixen proporcionant-los.
5. ERRORS DE TIPUS I I II EN EL CONTRAST D’HIPÒTESI Tot i aplicar correctament una prova de contrast d’hipòtesi, sempre hi ha la possibilitat de que es produeixin errors. Aquests errors poden ser de dos tipus.
• • Tipus I Es refusa incorrectament la hipòtesi nul·la Tipus II S’accepta incorrectament la hipòtesi nul·la Errors de tipus I Els errors de tipus I es produeixen quan es refusa la hipòtesi nul·la i aquesta és certa en la població. La probabilitat que això succeeixi és igual al risc (α), també anomenat nivell de significació. Treballant al 95% de confiança, per tant, un màxim de 5 de cada 100 vegades es pot cometre un error de tipus I i refusar erròniament H0.
Errors de tipus II Els errors de tipus II es produeixen quan s’accepta la hipòtesi nul·la i realment és certa l’alternativa. La probabilitat que això succeeixi s’anomena β, per tant la probabilitat d’encertar és de 1 – β. Aquest valor 1 – β determina la capacitat d’un estudi d’acceptar Ha quan Ha és certa.
6. POTÈNCIA ESTADÍSTICA La potència estadística és el valor 1 – β i determina la capacitat d’un estudi d’acceptar Ha quan aquesta és certa.
En un estudi on es vol comprovar si hi ha diferències d’alçada entre els estudiants suecs i espanyols.
Al comparar les alçades d’una mostra de cada població s’observa que existeix una diferència: ( ̅ = ̅ − ̅ ) Les hipòtesis de l’estudi són: • H0 - µd = 0 Les diferències observades són conseqüències de l’atzar degut al mostreig.
• Ha - µd ≠ 0 Existeixen diferències entre les poblacions Imaginem que µd = 0 Imaginem que µd = d La diferència observada no és significativament diferent si la diferència d’alçada entre les poblacions és 0, confirmant així la hipòtesi nul·la, però s’observa que podria ser compatible alhora per la hipòtesi contrastada si la mitjana d’alçada en les poblacions és d.
La potència de l’estudi imposa un límit màxim a les diferències que podem reconèixer. L’únic mètode per millorar la potència d’un estudi és fer més estreta la distribució mitjançant un augment de la mida de la mostra. La potència de l’estudi que es vol aconseguir en un estudi, per tant, sol utilitzar-se com a criteri per determinar la mida d’una mostra. Existeixen programes com GRANMO per fer aquest càlcul.
Exemple Un estudi va ser dissenyat per tenir una potencia estadística del 90% de detectar una diferència entre els grups de 4 graus en l’augment de la flexió de l’avantbraç.
En cas de que la diferència detectada fos només de 4 graus, la probabilitat d’acceptar Ha (1-β) seria de 0,9. Existeix per tant una probabilitat del 10% (β = 0,1) de que una diferència real de 4 graus es confongui amb l’efecte del mostreig.
7. CONTRAST UNILATERAL I BILATERAL Normalment les hipòtesis es defineixen en termes d’igualtat o desigualtat realitzant-se així un contrast bilateral.
• H0: µ = 0 La mitjana de les diferències és igual a 0 • Ha: µ ≠ 0 La mitjana de les diferències és diferent a 0 No obstant, s’utilitza el contrast unilateral quan si hi ha motius per pensar que les diferències, per exemple, només poden tenir un valor positiu.
• H0: µ ≤ 0 La mitjana de les diferències no és positiva • Ha: µ > 0 La mitjana de les diferències és positiva Contrast bilateral Contrast unilateral Un mateix estadígraf pot suposar l’acceptació de la hipòtesi nul·la en un contrast bilateral i el seu refús en un contrast unilateral, ja que els contrasts bilaterals són més conservadors i es necessiten més diferències per refusar la hipòtesi nul·la.
És important tenir en compte que la decisió de realitzar un contrast unilateral o bilateral s’ha de prendre abans de realitzar un experiment, i que per fer un contrast unilateral cal una raó justificada. En cas de dubte és preferible la utilització d’una prova bilateral.
Exemple Assajos realitzats en una mostra de 100 individus demostren que l’administració del fàrmac X va produir canvis significatius en els nivells de glucèmia (contrast bilateral, p < 0.001).
El valor de p expressa la baixa probabilitat de que la hipòtesi nul·la sigui certa, és a dir, la probabilitat d’estar cometent un error del tipus 1. Per norma general s’utilitza un risc de 0,05, per tant una p de 0,2 no seria possible.
També es podria haver expressat com que: a) l’administració del fàrmac X va produir canvis significatius a un nivell de confiança del 95% en els nivells de glucèmia.
b) l’administració del fàrmac X va produir canvis significatius (α = 0,05) en els nivells de glucèmia.
8. INCONVENIENTS DE LES PROVES DE CONTRAST D’HIPÒTESI Els principals inconvenients de les proves de contrast d’hipòtesi són la seva dependència de la mida de les mostres, de manera que si aquestes són molt petites no es detecten per problemes de potència, i que no expressa la intensitat de l’efecte.
Per exemple en un estudi d’un fàrmac amb una mostra gran poden detectar-se diferències en la curació d’una malaltia del 52% davant del 50% del placebo (p<0.001). La diferència és significativa donada la gran mida de les mostres (dispersions molt estretes que eviten els problemes de potència) però clínicament el resultat no és rellevant.
9. APLICACIÓ DE LES PROVES DEL CONTRAST D’HIPÒTESI Les proves de contrast d’hipòtesi solen utilitzar-se per identificar associacions entre dues variables.
En funció del tipus de variable s’utilitzaran diferents proves.
Qualitativa - Qualitativa Estudi de l’associació • Prova exacta de Fisher • Khi-quadrat • Mac Nemar Qualitativa - Quantitativa Comparació de mesures • T-Student • ANOVA Quantitativa - quantitativa Estudi de la correlació • Coeficient de correlació de Pearson ...