Tema 9. Contrast d'hipòtesi per variables quantitatives (2015)

Apunte Catalán
Universidad Universidad Pompeu Fabra (UPF)
Grado Medicina - 2º curso
Asignatura Bioestadística
Año del apunte 2015
Páginas 8
Fecha de subida 03/02/2015
Descargas 9
Subido por

Vista previa del texto

Tema 9. Contrast d’hipòtesi per variables quantitatives Freqüentment és necessari comparar els valors que pren una variable quantitativa en varis grups de subjectes. Aquestes situacions es caracteritzen per implicar una variable quantitativa i per comparar una propietat d’aquesta variable en diferents grups definits per una variable qualitativa.
En aquests casos poden utilitzar-se les proves següents: • Prova T d’Student • Prova T d’Student per dades aparellades • ANOVA d’un factor En estadística descriptiva s’utilitzen gràfiques de caixa en què es representa la tendència central i la dispersió de la variable quantitativa per cada un dels subgrups definits per la variable qualitativa.
Sempre que s’observen diferències, i mai quan no se n’observen, cal realitzar una prova de contrast d’hipòtesi per comprovar si el resultat obtingut en la mostra ha estat degut a l’atzar o és resultat d’una diferència real en la població.
El contrast d’hipòtesi a utilitzar dependrà del que s’estigui comparant: a) Un grup amb un valor de referència b) Dos grups c) n grups També dependrà de: a) Si es coneix el valor de la desviació estàndard poblacional (σ) b) En cas de desconèixer σ, si s’assumeix que la dispersió en ambdues poblacions és igual o diferent c) Si les dades són independents o aparellades Les possibles situacions que es poden donar, per tant, són les següents: - Comparar un grup amb un valor de referència Prova de conformitat assumint σ coneguda • Prova de T d’Student de conformitat - Comparar dos grups Prova assumint σ coneguda • Prova de T d’Student assumint igual variància • Prova de T d’Student assumint diferent variància • Prova de T d’Student assumint dades aparellades - Comparar n grups • Anàlisi de la variància ANOVA d’un factor Les situacions en què σ és coneguda apareixen normalment en llibres i mai en la pràctica.
1. COMPARAR UN GRUP AMB UN VALOR DE REFERÈNCIA Per comprovar si la mitjana obtinguda per una mostra coincideix amb un cert valor de referència s’utilitzen les proves de contrast de conformitat.
Pot donar-se que la desviació estàndard poblacional (σ) sigui coneguda (molt infreqüent) o que la desviació estàndard poblacional sigui desconeguda i que s’hagi d’estimar a partir de la desviació estàndard mostral.
Comparar un grup amb σ coneguda Les hipòtesis són: H0: μ = μ0 Ha: μ ≠ μ0 On μ0 és el valor de referència i μ representa la mitjana de la població de la que hem extret la mostra.
Si la distribució d’una determinada variable x té una mitjana μ i una desviació estàndard σ, la distribució de les mitjanes de x en mostres d’una mida n tindrà la següent mitjana i desviació estàndard: = = √ Com ja es va veure al tema 6, la dispersió de la distribució de mitjanes de diferents mostres d’una població, en termes de variància, és igual a la variància de la variable original dividida per la mida de la mostra, i igual succeeix per la desviació estàndard.
= = √ Per tant, el valor de p associat a la mitjana mostral pot calcular-se normalitzant el valor i contrastant-lo amb una distribució normal: ̅− ̅− = → = √ Tenint en compte que si H0 és certa μ = μ0: = ̅− √ √ A partir del valor de z es pot calcular directament el valor de p amb un programa informàtic o es pot prendre una decisió a partir de valors crítics mitjançant taules.
Si –zcrícica < z < zcrítica s’accepta H0 i es considera que les diferències obtingudes entre la mitjana obtinguda i el valor de referència no són estadísticament significatives. En cas contrari es refusa H0.
2. COMPARAR DOS GRUPS O TRACTAMENTS Quan es comparen dos grups poden donar-se quatre situacions diferents. En primer lloc pot ser que la variància poblacional σ2 sigui coneguda, però és un fet molt infreqüent. En cas de desconèixer aquesta variància poblacional pot assumir-se que sigui igual en els dos grups o que no ho sigui. Per últim, es pot treballar amb dades aparellades.
Dos grups amb variància poblacional coneguda Per comparar dos grups amb variància coneguda les hipòtesis són H0: μ1=μ2 i Ha: μ1≠μ2 i l’estadígraf es calcula com: = ̅ − ̅ + La probabilitat que la hipòtesi nul·la sigui certa es calcula utilitzant la distribució normal.
Exemple El pH de la sang umbilical de recent nascuts en un hospital té una desviació estàndard de 0.07. Volem saber si els nounats de mares toxicòmanes tenen un pH menor. S’obtenen dues mostres: 170 mares no toxicòmanes, 30 mares toxicòmanes, pH = 7,250 pH = 7,242 = 7,250 − 7,242 0,07 0,07 170 + 30 = 0,577 El valor de p que correspon a z = 0,577 per un contrast bilateral és 0,564. Com 0,564 > 0.05 no podem descartar H0, per tant no es pot afirmar que existeixin diferències significatives a un nivell de confiança del 95%.
Si es treballa amb taules, es coneix que per un contrast bilateral amb α = 0,05 el valor crític de z és 1,96. Com 0,577 < 1,96 no es pot descartar H0, per tant no es pot afirmar que existeixin diferències significatives a un nivell de confiança del 95%.
Dos grups amb variància desconeguda i igual Quan es desconeix el valor de la dispersió, aquest se sol estimar a partir de la mostra. Quan hi ha dos grups es pot suposar que la dispersió és igual en les dues poblacions i t es calcula com: = = + + −2 = ̅ − ̅ + −1 + −1 + −2 s2 és una estimació de la variància poblacional comú, i t es contrasta amb una distribució T d’Student amb n1 + n2 – 2 graus.
Exemple Es vol estudiar l’homogeneïtat de la tensió arterial en dos grups, un d’edat > 45 i un d’edat ≤ 45.
= 196 · 46 − 1 + 121 · 54 − 1 = 155,44 46 + 54 − 2 = 84 − 76 155,44 155,44 + 46 54 = 3,2 El resultat es contrasta amb una distribució T d’Student amb 46 + 54 – 2 = 98 graus de llibertat.
El valor p per un contrast bilateral de t = 3,2 (98 gdl) és de 0,002. Com 0,002 < 0,01 es pot descartar H0 i es conclou que existeixen diferències estadísticament significatives a un nivell de confiança del 99%.
Per un contrast bilateral amb α = 0,01, tcrític és 2,58. Com 3,2 > 2,58 es pot descartar H0 i es pot concloure que existeixen diferències significativament significatives a un nivell de confiança del 99%.
Per determinar que la variància en dues poblacions és igual s’haurà de dur a terme un contrast d’hipòtesi, on H0: σ12 = σ22 i H0: σ12 ≠ σ22.
L’estadígraf s’obté dividint les dues variàncies i es contrasta amb una distribució F de Fisher amb n1 i n2 graus de llibertat.
$= Alguns programes com SPSS apliquen proves específiques com la de Levene.
Dos grups amb variància desconeguda i diferent Quan s’assumeix que la dispersió en les dues poblacions a comparar és diferent, t es calcula com: = % ̅ − ̅ + En aquest cas també es contrasta amb una distribució t d’Student, però els graus de llibertat es calculen com l’enter més pròxim a: &= ' ' ( + +1+ ' ( ( +1 −2 Exemple Es vol comprovar si el nivell d’àcid úric en sang és més alt en homes que en dones.
En primer lloc es calculen els graus de llibertat per la distribució t d’Student: 3,24 1,2 ) 96 + 84 * &= − 2 = 162,08 = 162 1,21 3,24 ) 84 * ) 96 * + 97 85 I a continuació l’estadígraf de contrast.
= 5,1 − 4,3 3,24 1,21 96 + 84 = 3,64 El valor p per un contrast bilateral de t = 3,64 (162 gdl) és de 0,0004. Com 0,0004 < 0,01 es pot descartar la hipòtesi nul·la i concloure que existeixen diferències estadísticament significatives a un nivell de confiança del 99%.
Si s’utilitzen taules, per un contrast bilateral amb α = 0,01, tcrític és 2,3. Com 3,64 > 2,6 es pot descartar H0 i es conclou que existeixen diferències estadísticament significatives a un nivell de confiança del 99%.
En SPSS es demana al programa la prova T per mostres independents. El programa aporta el valor de significança de la prova de Levene i el valor de significança de la prova T en cas d’igualtat o desigualtat de la variància de les dues poblacions. Si el valor de la prova de Levene és superior a 0,05 s’accepta la hipòtesi nul·la i es considera que les variàncies són iguals en les dues poblacions, utilitzant-se per tant el valor de la prova de T corresponent.
Dades aparellades En aquest tipus de dissenys no es comparen dos grups independents sinó que els dos tractaments s’apliquen sobre els individus d’un sol grup.
Per comparar els tractaments en dades aparellades es construeix una nova variable que representa les diferències entre els dos valors observats en cada individu o parella d’individus: + = − Si les diferències no són significatives, la mitjana de diferències a nivell poblacional serà 0 i per tant H0: μd = 0 i Ha: μd ≠ 0. L’estadígraf t es calcula amb la fórmula següent i es contrasta amb una distribució T d’Student amb n – 1 graus de llibertat.
= ̅+ + Exemple Es busca comparar la duració dels efectes secundaris de dos col·liris A i B. S’administra un en cada ull d’un mateix pacient, assignant aleatòriament l’ull dret o l’esquerre per l’administració.
La taula mostra els minuts que triguen a desaparèixer els efectes secundaris de cada medicament en cada pacient.
S’observa en la taula que hi ha una gran variació entre inter-individu. Aquesta variació no interessa per l’estudi, sinó que interessa comparar la diferència entre l’efecte de B i d’A.
Mitjana B-A = 2,42 Variància B-A = 2,99 = 2,42 2,99 12 = 4,85 Per un contrast bilateral i 11 graus de llibertat, p < 0,001. Això permet descartar H0 i concloure que les diferències observades són estadísticament significatives.
L’obtenció d’aquest valor en SPSS es fa comparant mesures i fent la prova T per mostres relacionades.
3. COMPARAR N GRUPS Per comparar dos o més grups s’utilitza l’anàlisi de la variància mitjançant la prova ANOVA.
Aquesta prova utilitza una estratègia diferent que les proves de contrast d’hipòtesi vistes fins ara: compara la dispersió dels valors dins dels grups amb la dispersió entre els grups, representant cada individu mitjançant la mitjana del seu grup.
Si la dispersió intergrup és significativament major que la mitjana ponderada de les dispersions intragrup, pot descartar-se que els dos grups siguin mostres de la mateixa població.
El quocient entre les variàncies F expressa quantes vegades és major la variància intergrup respecte la intragrup. Si és molt major, la probabilitat de que succeeixi únicament per atzar serà molt petita i es podrà considerar la diferència de les mitjanes com significativa.
Els valors de F obtinguts en la taula ANOVA es contrasten utilitzant una distribució de probabilitat de Fisher, que depèn de dos graus de llibertat.
Per realitzar aquesta prova a SPSS es selecciona analitzar, comparar mesures i ANOVA d’un factor.
El programa aporta tots els valors de la taula anterior i el valor de probabilitat (Sig) que s’haurà de comparar amb el risc α amb què es treballa. Igual que passava amb altres estadístics, l’únic valor que necessitem per treure les conclusions és el valor de probabilitat. La resta s’aporten per un motiu de tradició.
Exemple Es mesura el temps de coagulació en 24 animals alimentat amb quatre dietes diferents (A, B, C, D) ,obtenint-se els següents resultats.
Es realitza la taula ANOVA i s’obté: El valor de F = 13,6 indica que la variació entre els diferents grups, deguda a la dieta, és 13,6 vegades majors a la variació dins els propis grups. Aquest valor es compara amb una distribució de Fisher amb 3 i 20 graus de llibertat i el valor p que s’obté es menor a 0,05, per tant H0 pot refusar-se.
ANOVA és una família de tècniques molt àmplia i amb diferents variants. La tècnica descrita en aquest tema es denomina ANOVA d’un factor i permet comparar el valor de les mitjanes de dos o més grups definits per una variable. Altres variants d’ANOVA poden avaluar simultàniament l’efecte de més d’un factor. És el cas d’ANOVA de dos vies o two-way ANOVA que es veurà al tema 11.
Anàlisi ANOVA per més de dos grups. Anàlisi post-hoc Quan es treballa amb més de dos grups, el resultat d’un anàlisi ANOVA que permet únicament refusar la hipòtesi nul·la, i determinar que existeixen diferències entre les mitjanes.
H0: μ1 = μ2 = μ3= ... = μn Ha: μi ≠ μj Per algun parell i, j La prova no permet, però, determinar quin parell de mitjanes són diferents. Per fer-ho es realitzen proves que es denominen comparacions post-hoc o a posteriori. Existeixen diferents proves entre les què destaquen: • • Prova de Tuckey o HSD (Honest Significative Difference) Prova de Bonferroni La imatge següent mostra la sortida en SPSS en una comparació de quatre dietes.
...