Tema 4. Probabilitat (2015)

Apunte Catalán
Universidad Universidad Pompeu Fabra (UPF)
Grado Medicina - 2º curso
Asignatura Bioestadística
Año del apunte 2015
Páginas 7
Fecha de subida 03/02/2015
Descargas 9
Subido por

Vista previa del texto

Tema 4. Probabilitat 1. TERMINOLOGIA Fenomen o experiment aleatori Qualsevol situació el resultat de la qual no es possible predir Espai mostral (S) Conjunt de tots els possibles resultats d’un experiment aleatori Succés elemental (a) Cada un dels possibles resultats d’un experiment aleatori Succés (A) Qualsevol subconjunt de l’espai mostral. Pot incloure un o varis successos elementals.
Succés segur El succés que inclou tots els successos elementals Tirar un dau i obtenir una puntuació menor que 7 Succés impossible El succés que no inclou cap succés elemental Tirar un dau i obtenir una puntuació igual a 7 2. CONCEPTE DE PROBABILITAT La probabilitat s’expressa amb un número de 0 a 1 que indica les expectatives de que es doni un cert succés A.
P(A) = 0 El succés A és impossible P(A) = 1 El succés A és segur P(A) = P(B) Els successos A i B són equiprobables 3. ESTIMACIÓ DE LA PROBABILITAT La probabilitat d’un succés P(A) pot calcular-se mitjançant la freqüència relativa, la probabilitat clàssica i l’estimació subjectiva.
Freqüència relativa Quan un experiment es pot repetir moltes vegades, la probabilitat del succés A s’aproxima a la seva freqüència relativa: ≈ ú ú L’inconvenient d’aquest mètode és que el valor P(A) és una estimació que s’aproxima asimptòticament al valor real a mida que es duen a terme més proves. Per poder obtenir el valor exacte s’hauria de repetir l’experiment infinites vegades.
Probabilitat clàssica La probabilitat clàssica s’utilitza quan treballem amb successos elementals exactament equiprobables, de manera que la probabilitat d’un succés A es pot obtenir com: = | | | | El principal inconvenient és que només és aplicable quan els successos són realment equiprobables i la seva aparició depèn únicament a l’atzar, per exemple una malaltia definida per un al·lel.
Exemple Un certa característica hereditària ve definida per un gen que pot tenir dos al·lels (t, T) i T està associat amb una malaltia genètica recessiva.
= 1 = 0.25 4 Estimació subjectiva Un expert pot utilitzar els seus coneixements per proporcionar una estimació subjectiva de la realitat. Aquest valor no expressa freqüències d’aparició, sinó el convenciment inicial en la certesa d’una hipòtesis. No té més valor que el ser un punt de partida per la realització d’un anàlisi que permeti actualitzar aquest valor subjectiu inicial. És la base d’una metodologia d’inferència estadística denominada bayesiana.
4. ÀLGEBRA DE PROBABILITAT Regla 1 La probabilitat de dos successos complementaris sumen 1.
Dos processos són complementaris quan l’aparició d’un succés exclou forçosament l’altre. Per exemple, el succés “neix noi” és complementari al de “neix noia”. És una regla senzilla però important ja que sovint és molt complicat calcular un cert succés, però molt fàcil calcular el complementari.
Regla 2 o de la suma La probabilitat de que succeeixi el succés A o el succés B, quan aquests són excloents, és igual a la suma de les seves probabilitats.
∪ = + Dos successos són excloents quan no comparteixen cap succés elemental.
Exemple Si tirem un dau de 6 cares, la probabilitat de que surti un 1 o un 2 és: P(1 ∪ 2) = P(1) + P(2) = 1/6 + 1/6 = 2/6 Excepció Si el 30% de la població de EEUU és obesa i el 3% pateix diabetis, quina probabilitat hi ha de que una persona sigui obesa o pateixi diabetis? P(obesa o diabètica) = P(obesa) + P(diabeits) = 0,3 + 0,03 = 0,33 ERROR Els successos obès i diabètic no són excloents, algunes persones són obeses i a més son diabètiques, i això fa que les comptem dues vegades. Quan dos successos no són excloents cal restar la probabilitat dels successos comuns: ∪ ) ) = = + − ∩ ) + ) − ) ) Regla 3 o del producte La probabilitat de que succeeixi el succés A i el succés B, quan són processos independents, és igual al producte de les seves probabilitats.
∩ = · Dos successos es diuen independents quan la probabilitat del succés A no depèn de que es compleixi o no el succés B.
Exemple Si tirem dues vegades un dau de 6 cares, la probabilitat de que surti un 1 dues vegades seguides és: 1∩1 = 1 · 1 = 1 1 1 · = 6 6 36 Excepció Calculem la probabilitat de ser ancià i malalt en la població següent: = à = ∩ 10 = 0.1 100 50 = 0.5 100 à = 0.5 · 0.1 = 0.05 = 5% ERROR En aquest exemple la proporció de malalts és molt major en els ancians que en els joves, per tant P(malalt) no és igual en els dos grups: els dos successos no són independents.
Quan això succeeix s’utilitza la probabilitat condicionada en la regla del producte.
∩ = · | En lloc de P(B) s’utilitza P(BlA), que és la probabilitat de que succeeixi B quan A és certa. Es llegeix com “probabilitat condicionada d’A donat B”. En l’exemple anterior: à ∩ = à · | à Si la població objecte d’estudi hagués sigut la següent la regla del producte s’hagués pogut aplicar sense problemes ja que són successos independents.
Per tant, un succés A pot definir un subconjunt en l’espai mostral dins del qual la probabilitat de un altre succés B pot ser diferent respecte a fora Si A i B són successos independents: ∩ = · Si A i B no són successos independents: | = | ∩ = · · 5. TEOREMA DE BAYES El teorema de Bayes s’utilitza quan ens trobem davant de varies opcions sobre les que podem estimar probabilitats a priori o prèvies, però que amb una observació experimental o clínica aquestes probabilitats canvien i podem calcular probabilitats a posteriori.
La prioritat a priori, per tant, és la probabilitat de que es produeixi un succés mentre que la probabilitat a posteriori és la probabilitat de que es produeixi el mateix succés després de realitzar una nova observació.
La verosimilitut és el pes que aquesta observació assigna a cada una de les opcions.
Per exemple, la probabilitat d’un pacient de patir un tumor cerebral (T) és de 1 cada 10.000, és a dir, de 0,0001. Aquesta és la probabilitat “a priori” o previa, P(T). Si el metge esbrina que el pacient pateix freqüents mals de caps caldrà reconsiderar la probabilitat obtenint-se la probabilitat “a posteriori” o posterior, P(TlD).
Per la definició de probabilitat condicionada sabem que: /∩0 = / · 0|/ → 0|/ = /∩0 / Pel que fa al numerador sabem, per la regla del producte condicionada, que: /∩0 = 0 · /|0 0|/ = /|0 · / 0 Per tant: P(T l D) és la probabilitat de que un pacient amb tumor pateixi mal de cap i s’anomena la versemblança (verosimilitud, likelihood).
D’aquesta fórmula és important entendre que P(T l D) ∝ P(D l T) · P(T), és a dir que la probabilitat posterior P(T l D) és proporcional a la versemblança P(D l T) per la probabilitat prèvia P(T).
Pel que fa al denominador, P (D) engloba tots els pacients que tenen mal de cap, tant si tenen tumor (T) com si no (t), per tant és la suma de la probabilitat de tenir mal de cap amb tumor i tenir mal de cap sense tumor: / = /∩0 + /∩ Per la fórmula de la propietat condicionada: /∩0 = /|0 · /∩ /| = 0 · Substituint tot obtenim el teorema de Bayes: 0|/ = /|0 · /|0 · 0 + 0 /| · En la seva formulació general, si tenim un succés A i un conjunt n de successos Bi que cobreixen tot l’espai experimental (E = B1∪ B2∪… ∪ Bn): 2| = | ∑869: 2 · 4 5 67 · 2 6 Aquesta fórmula es podrà utilitzar sempre que tinguem un conjunt de successos exhaustius no directament observables Bi, les seves probabilitats “a priori” P(Bi) i les seves versemblances P(A l Bi).
L’objectiu serà estimar la probabilitat “a posteriori” després d’observar un succés A.
En el cas anterior el succés observable (A) era el mal de cap (D) i els no observables (B) eren tenir un tumor (T) o no tenir-lo (t).
Continuem amb el cas anterior substituint per números.
P(T) = 0,0001 P(D l T) = 0,9 P(D l t) = 0,1 incidència del tumor és de 1 per cada 10.000 habitants 90% dels pacients amb tumor pateixen cefalees 10% dels pacients sense tumor pateixen cefalees 0|/ = 0,9 · 0,0001 = 0,0009 0,9 · 0,0001 + 0,1 · 1 − 0,0001 Observem que després d’observar la cefalea la probabilitat posterior és 9 vegades més alta que la prèvia, però segueix sent molt baixa, de manera que un mal de cap no ha de ser indicatiu de tumor.
Aquest concepte pot observar-se a la gràfica següent: si bé un 90% de la població amb tumor presenta mal de cap, la població amb tumor només representa un 0,01% de la població total.
Utilitat Les situacions representades en el teorema de Bayes són molt freqüents en ciències biomèdiques, existeix una relació natural entre l’estadística Bayesiana i la medicina basada en l’evidència.
Hi ha multitud d’aplicacions en àrees com proves diagnòstiques, presa de decisions, assajos clínics, aplicacions epidemiològiques o revisions sistemàtiques i meta-anàlisis.
Exemple d’aplicació en una prova diagnòstica En una prova diagnòstica, com un test antituberculós, és important determinar la probabilitat de que davant un positiu hi hagi realment tuberculosis (+).
P(T) = 0,01 Probabilitat prèvia de la tuberculosis (incidència) P(+ l T) = 0,95 Versemblança del succés T P(+ l t) = 0,02 Versemblança del succés t La distribució dels individus pot representar-se en un diagrama d’arbre i les probabilitats poden obtenir-se multiplicant les “branques de l’arbre”.
0|+ = +|0 · +|0 · 0 + 0 +| · En les proves diagnòstiques les diferents probabilitats reben denominacions concretes: Sensibilitat, S P(+ l malalt) Especificitat, E P(- l sà) Valor predictiu positiu, VP+ P(malalt l +) Valor predictiu negatiu, VP- P(sà l -) La sensibilitat i l’especificitat poden calcular-se com: => = => @= => − ? => − ? Els dos valors poden combinar-se per obtenir un valor de fiabilitat (F) que indica el percentatge de casos pels quals un valor proporcionat és correcte. Pel càlcul es necessita un valor de prevalença, P(enf).
A= ∩+ + à∩− A= +| · A= + · −| à · [1 − + @ · [1 − ] ] Exemple Considerant el quadre següent i una prevalença de 0,01.
Prova + Prova - Malalts 45 5 Sans 10 40 = @= 45 = 0.9 45 − 5 40 = 0,8 40 + 10 A = 0,9 · 0,01 + 0,8 · 0,99 = 0,801 El valor F indica que la prova determina el valor correcte en el 80% dels casos. No obstant, F no indica que, en el cas de ser +, el pacient tingui el 80% de probabilitats d’estar malalt. Això ho indica el VP+.
El valor predictiu positiu VP+ o P(malalt l +) també pot calcular-se quan es disposa del valor de prevalença P(malalt).
|+ = +| +| · · + +| · Substituint S, i tenint en compte que P(+ l sà) = 1 – P(- l sà) = 1 – E |+ = · · + 1−@ · 1− Exemple Seguint l’exemple anterior, suposant una prevalença P(malalt) de 0,01 |+ = 0,9 · 0,01 = 0,09 = 9% 0,9 · 0,01 + 0,2 · 0,99 Per tant aquesta prova, tot i ser bastant fiable (F=80%) la probabilitat de que el pacient estigui malalt quan s’obté un positiu és del 9%.
...