TEMA 1 (2017)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Psicología - 2º curso
Asignatura Analisi de dades
Profesor
Año del apunte 2017
Páginas 8
Fecha de subida 26/10/2017
Descargas 0
Subido por

Vista previa del texto

TEMA 1. TEORIA DE LA PROBABILITAT 1. DETERMINISME I ALEATORIETAT.
Diferencies entre les ciències físiques i les de la salut: - Ciències com la Física i la Química es caracteritzen per establir lleis deterministes, de manera que al repetir un experiment en les mateixes condicions sempre s’obtenen els mateixos resultats.
- Ciències de la Salut corresponen a situacions aleatòries, de manera que al repetir un experiment en les mateixes condicions es poden obtenir diferents resultats. Ex:no tots els subjectes amb la mateixa malaltia presenten la mateixa simptomatologia.
La variabilitat de les observacions és la propietat fonamental dels fenòmens que es presenten en Psicologia, i en general, en totes les Ciències de la Salut.
1.1. Llei de les frequencies.
El llançament d’una moneda és un exemple d’una experiència aleatòria perquè és impossible predir el resultat d’un llançament determinat.
Existeix una regularitat estadística al repetir l’experiment en les mateixes condiciones: si repetim l’experiment un nombre alt de vegades amb les mateixes condicions podem acabar apropant-nos a una certa predicció.
Sí que és possible predir el resultat d’un conjunt de llançaments. Per a un llançament no és possible predir-ho, s’ha de tractar d’un conjunt.
Aquest principi de regularitat estadística justifica que si el nombre de repeticions de un experiment aleatori és molt gran, la freqüència relativa d’un esdeveniment tendeix a estabilitzar-se en un valor que, intuïtivament, anomenem probabilitat d’aquest esdeveniment.
1.2. Teoria de la probabilitat i estadística, definició.
Son les disciplines que estudien els fenòmens aleatoris. El càlcul de probabilitats pot definir-se com “el model matemàtic de les regularitats que s’observen a les series de freqüències corresponents als fenòmens aleatoris”.
2. EXPERIMENTS ALEATORIS.
2.1. Definicions bàsiques.
Prova o experiència aleatoris: Experiment perfectament definit, en el qual es coneixen tots els possibles resultats i, quan es repeteix l’experiment en condicions anàlogues, es poden obtenir diferents resultats (si fos sempre el mateix resultat es tractaria d’una llei determinista). Les condicions que caracteritzen un experiment o prova aleatòria són: Es pot repetir indefinidament en condicions anàlogues (mateixes condicions) - A cada prova s’obté un resultat que pertany al conjunt de resultats possibles.
- Abans de fer l’experiment és impossible predir el seu resultat concret.
Ex: Si traiem una carta d’una baralla i seguidament extraiem un altre ja no es tractaria de condicions anàlogues: si no hi ha reintroducció de la primera carta significa que s’ha modificat la composició i la probabilitat de que ens surti una de les cartes restants, i per tant no són condicions anàlogues. Es podria dir que el primer experiment d’extracció ha modificat al segon.
Esdeveniment elemental: Cadascun dels possibles resultats d’un experiment aleatori. Els esdeveniments elementals són incompatibles o mútuament excloents donat que no poden presentar-se simultàniament. La ocurrència d’un esdeveniment elemental implica la no ocurrència d’un altre.
Observació: Resultat obtingut en efectuar un experiment aleatori.
Conjunt fonamental o espai mostral ( E ): Conjunt format per tots els esdeveniments elementals.
Succés o esdeveniment: Reunió d’un cert nombre d’esdeveniments elementals que defineixen un subconjunt A del espai mostral E d’esdeveniments elementals. En un experiment aleatori, l’esdeveniment A s’ha realitzat, si i sols si, l’esdeveniment elemental e, resultat de l’experiència pertany al subconjunt A: e є A.
Ex: Experiència aleatòria “llançament d’un dau de sis cares” E = (e1, e2, e3, e4, e5, e6)  Conjunt esdeveniments elementals A = {inferiors a 3?} = e1, e2 B = {serà parell?} = {e2, e4, e6} C = {igual a 19?} = ø {succés impossible} TEMA 1. TEORIA DE LA PROBABILITAT 3. DEFINICIO AXIOMATICA DE LA PROBABILITAT.
La definició axiomàtica de la probabilitat representa un conjunt de regles que ha de verificar qualsevol valor de la probabilitat.
Una probabilitat es una aplicació p del conjunt d’esdeveniments en el conjunt R dels nombres reals.
3.1. Interpretació d’una mesura de probabilitat.
- Les probabilitats son valors compresos entre 0 – 1 que reflecteixen expectatives d’ocurrència d’un esdeveniment determinat.
- Els valors de probabilitat propers a 1 indiquen que es d’esperar que es produeixi l’esdeveniment en qüestió.
- Els valors de probabilitat propers a 0 indiquen que es d’esperar que no es produeixi l’esdeveniment en qüestió.
- Probabilitats properes a 0,5 indiquen que es tan versemblant la ocurrència de l’esdeveniment com la no ocurrència.
Probabilitat del succés A i del succés complementari nA.
p(nA) = 1 – p(A) llei de probabilitat total: Probabilitat de la reunió de dos esdeveniments mútuament excloents, disjunts o incompatibles (intersecció nul·la, (A ∩ B) = ø) ∩= i ∪=o Ex: Experiència aleatòria “llançament d’un dau de sis cares” Llei de la probabilitat total: Probabilitat de la reunió de dos esdeveniments compatibles (intersecció no nul·la, (A ∪ B) ≠ ø)  p (A ∪ B) = p(A)+p(B) - p (A ∩ B) Intersecció no nul·la: Es poden donar fenòmens que compleixin A i B alhora.
Probabilitat del succés A i dels succés complementari nA: A = {e1, e2}, nA = {e3, e4, e5, e6} P(nA) = 1 – p{e1, e2} Probabilitat de la reunió de dos esdeveniments compatibles (intersecció no nul·la, (A ∩ B) ≠ ø).
A = {e1,e2}, B = {e2,e4,e6} P(A ∪ b) = p(e1,e2) + p(e2,e4,e6) – p(e2) Probabilitat de la reunió de dos esdeveniments mútuament excloents, disjunts o incompatibles (intersecció nul·la, (A ∩ B) = ø).
A = {e1,e2}, B={e4,e5} P(A ∪ B) = p(e1,e2) + p(e4,e5) 4. ASSIGNACIO DE PROBABILITATS.
Definició axiomàtica: Estableix les regles que han de satisfer les mesures de probabilitat dels esdeveniments associats a un experiment aleatori.  Ex: la probabilitat total és 1, un esdeveniment buit és igual a 0...
TEMA 1. TEORIA DE LA PROBABILITAT 4.1. Definició clasica (espai mostral finit amb esdeveniments elementals equiprobables).
- Els espais mostrals mes simples son els que contenen un nombre finit d’esdeveniments elementals.
Supòsit d’equiprobabilitat o d’indiferència: quan un experiment aleatori pot produir k esdeveniments elementals diferents, i no es coneix cap raó que afavoreixi la presentació d’un esdeveniment elemental en detriment d’un altre.
- Regla de Laplace: l’acceptació del supòsit d’equiprobabilitat dels successos elementals, implica la probabilitat d’un succés A es el quocient entre el numero de casos favorables (nA) a la realització de l’esdeveniment i el numero de casos possibles (n) de l’experiment aleatori.
𝑁𝐴 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑃 (𝐴) = = 𝑛 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑠𝑖𝑏𝑙𝑒𝑠 4.2. Definició freqüentista: Mètode a posteriori. Es basa en repetir un experiment moltes vegades sota les mateixes condicions i finalment calcular la freqüència relativa amb la que es dona un determinat succés.
- La freqüència relativa f(A) d’un succés es defineix com el quocient entre el numero de vegades que s’ha verificat el succés (nA) i el nombre total de vegades (n) que s’ha repetit l’experiment.
o La probabilitat d’un esdeveniment sempre es pot obtenir mitjançant una estimació estadística.
- El teorema fonamental de la convergència en probabilitat, anomenat llei dels grans números, estableix que les freqüències relatives tendeixen a estabilitzar-se en un determinat valor, que coincideix amb la probabilitat del succés P(A), quan n creix indefinidament. Anàlogament, la probabilitat d’un esdeveniment es el límit al que tendeix la seva freqüència relativa Experiment llançant una moneda: A mesura que fem experiències anem trobant percentatges de cara o de creu.
Aquests percentatges poc a poc es van apropant al 50% fins a estabilitzar-se al voltant d’aquest valor (0,5).
Estimem una probabilitat dividint el nombre de vegades que apareix un succés entre el nombre de vegades que hem realitzat l’experiment. Aquesta estimació tendeix cap al verdader valor d’aquesta probabilitat en la mesura que n tendeix a infinit.
5. PROBABILITAT CONDICIONADA.
Una probabilitat condicionada expressa la probabilitat de que succeeixi un determinat esdeveniment (B) a condició de que succeeixi un altre succés (A).
- p (B|A): Probabilitat de que es produeixi B donat que s’ha produït A.
- p (A|B): Probabilitat de que es produeixi A donat que s’ha produït B.
El coneixement d’alguna informació respecta a un succés condiciona la probabilitat d’ocurrència de l’altre succés.
Probabilitat a priori: quan no coneixem els fets: Ens donen la informació de que s’ha produït ha i volem saber la probabilitat de B quan això ha passat. Ara, només ens interessa el resultat que està dins de la zona A ∩ B. L’espai mostral es redueix  probabilitat condicionada.
TEMA 1. TEORIA DE LA PROBABILITAT Ex: Al llançar un dau que té les cares parells de color blanc i les senar de color negre, es vol conèixer la probabilitat de l’esdeveniment A definit com “que surti un número major que 3”.
Cada cara, en un principi, té una probabilitat assignada de 1/6.
La probabilitat de que k sigui més gran de 3 = 3/6 = 0,5  Probabilitat a priori En aquest moment, ens donen la informació de que la cara que ha tocat és blanca (per tant, sabem que és parell). Això modifica la probabilitat. S’ha d’ajustar l’espai mostral.
P (B/A) = P(A ∩ B) / P(A) P(A/B) = P (A ∩ B)/P(B)= (2/6) / (3/6) = 12 / 18 = 2/3 6. TEOREMES FONAMENTALS.
6.1. Teorema de la suma o propietat additiva - Si dos esdeveniments són incompatibles, o mútuament excloents, la probabilitat de la reunió de dos successos es igual a la suma de les probabilitats individuals de cada succés. Formalment: ∀A,B ∈ E : p(A ∪ B) = p(A) + p(B) ⇔ (A ∩ B) = ∅ - Llei de la probabilitat total: si els esdeveniments A i B són compatibles, (A∩B)≠∅, aleshores: P(A∪B) = P(A) + P(B) − P(A∩B).
- Aquesta formula es pot generalitzar per a qualsevol número de successos: P(A∪B∪C) = P(A)+P(B)+P(C)−P(A∩B)−P(A∩C)−P(B∩C)+P(A∩B∩C) 6.2. Teorema del producte La probabilitat d’ocurrència simultània de dos esdeveniments, A i B, fa referència a la probabilitat d’ocurrència de l’esdeveniment d’intersecció (A∩B).
La llei multiplicativa o de la probabilitat composta es pot deduir a partir de la definició de probabilitat condicionada: 6.3. Esdeveniments dependents i independents.
Dos esdeveniments, A i B d’un experiment aleatori s’anomenen: - Independents: si la realització de l’esdeveniment A no influeix en la probabilitat de B.
- Dependents: si la realització de l’esdeveniment A influeix en la probabilitat d’ocurrència de l’esdeveniment B.
- En cas d’independència, la llei multiplicativa: p (A∩B) = p(A) × p(B|A) be donada per: P (A∩B)= p(A) × p(B) Ex: Estudis farmacològics han mostrat que l’administració d’una determinada droga afavoreix l’aparició d’al·lucinacions (A) en un 10% dels subjectes, dels quals un 35% tendeix a desenvolupar conductes agressives (B). Paral·lelament, un 85% dels subjectes que no presenten al·lucinacions (nA) no manifesten conductes agressives (nB).
- Estudiar el corresponent diagrama d’arbre.
Identificar els esdeveniments representats.
Completar el diagrama d’arbre amb les probabilitats adients a cadascun dels esdeveniments.
A= al·lucinacions.
B= agressivitat.
P(A) + P(nA) = 1 P(B) + P(nB) = 1 Ex: En un estudi sobre hàbits de salut realitzat en una mostra representativa de 10000 persones, de les que 6000 són dones, s’ha enregistrat el número de persones amb antecedents psiquiàtrics (PS). Concretament, els investigadors enregistren un total de 4500 persones amb antecedents de les que 3000 són homes.
- Completar la taula següent, anomenada taula de contingència.
TEMA 1. TEORIA DE LA PROBABILITAT - Identificar i calcular les probabilitats marginals de la taula de contingència. (Marginals = totals) - - p(H) = 4000/10000 = 0,4 p(D) = 6000/10000 = 0,6 p(PS ) = 4500/10000 = 0,45 p(nPS ) = 5500/10000 = 0,55 Identificar i calcular les probabilitats que representen l’esdeveniment intersecció o ocurrència simultània d’esdeveniments.
p(D ∩ PS ) = 1500/10000 = 0,15 p(D ∩ nPS ) = 4500/10000 = 0,45 p(H ∩ PS ) = 3000/10000=0,30 p(H ∩ nPS ) = 1000/10000 = 0,10 Identificar i calcular les següents probabilitats condicionades a les files i les columnes.
p(PS/D) = 1500/6000 = 0,25 p(PS/H ) = 3000/4000 = 0,75 p(D/PS ) = 1500/4500 = 0,33 p(nPS /D) = 4500/6000 = 0,75 p(nPS /H ) = 1000/4000 = 0,25 p(D/nPS ) = 4500/5500 = 0,82 p(H/PS ) = 3000/4500 = 0,67 7. TEOREMA DE BAYES p(H/nPS ) = 1000/5500 = 0,18 7.1. Formules d’inversió de les condicions.
Suposar que es coneixen les probabilitat p(A), p(B) i p (B|A). A partir de la llei multiplicativa por determinar-se p(A|B).
Fórmula d’inversió de les condicions: Interpretació de la formula: Ex: Certs estudis han determinat que el 12% del subjectes en edat laboral presenten un trastorn per ansietat (A), i un 20% es troben en atur (B). Dels subjectes amb trastorn, un 15% estan en atur (B|A). Calcular la probabilitat de que un subjecte aturat presenti un trastorn per ansietat.
7.2. Definició de teorema de Bayes.
- Suposar la partició de l’espai mostral E definida pels esdeveniments A i B i els respectius esdeveniments complementaris (nA i nB) - L’esdeveniment B, es pot descompondre en la reunió de les interseccions amb els esdeveniments A i nA  ▪ B =(A∩B)+(nA∩B) - Donat que són esdeveniments incompatibles, aplicant la propietat additiva ▪ p(B)= p(A∩B)+ p(nA∩B) i, a partir de la propietat multiplicativa, s’obté ▪ p(B)= p(A) · p(B|A)+ p(nA) · p(B|nA) Substituint p(B) en el denominador de la fórmula d’inversió de les condicions, s’obté el teorema de Bayes: TEMA 1. TEORIA DE LA PROBABILITAT - Quan l’espai mostral es divideix en p esdeveniments Ai, mútuament excloents, el teorema de Bayes es generalitza de manera que: 𝑝(𝐴𝑖 ) × 𝑝(𝐵|𝐴𝑖) 𝑝(𝐴𝑖 |𝐵) = ∑ 𝑝(𝐴𝑖 ) × 𝑝(𝐵 |𝐴𝑖 ) - en general, el teorema de Bayes permet estimar la probabilitat de la “causa” si s’ha detectat l’efecte.
Ex: Estudis farmacològics han mostrat que l’administració d’una determinada droga afavoreix l’aparició d’al·lucinacions (A) en un 10% dels subjectes, dels quals un 35% tendeix a desenvolupar conductes agressives (B). Paral·lelament, un 85% dels subjectes que no presenten al·lucinacions (nA) no manifesten conductes agressives (nB).
- Probabilitat de que un subjecte presenti al·lucinacions si manifesta conductes agressives? Busquem A si B  p(A|B) 𝐴 0′ 10 × 0,35 𝑝( ) = = 0,21 𝐵 0,10 × 0,35 + 0,90 × 0,15 - No coneixem la probabilitat de B, així que hem d’aplicar el teorema de Bayes.
Probabilitat de que un subjecte no presenti al·lucinacions si manifesta conductes agressives? 0’65 0’15 0’90 Busquem p(nA|B) 0,90 × 15 = 0′ 79 0,10 × 0,35 + 0,90 × 0,15 - Probabilitat de que un subjecte presenti al·lucinacions si no manifesta conductes agressives? Busquem p(A|nB) (0,10 × 0,65) 𝑃(𝐴|𝑛𝐵 ) = = 0,08 0,10 × 0,65 + 0,90 × 0,85 - Probabilitat de que un subjecte no presenti al·lucinacions si no manifesta conductes agressives? Busquem p(nA|nB) 0,90 × 0,85 𝑝(𝑛𝐴|𝑛𝐵 = = 0,92 0,10 × 0,65 + 0,90 × 0,85 7.3. Aplicació del teorema de Bayes en l’àmbit de la decisió clínica.
Terminologia: - S: un dels possibles símptomes associats a una malaltia (M).
𝑃(𝑛𝐴|𝐵 ) = - - p(M):prevalença d’una malaltia (probabilitat prèvia, probabilitat “ a priori”, probabilitat “subjectiva”).
p(S|M): probabilitat de presencia del símptoma en subjectes malalts (“versemblança” del símptoma en la població de malalts).
p(S|nM):probabilitat de presencia del símptoma en subjectes sans (“versemblança” del símptoma en la població de sans).
El teorema de Bayes, permet estimar la probabilitat “a posteriori” p(M|S) d’estar present o absent la malaltia M (“causa”), després d’explorar la presència o absència del símptoma S (“efecte”). El càlcul de p(M|S) s’efectua a partir de la prevalença de la malaltia p(M), i de les versemblances del símptoma p(S|M) i p(S|nM).
TEMA 1. TEORIA DE LA PROBABILITAT Ex: En el diagrama d’arbre es resumeixen les dades epidemiològiques obtingudes en un estudi sobre la prevalença de la depressió major en la població de joves de 14 anys, i la simptomatologia associada de problemes d’insomni.
Quant val la probabilitat de que un subjecte escollit a l’atzar d’aquesta població presenti un quadre depressiu si presenta insomni? 0,04 × 0,8 𝑃(𝑀|𝑆) = = 0,22 0,04 × 0,8 + 0,96 × 0,15 El denominador es p(S) però no el sabem, per tant S i M + S i nM.
Quant val la probabilitat de que un subjecte escollit a l’atzar d’aquesta població no presenti un quadre depressiu si presenta insomni? 𝑃(𝑛𝑀 |𝑆) = 1 − 0,22 = 0′ 78 Quant val la probabilitat de que un subjecte escollit a l’atzar d’aquesta població no presenti un quadre depressiu si no presenta insomni? 0′96 × 0′85 𝑃(𝑛𝑀 |𝑛𝑆 ) = ′ 0 96 × 0′ 85 + 0′04 × 0′20 Quant val la probabilitat de que un subjecte escollit a l’atzar d’aquesta població presenti un quadre depressiu si no presenta insomni? 𝑃(𝑀|𝑛𝑆) = 1 − 0,99 = 0′01 8. PROVES DIAGNOSTIQUES O DE CRIBATGE.
8.1. Plantejament.
- En un procés diagnòstic: (a) s’observen i reconeixen els símptomes del malalt, (b) s’identifiquen les malalties mes semblants al quadre clínic del malalt i, finalment, (c) es seleccionen aquells símptomes mes freqüents en el mon real per configurar una primera aproximació al diagnòstic. A continuació s’apliquen les proves diagnostiques complementaries mes eficaces per confirmar o descartar el diagnòstic provisional, o per incrementar la seva versemblança.
- Una prova diagnostica disposa de 3 objectius: o Proporcionar informació fiable sobre la condició del pacient.
o Influir en el pla terapèutic o la relació de serveis assistencials que gestionen les condicions de salut del pacient.
o Comprendre la historia natural i mecanismes de la malaltia mitjançant la recerca.
- La precisió diagnostica es la capacitat d’una prova per discriminar entre estats alternatius de salut. En avaluar la precisió d’una prova diagnostica, el professional formula 2 preguntes: o Com es comporta la proba en subjectes malalts (sensibilitat)? o Com es comporta la proba en subjectes sans? (especificitat)? - El valor d’un metode diagnòstic sempre es pot avaluar en relació a un mètode de referència. La qualitat del mètode (prova) diagnòstic no es constant i varia en funció de la prevalença de la malaltia en la població i de la composició del mètode diagnòstic basat en diverses proves.
- L’eficàcia d’una prova diagnostica depèn de la seva capacitat per assenyalar correctament la presenta o absència de la malaltia que s’estudia. Això s’expressa amb 4 índexs: o Sensibilitat.
o Especificitat o Valor predictiu positiu.
o Valor predictiu negatiu.
Aquests índexs constitueixen els criteris de validesa que quantifiquen la capacitat d’una prova per classificar correcta o incorrectament a una persona, segons la presencia o absència d’una exposició o malaltia.
- Molt poques proves diagnostiques identifiquen amb certesa absoluta si el malalt te o no te la malaltia o quin tipus de malaltia pateix. Per tant, associats a tota prova diagnostica, s’han de considerar els errors diagnòstics.
Poden distingir-se els següents tipus d’errors diagnòstics: o Falsos positius: subjectes sans diagnosticats com a malalts.
o Falsos negatius: subjectes malalts que es diagnostiquen com a sans.
TEMA 1. TEORIA DE LA PROBABILITAT Proves diagnostiques  predir presencia / absència d’una malaltia.
Proves de cribratge  predir presencia / absència d’una malaltia (segments de la població).
Proves pronostiques  predir desenllaç de la malaltia.
INDEXS: - Sensibilitat: S= p (+ | M).
- Especificitat: E= p (- | S).
- Valor predictiu positiu: VPP = p (M | +).
- Valor predictiu negatiu: VPN = p (S | -).
Quan els valors predictius son al voltant del 80% o mes, les proves son valides.
Quan un dels valors predictius es molt baix però la prevalença també (no arriba al 50%) serà una prova valida.
- Prevalença: nomes serà valida quan els subjectes de l’estudi estiguin equilibrats amb el percentatge real de la població.
- Fals negatiu: FN= p (- | M).
- Fals positiu: FP= p (+ | M).
...

Comprar Previsualizar