Tema 1. Teoria de la probabilitat - Fonaments (2017)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Psicología - 2º curso
Asignatura Analisi de dades
Profesor J.F.
Año del apunte 2017
Páginas 14
Fecha de subida 16/10/2017
Descargas 0
Subido por

Vista previa del texto

Anàlisi de Dades Oliwia Ciurlej Tema 1. Teoria de la probabilitat: fonaments 1.1.
Determinisme i aleatorietat Tots més o menys sabem i coneixem el concepte de probabilitat però tenim una dificultat per definir-lo. La probabilitat ens informa o ens indica quina és la versemblança1 a que succeeixi una cosa.
Ciències com la física o la química es caracteritzen pel seu caràcter determinista (establir lleis deterministes): si, per exemple, repetim un experiment en les mateixes condicions vàries vegades, obtenim el mateix resultat.
La psicologia, però, es caracteritza per la seva variabilitat. Molts fenòmens de les ciències de la salut corresponen a situacions aleatòries, de manera que al repetir un experiment en les mateixes condicions es poden obtenir diferents resultats. Exemples: No tots els subjectes amb la mateixa malaltia han de presentar els mateixos símptomes.
/ Si en un grup de persones li diem que donin un palmell quan un bolígraf caigui i toqui el terra, no tots tindran el mateix temps de resposta.
No obstant, existeix una regularitat estadística al repetir un experiment en les mateixes condicions. → Exemple: Al llançar moltes vegades una moneda perfecta s’observa que el nombre de cares i de creus és sensiblement el mateix. Per tant, no es pot predir el resultat d’un llançament en particular, però sí que és possible predir el resultat d’un conjunt de llançaments. Aquest principi de regularitat estadística justifica que si el nombre de repeticions d’un experiment aleatori és molt gran, la freqüència relativa d’un esdeveniment tendeix a estabilitzar-se en un valor que, intuïtivament, representa un valor que anomenem probabilitat d’aquest esdeveniment.
Es necessita alguna eina, llenguatge, que ens permeti treballar amb aquesta variabilitat: aquesta eina és la teoria de la probabilitat. La teoria de la probabilitat és el model matemàtic sobre la regularitat que observem en el món natural, les regularitats a les sèries de freqüències corresponents als fenòmens aleatoris. La probabilitat pràcticament participa en totes les ciències. D’aquesta forma, doncs, la teoria de la probabilitat ens permet treballar l’aleatorietat.
1.2.
Experiments aleatoris La pregunta és: Quina és la base de la probabilitat? És l’aleatorietat.
1 Versemblança: Propietat de ser aparentment certa una hipòtesi estadística.
1 Anàlisi de Dades Oliwia Ciurlej ➢ Definicions bàsiques Prova o experiment aleatòria: És un experiment perfectament definit en el qual es coneixen tots els seus possibles resultats i que quan es repeteix en condicions anàlogues (semblants), es poden obtenir diferents resultats.
Les condicions que caracteritzen un experiment o prova aleatòria són: - Es pot repetir indefinidament en condicions anàlogues.
A cada prova s’obté un resultat que pertany al conjunt de resultats possibles.
Abans de fer l’experiment és impossible predir el seu resultat concret.
Exemple: Experiment de llançament d’un dau de 6 cares.
- - - Tenim 6 possibles resultats (e1, e2, e3, e4, e5 i e6). Cadascun d’aquests possibles resultats que es poden obtenir, conjuntament, es coneixen com a espai mostral.
Primera hipòtesi: Quin és l’esdeveniment de ser inferior a 3? Aquest serà l’esdeveniment A (e1, e2).
Segona hipòtesi: Serà parell? Aquest és l’esdeveniment B (e2, e4, e6).
Esdeveniment que sigui igual a 19 → Succés impossible.
Fem una pregunta a la natura en termes d’esdeveniments i interpretem la seva resposta.
Esdeveniment elemental (e): Cadascun dels possibles resultats d’un experiment aleatori.
Són incompatibles o mútuament excloents donat que no poden presentar-se simultàniament (l’ocurrència d’un esdeveniment elemental implica la no ocurrència d’un altre).
Observació: Resultat obtingut en efectuar un experiment aleatori.
Conjunt fonamental o espai mostral (E): Conjunt format per tots els esdeveniments elementals.
Succés o esdeveniment: Reunió d’un cert nombre d’esdeveniments elementals que defineixen un subconjunt A del espai mostral E d’esdeveniments elementals (ex. Cares amb números parells en un dau). Qualsevol interrogació sobre el resultat de l’experiment aleatori determina un esdeveniment. Aquest esdeveniment pot ser l’esdeveniment impossible (Ø) (ex. Cara d’un dau amb el número 11), un conjunt unitari, 2 Anàlisi de Dades Oliwia Ciurlej amb un únic element (esdeveniment elemental), el mateix espai mostral E (esdeveniment segur), o un conjunt qualsevol.
En un experiment aleatori, l’esdeveniment A s’ha realitzat si, i sols si, l’esdeveniment elemental e resultat de l’experiència pertany al subconjunt A: e Є A.
➢ Principals operacions amb esdeveniments - Operació 1 • Interrogació: p? • Succés: A • Resultat: e Є A (esdeveniment elemental pertany al subconjunt A) • Operació: El succés A s’ha realitzat.
- Operació 2 • Interrogació: p? • Succés: A (o nA) • Resultat: e Є A → e Є A (esdeveniment elemental pertany al succés contrari d’A) • Operació: El succés A no s’ha realitzat. El succés “contrari o complementari d’A”, anomenat nA o A, és l’esdeveniment que es realitza si, i només si, el succés A no s’ha verificat. Representa la negació lògica de “p” → A + A = E.
- Operació 3 • Interrogació: p o q? • Succés: A o B • Resultat: Esdeveniment unió. Esdeveniment que succeeix si al menys es verifica un dels dos esdeveniments (A o B).
• Operació: Reunió d’esdeveniments (A ᴜ B). Subconjunt format pels elements que pertanyen a A o B. Els esdeveniments A o B s’han realitzat (realització alternativa) si el succés e, resultat del experiment, pertany a la reunió dels subconjunts A i B: e Є (A ᴜ B).
- Operació 4 • Interrogació: p i q? • Succés: A i B • Resultat: Esdeveniment intersecció. Esdeveniment que succeeix quan simultàniament es verifiquen els dos successos (A i B).
• Operació: Intersecció d’esdeveniments (A ∩ B). Subconjunt format pels elements que simultàniament pertanyen tant a A com B. L’esdeveniment A i B s’ha realitzat (realització simultània) si el succés e, resultat de l’experiment, pertany a la intersecció A i B: e Є (A ∩ B). Dos 3 Anàlisi de Dades Oliwia Ciurlej esdeveniments són incompatibles o mútuament excloents quan A ∩ B = Ø. Dos esdeveniments són compatibles quan A ∩ B ≠ Ø.
1.3.
Definició axiomàtica de la probabilitat El concepte de la probabilitat ens la dóna la definició axiomàtica: no ens diu com es calcula una probabilitat sinó quines propietats ha de tenir un número per considerar-se probabilitat. Una probabilitat és una aplicació p del conjunt d’esdeveniments en el conjunt R dels nombres reals, tal que satisfà els axiomes següents: - - Axioma de no negativitat. Per tot esdeveniment A: p(A)≥0. Probabilitat = Correspondència entre dos conjunts. → El conjunt dels esdeveniments i els números reals. A cada valor del conjunt inicial li associem un valor numèric de l’altre conjunt.
La probabilitat P no és negativa i menor o igual que 1.
Axioma de normalització. P(E) = 1. Si és igual 0 → L’esdeveniment no es produeix.
Probabilitat de l’esdeveniment segur.
Axioma d’additivitat: Si dos esdeveniments són incompatibles, o mútuament excloents, la probabilitat de la reunió de dos successos és igual a la suma de les probabilitats individuals de cada succés: ➢ Interpretació d’una mesura de probabilitat - Les probabilitats són valors compresos entre 0 i 1 que reflecteixen les “expectatives” d’ocurrència d’un esdeveniment determinat.
- Els valors de probabilitat propers a 1 indiquen que és d’esperar que es produeixi l’esdeveniment en qüestió. No indiquen que l’esdeveniment vagi a produir-se, tan sols assenyalen que “habitualment” es produeix.
- Els valors de probabilitat propers a 0 indiquen que és d’esperar que no es produeixi l’esdeveniment en qüestió. No indiquen que l’esdeveniment no vagi a produir-se, tan sols assenyalen que el succés és estrany.
- Probabilitats properes a 0’5 indiquen que és tan versemblant la ocurrència de l’esdeveniment com la seva no ocurrència.
4 Anàlisi de Dades 1.4.
Oliwia Ciurlej Assignació de probabilitat La definició axiomàtica de la probabilitat estableix les regles que han de satisfer les mesures de probabilitat dels esdeveniments associats a un experiment aleatori. No expressa com assignar les probabilitats d’un determinat esdeveniment elemental.
Com es calculen les probabilitats? ➢ Definició clàssica o “a priori” (espai mostral finit amb esdeveniments elementals equiprobables) - Els espais mostrals més simples són els que contenen un nombre finit d’esdeveniments elementals.
- Supòsit d’equiprobabilitat o d’indiferència: Quan un experiment aleatori pot produir k esdeveniments elementals diferents, i no es coneix cap raó que afavoreixi la presentació d’un esdeveniment elemental en detriment d’un altre, s’assumeix que tots els esdeveniments elementals tenen la mateixa probabilitat d’ocurrència (1/k).
- Regla de Laplace: L’acceptació del supòsit d’equiprobabilitat dels successos elementals, implica que la probabilitat d’un succés A és el quocient entre el número de casos favorables (nA) a la realització de l’esdeveniment i el número de casos possibles (n) de l’experiment aleatori (quantifica la probabilitat associada a un succés concret (A) com la seva freqüència relativa teòrica).
5 Anàlisi de Dades Oliwia Ciurlej A vegades, els resultats produïts en experiments aleatoris són mesures del tipus continu (QI, pes, temps de reacció, etc.) → L’espai mostral, en aquest cas, té una infinitud de resultats possibles, rebent així el nom d’espai mostral infinit. Aquests es classifiquen en numerables i no numerables, en funció de si pot establir-se una correspondència bijectiva amb els números reals. El concepte de probabilitat es transforma en el de densitat de probabilitat, donat que la probabilitat d’un esdeveniment elemental és nul·la.
➢ Definició freqüencista de la probabilitat Aquest mètode (“a posteriori”, o definició estadística) es basa en repetir un experiment moltes vegades sota les mateixes condicions i calcular la freqüència relativa amb la que es dóna un determinat succés.
- - 1.5.
La freqüència relativa f(A) d’un succés es defineix com el quocient entre el número de vegades que s’ha verificat el succés (nA) i el nombre total de vegades (n) que s’ha repetit l’experiment.
El teorema fonamental de la convergència en probabilitat, anomenat llei dels grans números, estableix que les freqüències relatives tendeixen a estabilitzarse en un determinat valor, que coincideix amb la probabilitat del succés P(A), quan n creix indefinidament (estabilització de les freqüències o llei d’atzar).
Anàlogament, la probabilitat d’un esdeveniment és el límit al que tendeix la seva freqüència relativa.
Probabilitat condicionada Una probabilitat condicionada és la probabilitat de que succeeixi un esdeveniment determinat (B) si prèviament ha tingut lloc un altre esdeveniment concret (A).
6 Anàlisi de Dades - Oliwia Ciurlej P(B|A): Probabilitat de que es produeixi B donat que s’ha produït A. Ex.
Probabilitat de presentar un determinat símptoma si estàs malalt.
P(A|B): Probabilitat de que es produeixi A donat que s’ha produït B. Ex.
Probabilitat d’estar malalt al presentar un determinat símptoma.
El coneixement d’alguna informació respecte a un succés condiciona la probabilitat d’ocurrència de l’altre succés.
*p(A) → Esdeveniment segur 7 Anàlisi de Dades 1.6.
Oliwia Ciurlej Teoremes fonamentals ➢ Teorema de la suma o propietat additiva - Si dos esdeveniments són incompatibles o mútuament excloents, la probabilitat de la reunió de dos successos és igual a la suma de les probabilitats individuals de cada succés.
- Llei de la probabilitat total: si els esdeveniments A i B són compatibles, (A ∩ B) ≠ Ø, aleshores: - Aquesta formula es pot generalitzar per a qualsevol número de successos: ➢ Teorema del producte - La probabilitat d’ocurrència simultània de dos esdeveniments, A i B, fa referència a la probabilitat de l’esdeveniment intersecció, (A ∩ B). La seva formulació pot deduir-se a partir de la definició de probabilitat condicionada.
- Llei multiplicativa o de la probabilitat composta pot deduir-se de la definició de probabilitat condicionada: ➢ Esdeveniments dependents i independents Dos esdeveniments, A i B, d’un experiment aleatori s’anomenen: - Independents (en probabilitat) si la realització de l’esdeveniment A no influeix en la probabilitat de B.
- Dependents (en probabilitat) si la realització de l’esdeveniment A influeix en la probabilitat d’ocurrència de l’esdeveniment B.
8 Anàlisi de Dades - 1.7.
Oliwia Ciurlej En cas d’independència, la llei multiplicativa: p(A ∩ B) = p(A) x p(B | A) ve donada per: Teorema de Bayes És un teorema que en general ens deixa investigar les causes a partir del coneixement que tenim dels efectes (ex. El diagnòstic). Indaguem en el temps present per saber què ha pogut passat en el passat.
Un altre exemple: Des del punt de vista temporal, primer arriba la malaltia i després, conseqüentment, apareixen els símptomes (efectes). Amb el teorema de Bayes, es fa una inversió i avaluem els efectes per saber com s’han originat.
➢ Fórmules d’inversió de les condicions - Suposar que es coneixen les probabilitats p(A), p(B) i p(B|A). A partir de la llei multiplicativa, pot determinar-se p(A|B). Definides: 9 Anàlisi de Dades Oliwia Ciurlej S’obté la llei multiplicativa: I, aïllant p(A|B): Que representa la fórmula d’inversió de les condicions.
➢ Definició del teorema de Bayes - Suposar la participació de l’espai mostral E pels esdeveniments A i B i els respectius esdeveniments complementaris (nA i nB).
10 Anàlisi de Dades - Oliwia Ciurlej L’esdeveniment B, es pot descompondre en la reunió de les interseccions amb els esdeveniments A i nA: Donat que són esdeveniments incompatibles, aplicant la propietat additiva: I, a partir de la propietat multiplicativa, s’obté: Substituint p(B) en el denominador de la fórmula d’inversió de les condicions, s’obté el teorema de Bayes: - Quan l’espai mostral es divideix en p esdeveniments Ai, mútuament excloents, el teorema de Bayes es generalitza de manera tal que: - En general, el teorema de Bayes permet estimar la probabilitat de la “causa” si s’ha detectat “l’efecte”.
- Exemple d’al·lucinacions i conductes agressives: • • Probabilitat d’al·lucinar i ser agressiu? (Esdeveniment simultani) → Producte de les dues probabilitats (en aquest cas, p(AᴒB)).
Probabilitats: 1) 2) 3) 4) A nA B 1 2 nB 3 4 Agressivitat i al·lucinacions.
Agressivitat i no al·lucinacions.
No agressivitat i al·lucinacions.
No agressivitat i no al·lucinacions.
11 Anàlisi de Dades • Oliwia Ciurlej Probabilitat de presentar conductes agressives (considerant els factors de presentar i no presentar al·lucinacions): p(AᴒB) + p(nAᴒB) • 1.8.
En cas de la fórmula generalitzada, aquesta s’utilitza per calcular els esdeveniments on varia l’esdeveniment segur. En aquest exemple, és presentat com a l’esdeveniment segur la presentació o la no presentació d’al·lucinacions. La fórmula generalitzada, doncs, s’utilitzaria per calcular aquelles situacions on l’esdeveniment segur és la presentació o la no presentació de conductes agressives.
Proves diagnòstiques o de cribratge ➢ Plantejament - Un procés diagnòstic segueix els següents passos: • Observació i reconeixement de símptomes.
• Identificació de malalties més semblants al quadre clínic del malalt.
• Selecció de símptomes més freqüents en el món real per configurar una primera aproximació al diagnòstic.
• Proves diagnòstiques complementàries per confirmar o descartar el diagnòstic provisional.
- Una prova diagnòstica té 3 objectius: • Proporcionar informació fiable sobre la condició del pacient (salut/malaltia).
• Influir en el pla terapèutic o la relació de serveis assistencials que gestionen les condicions de salut del pacient (influir en el tractament).
• Comprendre la història natural i mecanismes de la malaltia mitjançant la recerca.
- Precisió diagnòstica → Capacitat d’una prova per a discriminar entre estats alternatius de salut. En avaluar la precisió d’una prova diagnòstica, el professional es formula dues preguntes: • Com es comporta la prova en subjectes malalts (sensibilitat)? • Com es comporta la prova en subjectes sans (especificitat)? - El valor d’un mètode diagnòstic s’avalua en relació a un mètode de referència (ex. Millor prova diagnòstica disponible). La qualitat del mètode diagnòstic no és constant i varia en funció de la prevalença de la malaltia en la població i de la composició del mètode diagnòstic basat en diverses proves.
- L’eficàcia d’una prova diagnòstica depèn de la seva capacitat per assenyalar correctament la presència o absència de la malaltia que s’estudia.
Matemàticament s’expressa amb quatre índexs: • Sensibilitat 12 Anàlisi de Dades - Oliwia Ciurlej • Especificitat • Valor predictiu positiu • Valor predictiu negatiu Aquests índexs quantifiquen la capacitat d’una prova per classificar correcta o incorrectament a una persona, segons la presència o absència d’una exposició o malaltia.
Errors diagnòstics: • Falsos positius: Subjectes sans diagnosticats com a malalts. Probabilitat de cometre aquest error → α = p(+/S) • Falsos negatius: Subjectes malalts diagnosticats com a sans. Probabilitat de cometre aquest error → β = p(-/M) ➢ Estimació dels valors predictius amb el teorema de Bayes - El teorema de Bayes permet estimar les probabilitats de jutjar correctament un fenomen (salut o malaltia). Aquestes probabilitats corresponen amb els valors predictius (positiu i negatiu) de la prova en l’àmbit de les proves de cribratge.
- Es basa en la validesa de la prova (sensibilitat, especificitat i probabilitats dels resultats falsos positius i negatius) i en la magnitud del fenomen en un context determinat (prevalença de malaltia, prevalença de salut). Coneixent la prevalença d’una afecció a la població i la sensibilitat i especificitat de la prova diagnòstica utilitzada és possible, gràcies a la fórmula de Bayes, determinar la 13 Anàlisi de Dades Oliwia Ciurlej probabilitat de que un subjecte positiu estigui realment malalt (VPP) i la de que un subjecte negatiu estigui realment sa (VPN).
14 ...

Tags:
Comprar Previsualizar