Apunts Estadística I (2014)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Economía - 1º curso
Asignatura Estadística I
Año del apunte 2014
Páginas 43
Fecha de subida 11/11/2014
Descargas 44
Subido por

Descripción

Apunts complets per l'assignatura d'estadística I del primer curs del grau d'economia, amb l'Anabel Blasco.

Vista previa del texto

Anabel Blasco Estadística T E M A 1 . E S TA D Í S T I C A D E S C R I P T I VA El perquè de l’estadística Problema Abans d’introduir un nou producte o servei al mercat, el fabricant vol saber quin serà el nivell probable de demanda.
Eina Estudi de mercat mitjançant una enquesta.
Població objectiu Tots els compradors potencials. Sovint les poblacions són massa grans o difícils d’identificar.
Definicions Estadística descriptiva: És un conjunt de mètodes i idees per a organitzar i descriure les dades mitjançant mesures de resum numèriques, gràfics i taules.
Població: Conjunt complet d’individus per als quals es desitja obtenir informació.
Mostra: Subconjunt d’individus de la població per als quals realment s’obté la informació d’interès. El nombre d’individus que formen una mostra es coneix com a grandària de la mostra.
Variables: Característiques observables dels individus d’una població.
Observacions: Valors concrets de les variables considerades obtinguts a partir de la mostra.
Tipus de variables Variables qualitatives (o categòriques): pren valors no quantificables numèricament. Són etiquetes (numèriques o no) que indiquen el grup o categoria al quan pertany l’individu. Poden ser: • Nominals: No existeix ordre dintre de les categories (ex: Sexe: Home, Dona).
• Ordinals: Existeix ordre dintre de les categories definides (ex: Alçada: Baix, Mitjà, Alt).
Variables quantitatives: pren valors quantificables. Pren valors numèrics pels quals té sentit fer aritmètica. Poden ser: • Contínues: Poden prendre qualsevol valor dins d’un interval.
• Discretes: Poden prendre qualsevol valor d’una llista finita (o numerable) de valors.
Distribucions de freqüències de variables qualitatives o quantitatives discretes Donada una mostra de grandària n d¡una variable X. Siguin x1,x2,…,xk els diferents valors que ha pres la variable X sobre els individus d’aquesta mostra.
Freqüència absoluta: es defineix la freqüència absoluta n, del valor xi, com el nombre de cops que es repeteix aquest valor en la mostra.
Freqüència relativa: es defineix la freqüència relativa com: fi = ni/n Correspon al percentatge de vegades (proporcions) que aquest valor apareix entre les observacions.
Freqüència acumulada: És la suma de freqüències absolutes fins a un determinat valor un cop ordenats de forma creixent els valors de la variable.
• Freq. absoluta acumulada: Ni = n1 + n2 + … + ni • Freq. relativa acumulada: Fi = f1 + f1 + … + fi Taula de freqüències: Es construeix a partir dels valors i les freqüències d’una variable. La distribució d’una variable X és el conjunt de valors juntament amb les seves freqüències (absolutes o relatives).
Nivel de estudios finalizados Frecuencia Porcentaje Porcentaje válido Porcentaje acumulado Sin estudios 41 5,9 5,9 5,9 Estudios primarios 300 43,0 43,2 49,1 Estudios secundarios 238 34,1 34,2 83,3 Estudios universitarios 116 16,6 16,7 100,0 Total 695 99,7 aaaaa100 Perdidos Otros estudios 2 0,3 Total 697 100,0 Válidos Per trobar freqüències sobre variables quantitatives cal agrupar els valors que pren la variable en intervals, que s’anomenen Intervals de classe (o classes).
Procediment a seguir: 1. Càlcul del rang: Rang = màxim - mínim 2. Longitud de l’interval: I = nombre d’intervals (fixat) L= Rang/I 3. Construcció dels intervals: es realitza de forma iterada, x1 = mínim ––> I1 = [x1, x2, + L) ––> I2 = [x1 + L, x1 + 2L) Variables quantitatives continues. Mesures de centralització, de dispersió i d’altres mesures característiques Mesures de centralització Tenen com a objectiu informar sobre el “centre” d’una distribució donada.
Mitjana (aritmètica) mostral: és el centre de masses de la distribució.
X= x1n1 + x2n2 + … + xknk/n =1/n ∑ki=1 xini Si tots els valors són diferents, X= x1 + x2 + … + xn/n = 1/n ∑ni=1 xi Mediana: És el punt mig de la distribució. La mediana és aquell valor que divideix la mostra en dues parts iguals: el 50% de les observacions són més petites (o iguals) que la mediana i l’altre 50% són més grans (o iguals).
Moda: És el valor més observat en la mostra.
Propietats de la mitjana 1. Sigui a una constant qualsevol i {x1, x2, …, xn} les n observacions de la variable X. Aleshores, la mitjana del resultat de multiplicar les observacions per la constant ({ax1, ax2, …, axn}) és a·X 2. Siguin X i Y dues variables diferents. Aleshores, X + Y = X + Y 3. Siguin {x1, x2, …, xn} les n observacions de la variable X. Aleshores, ∑ni=1(xi-X)=0 4. La mitjana aritmètica sempre existeix, és única, i està molt afecta pels valors extres.
Mesures de dispersió Quartils: s’anomena primer quartil, el nombre Q1 que deixa el 25% de les observacions per sota del seu valor i el 75% de les observacions per sobre. S’anomena segon quartil, el nombre Q2 que deixa el 50% de les observacions per sota i el 50% restant per sobre. I s’anomena tercer quartil, el nombre Q3 que deixa el 75% de les observacions per sota i el 25% per sobre. (Observeu que el segon quartil coincideix amb la mediana de la mostra) Decils: s’anomena decil k-èssim, per k=1, 2, ... 9, el nombre Dk que deixa k dècimes parts de la mostra per sota i (10-k) dècimes parts per sobre.
Percentils: s’anomena percentil k-èssim, per k=1, 2, ... 99, el nombre Pk que deixa k centèsimes parts de la mostra per sota d’ell i (100-k) centèsimes parts per sobre.
Rang interquartílic: distància entre el primer quartil i el tercer quartil.
RI=Q3 –Q1 El coeficients de variació Mesura la dispersió de la mostra d'observacions però de forma relativa a les seves unitats de mesura (o la seva magnitud).
Es calcula com, CV = S/X Propietat: És invariant davant canvis d’unitats.
EXEMPLE: Donada la següent mostra corresponen al nombre de gols observat en la darrera jornada de lliga de primera divisió: X = (2, 6, 4, 4, 2, 4, 2, 3, 5, 0) Troba la variància, el percentil del 90% i el coeficient de variació.
Variància (corregida): la mitjana que havíem trobat era 3,2 2 2 2 1n 110 ) S =1/n-1 ∑(xi −X) =1/10-1∑(xi −3,2) =3,06 Percentil del 90%: Ordenem els valors de més petit a més gran 0, 2, 2, 2, 3, 4, 4, 4, 5, 6 Donat que hi ha 10 valors, el novè correspondrà al percentil buscat: el valor 5.
Coeficient de variació: CV = S = √3,06/3,2 = 0,547 Mesures d’associació entre variables qualitatives Taula de contingència Suposem que s’han observat k valors diferents per la variable X i r valors diferents per la variable Y.
Freqüència absoluta conjunta (nij): Correspon al nombre de cops que apareix la parella (xj , yj) en la mostra.
Freqüència relativa conjunta (fij): Correspon al quocient entre la freqüència absoluta i la grandària de la mostra.
fij = nij/n Freqüència absoluta marginal per files (n ): correspon a la suma de les freqüències absolutes i• conjuntes de la fila i-èsima per i=1,..,k.
ni=∑kj=1nij Freqüència absoluta marginal per columnes (n.j): Correspon a la suma de les freqüències absolutes conjunts de la columnes j-èsima per j=1,…,r n.j = ∑ki=1nij Freqüència relativa marginal per files (fi): fi = ni/n Freqüència relativa marginal per columnes (fj): fj = nj/n Mesures d’associació entre variable quantitatives Siguin X i Y dues variables quantitatives mesurades sobre els individus de la mostra, i siguin {(x1,y1), (x2,y2), … (xn, yn)} els valors observats.
Covariància: mesura de la variació conjunta entre dues variables quantitatives. Es denota per Sxy.
Es calcula com: SncXY = 1/n ∑ni=1∑nj=1 (xi - X)(yj - Y) Covariància corregida (amb millors propietats teòriques).
SXY = 1/n-1 ∑ni=1∑nj=1 (xi - X)(yj - Y) • La covariància s’expressa en les mateixes unitats on estiguin mesurades les variables.
• Pot passar que la intensitat d’associació entre les dues variables sigui elevada per les unitats de mesura.
• Per evitar-ho, es divideix per les desviacions típiques de les variables, donant lloc a l’anomenat coeficient de correlació lineal de Pearson.
• Coeficient de correlació lineal de Pearson: mesura el grau d’associació lineal entre dues variables quantitatives. Es denota per r. Es calcula com: r= Sxy/SxSy Aquesta mesura numèrica indica si l’ajustament dels punts d’una mostra mitjançant una recta és un bon ajuts.
Propietats: - Sempre es complirà que: -1 ≤ r ≤1 - El signe del coeficient de correlació indica el tipus de dependència que hi ha entre les variables: - si r ≥ 0, la dependència es diu directa: un augment (disminució) de la variable X, implica un augment (disminució) de la variable Y.
- si r ≤ 0, la dependència és inversa: n augment (disminució) de la variable X, implica una disminució (augment) de la variable Y.
- Quant més a prop de 1 (0 de .1) estigui el coeficient de correlació r, més “intensa” serà la relació entre X i Y.
Concepte de causalitat El fer d’observar una relació estadística entre dues variables, Xi Y, no implica necessàriament que una variable sigui la causa de l’altre.
T E M A 2 . T E O R I A D E L A P R O B A B I L I T AT • Esdeveniments aleatoris i Espai mostral.
• Definició de probabilitat.
• Combinatòria.
• Càlcul de probabilitats.
- Propietats.
• Probabilitat condicionada i independència estocàstica.
• Teorema de la probabilitat total.
• Teorema de Bayes.
Introducció La Teoria de Probabilitat estudia la regularitat estadística en la variabilitat dels resultats d’experiments o fenòmens aleatoris.
Experiment aleatori: Els fenòmens aleatoris o experiències aleatòries són aquelles en què el resultat, sota les mateixes però presenta una regularitat estadística al llarg d’un nombre elevat de repeticions de l’experiència.
Nota: els fenòmens aleatoris també són coneguts com: fenòmens estocàstics, no deterministes probabilístics, atzarosos, etc.
Espai Mostral La col·lecció de tots els resultats possibles d’un experiment forma el Conjunt de Resultats o Espai Mostral de l’experiment. Cada un d’aquests possibles resultat o Espai mostral de l’experiment. Cada un d’aquests possibles resultats s’anomena succés elemental o esdeveniment elemental i es sol notar per w.
Ω = (w1, w2, …, wn) Els espais mostrals es poden classificar en: • Discrets: el conjunt de resultats es pot numerar.
- Finits: per exemple, llançament d’un dau.
- Infinits: per exemple, el nombre de vegades que llancem una moneda fins que surt cara.
• Continus: el conjunt de resultats no es pot numerar. Per exemple, el temps de vida d’una bombeta.
Observació: donat un experiment aleatori, l’espai mostral associat ha de contenir el màxim d’informació possible relativa a la realització d’aquest experiment.
µÀlgebra de successos Donat un experiment aleatori el conjunt de tots els esdeveniments, és a dir, el conjunt de tots els subconjunts d’Ω s’anomena µAlgebra d’esdeveniments i es denota amb la lletra A.
Les operacions amb esdeveniments deriven de la Teoria de Conjunts.
En el llenguatge de Teoria de Conjunts, A és el conjunt de part d’Ω o conjunt potència d’Ω, P(Ω).
La cardinalitat del conjunt de potència és: /P(Ω)/ = 2/Ω/ Tipus d’esdeveniments Siguin A i B € A dos esdeveniments qualsevols, I.
A i B són diferents si hi ha un resultat possible que faci que es doni un esdeveniment i l’altre no.
Exemple: A = {2, 4, 6} i B = {1, 2}.
II.
A i B sóniguals si no són diferents. Exemple:A={2,4,6} i B={2,4,6}.
III.
A i B són contraris o complementaris si quan un es dona l’altre no es dona i quan un no es dona l’altre si que es dona. Exemple: A = {2, 4, 6} i B = {1, 3, 5}.
IV. A i B són mútuament excloents, disjunts o incompatibles si no es poden donar els dos a la vegada, és a dir, quan un es dona l’altre no es dona. Exemple: A = {2, 4, 6} i B = {1, 3}.
V.
A està inclòs en B si sempre que es dona A també es dona B. Exemple: A = {2, 4, 6} i B = {2, 3, 4, 6}.
I.
Unió: A U B és l’esdeveniment que es dona si i només si es dona A o es dona B o tots dos a la vegada.
II.
Intersecció: A ∩ B és l’esdeveniment que es dona i i només si es donen A i B a la vegada.
III. Complementació: Complementació: es diu que Ā és l’esdeveniment complementari d’A si es dona quan no es dona A.
IV. Diferència: A\B és l’esdeveniment que es dona si i només si es dona A i no es dona B.
Diagrames de VENN És una representació gràfica d’espais mostrals i d’esdeveniments.
En un experiment aleatori, es representa l’espai mostral Ω per un rectangle i qualsevol esdeveniment A es dibuixa com una figura situada dins del rectangle.
i. Unió: A ∪ B és l’àrea que compren els dos esdeveniments (àrea ombrejada) ii. Intersecció: A ∩ B és l’àrea on es solapen els dos esdeveniments.
iii. Complementació: Ā és l’àrea de l’espai mostral Ω que no conté A.
iv. Diferència: A\B és la part de l’àrea de A que no es solapa amb B.
PROPIETATS DELS ESDEVENIMENTS i. Lleis Distributives: A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) ii. Lleis de Morgan: A∪B=A∩B A∩B=A∪B Aquestes propietats és fàcil verificar-les mitjançant els diagrames de Venn.
DEFINICIÓ DE PROBABILITAT Definició clàssica de probabilitat La probabilitat clàssica (o discreta) s’aplica quan es tracta d’assignar probabilitats a un experiment aleatori − que té un nombre finit de resultats, i − en què tots els resultats possibles es poden considerar igualment versemblants (igualment probables).
Aquesta definició està lligada als jocs d’atzar. Sigui un succés A ⊂ Ω, aleshores, P (A) = Nombre de casos favorables/Nombre de casos possibles = A/Ω Definició axiomàtica de probabilitat Sigui Ω l’espai mostral d’un experiment aleatori i A el conjunt de parts de Ω. La probabilitat és tota aplicació P: A [0, 1] tal que compleix els següents axiomes: A.1) P(A) ≥ 0 per a tot esdeveniment A ∈ A A.2) P(Ω)=1 A.3) si A i B ∈ A tals que A ∩ B = ∅ (disjunts), es compleix la igualtat P(A ∪ B ) = P(A) + P(B) Aquest últim axioma es generalitza a una seqüència de successos disjunts dos a dos.
PROPIETATS Siguin A i B ∈ A dos esdeveniments qualsevol, P(A)=1–P(A) P (∅) = 0 i P (A) ≤ 1 per a tot A ∈ A.
si A implica B (A ⊆ B), aleshores P(A) ≤ P(B) si A i B no incompatibles (A ∩ B ≠ ∅), aleshores P(A ∪ B) = P(A) + P(B) - P(A ∩ B) Si generalitzem pel cas amb n esdeveniments obtenim la fórmula següent: P(A1 U A2 U a3 U … An) = ∑ni=1 P(Ai) - ∑i1<i2 P(Ai1 ∩ Ai2) + ∑i1<i2<i3 P(Ai1 ∩ Ai2 ∩ Ai3) - … + (-1)n-1 P (A1 ∩ A2 ∩ … An) C O M B I N AT Ò R I A Es coneix com a combinatòria el conjunt de tècniques que permeten el recompte dels diferents resultats que conformen un succés o esdeveniment o tot l’espai mostral.
El factor més important a tenir en compte a l’hora de fer un recompte és si importa l’ordre dels diferents objectes que formen part d’un succés o si, per contra, l’ordre no importa.
Exemples: “La primitiva”, està clar que l’ordre amb el que escrivim els dígits no importa: la “combinació” {2 5 15 20 33 45} és la mateixa que {15 2 45 33 5 20}.
En el sorteig de la grossa de Nadal, aquest ordre sí que és important: el bitllet amb el número 34567 no és el mateix que 54376 per més que contingui els mateixos dígits.
• La tècnica combinatòria que estudia els casos en els que l’ordre importa s’anomena recompte de permutacions. (2 1 3) ≠ (3 1 2) • El recompte de combinacions s’ocupa dels casos en els que l’ordre no importa.
(2 1 3) = (3 1 2) En tots dos casos haurem de tenir en compte, a més, si un mateix objecte pot aparèixer més d’una vegada, es a dir, es pot repetir. Si és així, parlarem de permutacions amb reposició en el primer cas i de combinacions amb reposició en el segon.
Permutacions Permutacions sense reposició S’anomena permutació sense repetició de n objectes distingibles qualsevol conjunt obtingut a través de la ordenació en una filera dels n objectes donats.
D’un conjunt d’n elements distingibles es pot obtenir: Pn=n⋅(n−1)⋅(n−2)⋅K⋅2⋅1=n! permutacions diferents. El nombre P s’anomena nombre de permutacions de n (objectes) i es n llegeix “permutacions de n”. La notació n! s’utilitza per abreujar el producte, n·(n-1)·(n-2)· ... · 2·1 n! = n ⋅ ( n − 1) ⋅ ( n − 2 ) ⋅ K ⋅ 2 ⋅ 1 (es llegeix “n factorial”) on n és un nombre natural. A aquesta definició s’afegeix el conveni que 0! =1 Si només volem seleccionar r objectes dels n objectes disponibles (r ≤ n.), aleshores el nombres de permutacions possibles és: P ( n , r ) = n ⋅ ( n − 1) ⋅ ( n − 2 ) ⋅ K ⋅ ( n − r + 1) =n!/(n-r)! Tenim n objectes per a la primera posició de la filera, queden n-1 per a la segona posició, i així successivament fins a completar les r posicions de la fila.
Permutacions amb reposició Si un mateix objecte pot aparèixer varies vegades a la filera, tindrem n objectes disponibles per la primera posició de la fila, els mateixos n per la segona, els mateixos n per la tercera, etc. Es pot obtenir: PRn = n⋅n⋅…⋅n =nn O bé, si ens limitem a r extraccions, PR(n,r) = n⋅n⋅…⋅n =nr Permutacions amb reposició: Cas particular Suposem que hi ha n objectes dividits en grups que són parcialment distingibles en el següent sentit: • No es pot distingir entre dos objectes que pertanyen al mateix grup.
• Es pot distingir entre dos objectes que pertanyen a dos grups diferents.
Suposem que el nombre de grups és k i nk representa el nombre d’objectes en el k-èssim grup de tal manera que n1 + n2 + … + nk = n. Una permutació d’aquests objectes és el conjunt resultant d’ordenar-los en una filera. Si tots els objectes fossin distingibles, el nombre de permutacions seria Pn=n!. Ara bé, els intercanvis de posicions entre els objectes que pertanyen al mateix grup dóna lloc a la mateixa permutació i, per tant, el nombre de permutacions amb repetició de n objectes parcialment distingibles és el següent: PR(n,n1,n2,…,nk ) = n!/n1!· n2!·…· nk! Combinació sense reposició S’anomena combinació sense repetició de n objectes distingibles agafats de r en r qualsevol subconjunt de r objectes, tots ells diferents, extrets dels n objectes disponibles. Entre els r objectes agafats, l’ordre no té cap importància i r satisfà r ≤ n.
El nombre de combinacions possibles es calcula com el quocient entre en nombre de permutacions sense repetició de r objectes sobre n i el nombre de permutacions possibles dintre de cada permutació: C(n,r) = P(n,r)/Pr = n!/(n-r)· r! S’utilitza molt sovint la notació ⎜n/r ⎟ (l’anomena’t coeficient binomial). Observació: C(n,r)=C(n,n−r) Combinació amb repetició Una combinació amb repetició de n objectes agafats de r en r difereix de la combinació sense repetició en el fet que es permet repetir els objectes agafats. Com que l’ordre d’objectes no té importància en combinacions, n’hi ha prou d’indicar quantes vegades entra cada objecte en una combinació.
En general, la fórmula és la següent: CR(n,r) = (n + r - 1 / r) = (n+r-1)!/(n-1)!· r! Observeu que, en cas de combinacions amb repetició, no és necessari que es compleixi r ≤ n.
CÀLCUL DE PROBABILITATS RESUM PROPIETATS Es resumeixen a continuació les propietats que poden resultar d’utilitat pel càlcul de la probabilitat de qualsevol esdeveniment.
1. P(∅) = 0 2. P( A ) = 1 – P(A) 3.A ⊆ B P(A)≤P(B) Si l’espai mostral Ω està composat de n resultats (o esdeveniments elementals) diferents tots ells i equiprobables, aleshores.
P(wi) = 1/n (i = 1,2,…,n) 5. Si l’espai mostral Ω està composat de n resultats (o esdeveniments elementals) diferents tots ells i equiprobables i, l’esdeveniment A està composat de n d’aquests resultats, aleshores A P(A) = nA/n Si estem considerant m esdeveniment disjunts, és a dir, tals que Ai ∩ Aj = Ø per a i ≠ j, aleshores P (Umi=1Ai) = ∑mi=1 P(Ai) 7. Siguin A i B dos esdeveniments qualsevols, aleshores P( A ∪ B) = P( A) + P(B) − P( A ∩ B) 8. Siguin A, B i C tres esdeveniments qualsevols, aleshores P( A ∪ B ∪ C) = P( A) + P(B) + P(C) − P( A ∩ B) − P( A ∩ C) − P(B ∩ C) + P( A ∩ B ∩ C) Probabilitat condicionada Suposem que tenim a priori una informació per calcular la probabilitat d’un determinat succés A ⊂ Ω lligat a una experiència aleatòria. Aquesta informació disponible és una situació en la qual coneixem la probabilitat de realització d’un altre succés B tal que P(B)>0 i volem veure com influeix P(B) en P(A).
La probabilitat condicionada és el càlcul de la probabilitat d’A suposada la realització de B. Si P(B)>0 llavors: P(A/B) = P(A∩B)/P(B) Si P(B)=0, la probabilitat condicionada no està definida. Interpretació: Probabilitat de A donat B.
Propietats De la fórmula de propietat condicionada es deriva: Independència Dos esdeveniments A i B, tals que P(A) ≠ 0 o P(B) ≠ 0, són independents si i només si P(A B) = P(A), és a dir, quan la realització de B no afecta a la realització de A, o bé, P(B A) = P(B), la realització de A no afecta a la realització de B.
Observació: Aquesta particularitat permet definir pròpiament el concepte d’independència estocàstica.
Dos esdeveniments A i B ∈ A són estocàsticament independents o, simplement, independents si: Generalitzant, una col·lecció de k esdeveniments A , ... , A ∈ A són estocàsticament 1 k independents o, simplement, independents si per qualsevol subconjunt de 2 o més esdeveniments es compleix: Propietats De la fórmula de propietat condicionada es deriva: I.
L’esdeveniment impossible (∅) és independent de qualsevol esdeveniment.
II. Si dos esdeveniments son incompatibles (o mútuament excloents, A ∩ B = ∅), aleshores NO són independents.
III. Si un esdeveniment està inclòs en un altre (A ⊆ B o B ⊆ A), aleshores NO són independents.
IV. Si A és independent de B, aleshores B és independent de A.
V.
Si A és independent de B i B és independent de C NO implica que A és independent de C.
VI. Si A és independent de B, aleshores A és independent de B, A és independent de B, i A és independent de B.
Teorema de la probabilitat total Sigui A una σ-àlgebra d’esdeveniments i A , A , ..., A una col·lecció d’esdeveniments qualssevol que 1 2 n satisfà: (i) A ∩ A =∅ per a i ≠ j.
i j (ii) A ∪ A ∪…∪A =Ω 1 2 n en aquest cas es diu que A , A , …, A formen una partició de Ω.
1 2 n (iii) P(A ) > 0 ∀A (i = 1, …, n) i i Aleshores, per a qualsevol succés B ∈ A : Gràficament: Interpretació Una interpretació habitual del Teorema de les probabilitats totals es pot fer en termes d’arbres de probabilitat. En un arbre de probabilitat tenim una descripció per “branques” de totes les maneres en que B pot ocórrer. I la probabilitat P(B) es pot calcular com la suma de les masses de probabilitats de totes les branques que condueixen a B. Tenim tantes branques per arribar a l’esdeveniment B com successos que particionen Ω.
Exemple Una caixa conté quatre monedes, 3 són "honestes“ i una està trucada (té dues cares). S’escull una moneda a l’atzar de la caixa i es llança a l’aire dos cops. Quina és la probabilitat d’observar dues cares.
Les probabilitat de treure cares i creus estan condicionades a la selecció de la moneda.
P(CC | H) = 1/2 · 1/2 = 1/4 P(CX | H) = 1/2 · 1/2 = 1/4 P(XC | H) = 1/2 · 1/2 = 1/4 P(XX | H) = 1/2 · 1/2 = 1/4 P(CC | T) = 1 Donat que busquem la probabilitat de treure dues cares, sense condicionar, això és: P(CC) = P(CC | H) · P(H) + P(CC | T) · P(T) = 1/4 · 3/4 + 1 · 1/4 = 7/16 = 0,4375 A1 = Honesta, A2 = Trucada, P(A1) = 3/4 P(A2) = 1/4 Fent servir el teorema de la probabilitat total, no cal realitzar l’arbre.
L’espai mostral està particionat en monedes Honestes i monedes Trucades. Partició: Es defineix el succés B := Treure dues cares.
P(B) = P(B | A1) · P(A1) + P(B| A2) · P(A2) = 1/4 · 3/4 + 1 · 1/4 = 7/16 = 0,4375 Teorema de Bayes Interpretació La fórmula de Bayes és una de les lleis més importants del càlcul de probabilitats. La possibilitat de revisar probabilitats quan apareix una nova informació té una gran potencialitat.
Un exemple concret és l’ús de la regla en el disseny de software per tenir filtres (anomenats bayesians) de correu electrònic per a distingir el correu porqueria (spam) del correu normal.
Més mundanament, si Barça i Real Madrid fossin equips idènticament potents les probabilitats de que guanyés un o altre equip haurien de ser idèntiques. No obstant, la majoria d’àrbitres tenen un tint blau-grana segons l’opinió de l’entrenador blanc. Per tant, un cop se sap el nom de l’àrbitre del partit Barça- Madrid (o Madrid-Barça), no és d’estranyar que les probabilitats ja no siguin necessariament idèntiques.
Exemple Un pescador té tres llocs de pesca.Al lloc A hi va 3 de cada 9 dies,al B2 de cada 9 i al C 4 de cada 9.
La probabilitat de pescar un peix a la primera és de 0.2, 0.1 i 0.25 respectivament. En un d’aquests llocs ha pescat un peix a la primera. Quina és la probabilitat de que sigui en el lloc B? Sigui A el succés “triar el lloc A”, B:=“triar el lloc B” i C:=“triar el lloc C”. Llavors, P(A) = 3/9, P(B) = 2/9 i P(C) = 4/9.
Sigui ara peix:= “pescar un peix a la primera”, ens diuen que P( peix | A ) = 0,2 P( peix | B ) = 0,1 P( peix | C ) = 0,25 I es demana, P(B | peix) Final 1r parcial T E M A 3 . V A R I A B L E S A L E AT Ò R I E S D I S C R E T E S Introducció El càlcul de probabilitats que hem estudiat fins ara s’ha centrat en veure com podem assignar probabilitats als esdeveniments simples ω de l'espai mostral Ω i a partir d'aquí als esdeveniments compostos A presents en Ω.
A partir d’ara mirarem d’estudiar com calcular probabilitats quan els esdeveniments simples en Ω són transformats en valors numèrics reals mitjançant una determinada regla numèrica o funció definida en el conjunt Ω (el domini de la funció) amb arribada en el conjunt dels números reals IR (el recorregut de la funció).
L’objectiu ara és avaluar les probabilitats dels números reals x que resulten d’aplicar una funció sobre els elements de Ω. Observis que cada possible funció (i n’hi han moltes !!) donarà lloc a uns nombres reals diferents i, per tant, a un diferent repartiment de les probabilitats que corresponen als elements de l'espai mostral Ω.
Definició variable aleatòria El càlcul de probabilitats que hem estudiat fins ara s’ha centrat en veure com podem assignar probabilitats als esdeveniments simples ω de l'espai mostral Ω i a partir d'aquí als esdeveniments compostos A presents en Ω.
A partir d’ara mirarem d’estudiar com calcular probabilitats quan els esdeveniments simples en Ω són transformats en valors numèrics reals mitjançant una determinada regla numèrica o funció definida en el conjunt Ω (el domini de la funció) amb arribada en el conjunt dels números reals IR (el recorregut de la funció).
L’objectiu ara és avaluar les probabilitats dels números reals x que resulten d’aplicar una funció sobre els elements de Ω. Observis que cada possible funció (i n’hi han moltes !!) donarà lloc a uns nombres reals diferents i, per tant, a un diferent repartiment de les probabilitats que corresponen als elements de l'espai mostral Ω.
Exemple Llancem dues monedes, aleshores: Ω = {cc, c+, +c, ++} A = {∅, {cc}, {c+}, {+c}, {++}, {cc, c+}, {cc, c+},..., Ω} P=1⁄4∀ω ∈Ω i Podem definir la variable aleatòria X1 := “Número de cares”.
Suport d’una variable aleatòria: Donada una variable aleatòria X, el conjunt de valors que pot prendre, o suport de la variable (supp(X)), són els valors reals x pels qual existeix algun resultat (ωi) de l’espai mostral (Ω) tal que X(ωi) = x.
Variable aleatòria discreta: una variable aleatòria X és discreta si el conjunt de valors numèrics que pren és finit o infinit numerable. Per exemple: suma del resultat del llançament de dos daus.
Variable aleatòria contínua: una variable aleatòria X és contínua si el conjunt de valors numèrics que pren és infinit no numerable. Per exemple: cotització d’una acció de borsa.
Funció de massa de probabilitat Un cop coneixem el suport de la variable X, és fàcil trobar la probabilitat p(x) de cada valor x a partir de les probabilitats dels elements d’ Ω que corresponen a cada un dels valors de X.
Concretament: p(x)=P(X=x)=P(ωi∈Ω|X(ωi)=x) Exemple Per a la variable X1:= “Número de cares”, s’obté: P(X1=2)=P({cc}) = 1⁄2·1⁄2=1⁄4 P(X1=1)=P({c+})+P({+c}) = 1⁄2·1⁄2 +1⁄2·1⁄2 =1⁄2 P(X 1 =0)=P({++}) = 1⁄2·1⁄2=1⁄4 I per la variable X2:= “Diferències entre cares i creus”, es té: P(X2=2)=P({cc}) = 1⁄2·1⁄2=1⁄4 P(X2=0)=P({c+})+P({+c}) = 1⁄2·1⁄2 +1⁄2·1⁄2 =1⁄2 P(X2=-2)=P({++}) = 1⁄2·1⁄2=1⁄4 Quina és la probabilitat de què X1sigui igual a - 2 , P(X1= - 2)? I la probabilitat de que X2 sigui igual a 1, P(X2=1)? Observació: Tot i que els resultats de l’espai mostral Ω són equiprobables, el valors numèrics de la variable aleatòria NO són equiprobables: diferents valors tenen diferents probabilitats, ara bé, la suma ha de ser igual a 1.
Donada una variable aleatòria X i les probabilitats dels seus valors, la funció de probabilitat fX de X es defineix com a la funció fX: IR [0 , 1] tal que Observació: Amb la funció de probabilitat tenim prou per caracteritzar completament la variable aleatòria. Això és, la funció de probabilitat recull tota la informació de la variable aleatòria.
FUNCIÓ DE DISTRIBUCIÓ Donada una variable aleatòria X i la seva funció de probabilitats fX , la funció de distribució FX de X es defineix com la funció FX : IR [0 , 1] tal que Fx(x)=P(X≤x) ∀x∈suport(X) Per a un valor concret del suport, això és, Aquesta probabilitat també rep el nom de probabilitat acumulada fins a xK.
MOMENTS DE LES VARIABLES ALEATÒRIES DISCRETES Els moments són les magnituds resum dels trets més característics d’una variable aleatòria. Aquests moments donen informació sobre la centralitat, dispersió, simetria i d’altres característiques de la variable i la seva distribució.
Mitjana teòrica o esperança matemàtica L’esperança d’una variable aleatòria discreta X amb funció de probabilitat f , es denota per μ X o bé E(X) i es defineix com a: sempre que aquesta sèrie sigui absolutament convergent. Aquest és el primer moment d’una variable aleatòria.
ESPERANÇA MATEMÀTICA Propietats: (i)  E(a) = a (ii)  E(a·X)=a·E(X) (iii)  E(a+X)=a+E(X) (iv)  E(X + Y) = E(X) + E(Y) (v)  E(X · Y)=E(X) · E(Y) si X i Y són independents (vi) donada una funció g, X Variància Variància teòrica La variància d’una variable aleatòria discreta X amb funció de probabilitat fX , es denota per σX2, o bé Var(X) i es defineix com a: sempre que aquesta sèrie sigui absolutament convergent. Aquest és el segon moment d’una variable aleatòria.
La variància d’una variable aleatòria X mesura la dispersió o variabilitat dels valors observables de X en relació al seu valor esperat E(X).
Propietats: (i)  Var(a) = 0 (ii)  Var(a·X)=a2·Var(X) (iii)  Var(a + X) = Var(X) (iv)  Var(X + Y) = Var(X) + Var(Y) si X i Y són independents (v)  Var(X) ≥ 0 Una fórmula equivalent i més pràctica per calcular la variància és: DESVIACIÓ TÍPICA I COEFICIENT DE VARIACIÓ Desviació típica (o estàndard) La desviació típica o estàndard d’una variable aleatòria discreta X amb funció de probabilitat fX, es denota per σX, o bé SD(X) i es defineix com a: La desviació típica d’una variable aleatòria X és també una mesura de la dispersió però en les mateixes unitats de mesura que la variable aleatòria.
Coeficient de variació El coeficient de variació d’una variable aleatòria discreta X amb funció de probabilitat fX, es denota per CV(X) i es defineix com a: VECTORS ALEATÒRIS DISCRETS FUNCIÓ DE PROBABILITAT CONJUNTA FUNCIONS DE PROBABILITAT MARGINALS FUNCIONS DE PROBABILITAT CONDICIONADES Covariància Interpretació: Una covariància es dóna quan els valors elevats d’una de les variables van acompanyat de valors elevats de l’altra, mentre que una covariància negativa indica que valors elevats d’una de les variables es corresponen amb valors baixos e l’altra.
Propietats: 1. COV (X,a)=0 2. COV (X + a, Y + b) = COV (X,Y) 3. COV (X,X) = Var (X) 4. COV (X,Y) = COV (Y,X) 5. COV (aX, bY) = abCOV (X,Y) Coeficient de correlació lineal de Pearson MATRIU DE VARIÀNCIES I COVARIÀNCIES Principals distribucions discretes Distribucions discretes de probabilitats Com s’ha vist, una variable aleatòria queda completament determinada a partir de la seva funció de probabilitat.
A continuació, s’enuncien una sèrie de distribucions conegudes que serveixen per modelar diferents experiments aleatoris.
Cada una d’aquestes distribucions vindrà caracteritzada per un o més paràmetres que ens informaran sobre les característiques concretes de la distribució i, en cada cas serà d’interès no només conèixer el suport i la funció de probabilitat corresponent, sinó també quin és el valor esperat (esperança) de la variable i també la seva variància.
Les distribucions discretes que es veuran en aquests curs són les següents: .
-  Distribució de Bernoulli -  Distribució Binomial -  Distribució Geomètrica -  Distribució de Poisson DISTRIBUCIÓ DE BERNOULLI És una forma de modelar estadísticament qualsevol experiment aleatori que tingui només dos resultats possibles, normalment èxit i fracàs. En aquestes condicions, definim la variable aleatòria X que assigna un 1, si el resultat és un èxit, i un 0, si és un fracàs, X = 1 si es dóna ”èxit” X = 0 si es dóna ” fracàs” Si la probabilitat d’èxit és p i, per tant, la probabilitat de fracàs és q = 1 – p, diem que X té una distribució de Bernoulli de paràmetre p, amb funció de probabilitat: és a dir, P(X = 1) = p i P(X = 0) = 1-p. I es denota per X ~ Bern(p).
L’esperança i la variància es pot veure que corresponen a: E[X] = p, Var(X) = p·(1-p) Exemple El cas més paradigmàtic és el del llançament d’una moneda. Pot donar cara C o creu T. L’espai mostral és Ω = {C, T}. Si identifiquem cara amb “èxit” i creu amb “fracàs”, podem definir una variable X sobre Ω com X(C) = 1 i X(T) = 0. En la terminologia habitual de les variables aleatòries escriurem (X = 1) per a representar l’esdeveniment “èxit” i (X = 0) per a representar el “fracàs”. En el cas concret de la moneda, la probabilitat d'èxit (que surti cara) és P(X=1) = p = 1⁄2, però p pot ser qualsevol real entre 0 i 1 en funció del fenomen binari en estudi. A l’engegar un cotxe, per exemple, tenim que o funciona (èxit) o no funciona (fracàs) i en aquest cas la probabilitat d'èxit p sabem que és un numero molt proper a 1 (perquè gairebé sempre tenim èxit).
DISTRIBUCIÓ BINOMIAL Es realitzen n experiments independents de Bernoulli amb la mateixa probabilitat d’èxit p. La variable aleatòria X que compta el nombre d’èxits observats en aquests n experiments es diu que segueix una distribució binomial de paràmetres n i p. Es denota per X ~ B(n, p) i la funció de probabilitat d’aquesta variable ve donada per: L’esperança i la variància són: E[X] = n·p, Var(X) = n·p·(1-p) DISTRIBUCIÓ GEOMÈTRICA Un distribució Geomètrica representa una situació que consisteix en repetir (de forma independent) un experiment del tipus Bernoulli fins que es dóna “èxit” per primer cop. Es diu que X segueix una distribució geomètrica de paràmetre p, que es denota per X ~ Geom(p) amb funció de probabilitat: L’esperança i la variància són: DISTRIBUCIÓ DE POISSON Una distribució de Poisson representa una situació que consisteix en comptar el número de vegades que es dóna un determinant fenomen en un interval de temps fixat (es suposa conegut el número mig (λ) de vegades que es dóna aquest fenomen). Direm que la variable aleatòria X segueix una distribució de Poisson de paràmetre λ > 0, i es denota per X ~ Pois(λ), si la funció de probabilitat de X es: Aquesta tipus de variable és com una Binomial però sense saber quantes repeticions hi ha de l’experiment. És a dir, X compta quantes vegades es donarà “l’èxit” en un determinat interval de temps (o d’espai).
En aquest cas, l’esperança i la variància són: E[X] = λ Var(X) = λ Més exemples de situacions que es modelen mitjançant la distribució de Poisson: I.
El nombre de trucades telefòniques que rep una centraleta en un determinat període de temps.
II.
El nombre d’accidents de trànsit en una zona d’autopista.
III. El nombre de clients que arriben a un mostrador d’un supermercat en una hora (o el període que sigui).
IV. El nombre de contagis d’una malaltia en un mes (o el període que sigui), (v) el nombre de gols en un partit de futbol.
T E M A 4 . V A R I A B L E S A L E AT Ò R I E S C O N T Í N U E S Ara considerarem variables aleatòries que, a diferència de les variables discretes, poden prendre qualsevol valor de la recta real o dins d’un interval d’aquesta. Així doncs, les variables aleatòries contínues poden prendre infinits valors.
En aquest sentit, mai es pot saber el valor exacte d’una variable aleatòria contínua.
Les variables aleatòries contínues com les variables aleatòries discretes, es caracteritzen per la seva funció de distribució (fx(X)), però no tenen funció de probabilitat px(X)(ja que mai es pot saber el valor exacte). En lloc d’aquesta tenim la funció de densitat de probabilitat fx(X), que és la derivada de la funció de distribució.
Funció de densitat Per a les variables aleatòries discretes la funció de probabilitat a Donada una variable aleatòria contínua X, la funció de densitat fx de X es defineix com la funció fx per tot R tal que, P(a≤X≤b)=∫bafx(x)dx Distribucions contínues de probabilitat Com en el cas de les variables aleatòries discretes, a continuació, s’enuncien una sèrie de distribucions conegudes que serveix per modelar diferents experiments aleatoris.
Cada una d’aquestes distribucions vindrà caracteritzada per un o més paràmetres que ens informaran sobre les característiques concretes de la distribució, i en cada cas serà d’interès no només conèixer el suport i la funció de densitat corresponent, si no també quin és el valor esperat (esperança) de la variable i també la seva variància. També serà d’utilitat conèixer la representació gràfica de la funció de densitat i les àrees que determinen les diferents probabilitats en cada cas.
Distribució uniforme La distribució uniforme és el cas més simple de distribució contínua. Correspon al cas en que la probabilitat que la variable prengui un valor dins un determinat interval [a; b] és proporcional a la longitud d’aquest interval, b -a.
En aquest cas s’utilitzen 2 paràmetres per determinar les característiques concretes d’aquesta distribució, els dos extrems del interval que determina el suport de la variables: a i b.
Distribució uniforme Es diu que una variable aleatòria contínua X segueix una distribució uniforme en l’interval [a,b], X~U[a,b], si la funció de densitat de la variable X és: La seva funció de distribució Fx(x) és 0 fins a a, recta amb pendent partir de b. S’expressa com: en l’interval [a,b] i 1 a L’esperança i la variància de la variable aleatòria X~U[a,b] són: Distribució exponencial La distribució exponencial s’ajusta a moltes situacions diferents en les que el pas del temps juga un paper important. S’aplica, per exemple, per estudiar la rendibilitat d’actius financers o per analitzar la vida útil de molts components electrònics.
Presenta un únic paràmetre que permet determinar les característiques concretes d’aquesta distribució, λ, que està relacionat amb l’esperança.
Es diu que una variable aleatòria X segueix una distribució exponencial de paràmetre λ > 0, X ~ Exp (λ) si la funció de densitat de X és: Distribució normal La distribució Normal és, probablement, la distribució més important en estadística.
S’ajusta a qualsevol situació en la que els diferents valors d’una variable s’agrupen majoritàriament al voltant de la mitjana, amb una certa dispersió cap els extrems. Per exemple, la renda de les persones d’una determinada població tendeix a concentrar-se principalment al voltant de la renda mitjana, amb una certa dispersió cap a rendes molt altes o molt baixes. A més, l’anomenat “Teorema central del límit” estableix que si sumem una gran número de variables aleatòries, tinguin la distribució que tinguin, aquesta suma es pot aproximar amb molta precisió per una distribució Normal.
Finalment, d’altres distribucions importants com ara la Binomial o la Poisson es poden aproximar també per una distribució Normal, el que facilita molt els càlculs.
Una distribució Normal concreta sempre s’especifica mitjançant dos paràmetres, μ i σ2, que corresponen a l’esperança i la variància respectivament.
Es diu que una variable aleatòria continua X segueix una distribució normal de paràmetres μ i ~ N(μ, σ2) si la funció densitat de X és: σ2, X L’esperança i la variància d’una variable aleatòria normal són: Distribució normal estàndard Es diu que una variable aleatòria Z segueix una distribució normal tipificada o estàndard quan Z té distribució normal amb mitjana μ=0 i variància σ2=1. Es denota per Z~N(0,1).
La funció de distribució d’una variable normal tipificada s’expressa com: Observació: En general, la funció de distribució d’una variable X ~ N(μ, σ2) no té una expressió analítica. Es fa servir la transformació a una normal tipificada per calcular les probabilitats del tipus P(a<X<b) a partir de les taules disponibles per a la distribució normal tipificada.
ÚS DE LES PROPIETATS DE LA DISTRIBUCIÓ NORMAL CÀLCUL DE PROBABILITATS D’UNA DISTRIBUCIÓ NORMAL N(μ, σ2) MITJANÇANT TAULES Una variable aleatòria X amb distribució normal de paràmetres μ i σ2 es pot transformar en una variable normal tipificada a través del següent procediment d’estandardització o tipificació: Aleshores, si busquem P(a ≤ X ≤ b) tindrem que FUNCIÓ DE DENSITAT CONJUNTA FUNCIÓ DE DISTRIBUCIÓ CONJUNTA ...