1. Estadística Descriptiva (2014)

Apunte Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Gestión Aeronáutica - 1º curso
Asignatura Estadística
Año del apunte 2014
Páginas 7
Fecha de subida 14/11/2014
Descargas 7
Subido por

Descripción

Estadística descriptiva: Variables qualitatives i quantitatives. Mitjana, Desviació, Diagrama de Barres, Histograma. Taules de freqüència i contingència. Regressió lineal: Recta de regressió, coeficient de correlació i coeficient de determinació.

Vista previa del texto

1 TEMA 1: ESTADÍSTICA DESCRIPTIVA 1.1. ESTUDI DESCRIPTIU D ’UNA VARIABLE: Població: Conjunt de totes les observacions o individus possibles.
Mostra: Part de la població (fraccionària) que s’estudia de manera efectiva.
Mostra  X  Resultats de la observació X Variable: 1) Qualitativa 2) Quantitativa 1) Variable qualitativa:    *X=variable estadística Discretes (contar) Continues (mesurar) Són les que NO són expressables numèricament de manera natural.
exemple: cara 1 i cara 2 d’una moneda Representació gràfica: Diagrama de sectors Mesura descriptiva: Proporció 2) Variable quantitativa: Resultats numèrics: X1, X2, X3, ... , Xk N = Mida de la mostra k<N ni = Nombre de vegades que s’observa el resultat Xi = freqüència absoluta fi = = freqüència relativa  Propietats: a) 0 ≤ n i ≤ N , 0 ≤ fi ≤ 1 b) ∑ =N ∑ =1 2  Taula de freqüències: (Resultats – Freq. Absoluta – Freq. Relativa) Resultats X1 X2 X3 ...
Xk  Diagrama de barres: ni ni ni ni ...
nk N fi fi fi fi ...
fk 1 Agrupem les dades en intervals o classes.
Es considera el rang dels valors observats.
*rang= Màxim – mínim Construcció del diagrama de barres: 1) Escollim intervals (o classes) de la mateixa amplitud, i consecutius.
[a1, a2), [a2, a3), [a3, a4) ... [al, al+1) al+1 - al = k (constant) [al, al+1) inclou [mín, Màx] l = nombre d’intervals estigui entre 6 i 15.
3 2) Construïm rectangles sobre cadascun dels intervals amb alçada proporcional a la freqüència.
3) Determinem les marques de classe: m= Totes les dades de l’interval es tracten com si el valor fos mi.
Exemple: Intervals A 18-20 B 20-22 C 22-24 D 24-26 E 26-28 F 28-30 G 30-32 Núm. de dades fi 3 0,11 3 0,11 2 0,07 7 0,32 4 0,14 6 0,21 3 0,11 N 1,0 Dades: 18, 19, 19, 20, 20, 21, 22, 23, 24, 24, 24, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 29, 29, 29, 29, 30, 30, 31.
3) Paràmetres de centralització:   Mitjana: m= ̅= ∑ · =∑ · Mediana: Si Y1 ≤ Y2 ≤ Y3 ... Yn són els valors de les N observacions.
exemple: Mediana = Me = a) 1 3 3 6 9 8 7  Me = 6 b) 2 3 3 5 7 9  Me = 4 Me =  Yp+1  N=2p+1  N=2p Moda: Valor o valors més freqüents  promig 4 4) Mesures de dispersió:     Variància: Variància = ∑( Desviació típica: ̃=√ ̃ − ̅) Variància corregida: ∑( − ) = = ̃ = Desviació típica corregida: =√ ̃ 5) Rang: Màx – mín 6) Altres mesures:  Coeficient de variació de Pearson: CV = | | 7) Quartils: 25% 25% 25% 25% 50% 50% Me 8) Diagrama de caixa: (box-plot) Calculem Q1, Q2 = Me, Q3 Rang Interquartílic = RI = Q3 – Q1 1,5 RI 1,5 RI  Outliers o valors anòmals 5 1.2. ESTUDI SIMULTANI DE DUES VARIABLES X I Y : X i Y són quantitatives (numèriques): Regressió Exemple: pes i alçada.
X i Y són qualitatives: Tests χ2 (Chi-quadrat) Exemple: color dels ulls i color dels cabells.
X és qualitativa & Y és quantitativa: ANOVA Exemple: Emissions de CO2 Estudi descriptiu de 2 variables: - En una mostra de mida N fem 2 observacions diferents en cada individu (o esdeveniment).
Les dues variables X i Y són qualitatives (o categòriques).
X1, X2, ..., Xn i Y1, Y2, ..., Yc  els resultats (no numèrics) corresponents a X, Y.
nij = Freqüència absoluta d’individus que corresponen Xi, Yj (X = Xi, Y = Yj) ni = ∑ , Taula de contingència: X/Y X1 X2 ...
Xk Exemple: nj = ∑ Y1 n11 n21 ...
nk1 n·1 = Freqüències marginals Y2 n12 n22 ...
nk2 n·2 Yl n1l n2l ...
nk3 n·l n1· n2· ...
nk· N N = 92 Homes  57 Dones  35 Nivell baix: 10 Nivell mitjà: 61 Nivell alt: 21 Homes Dones Total Baix 7 3 10 Mitjà 38 23 61 Alt 12 9 21 Total 57 35 92 6 Dues variables quantitatives (Regressiu lineal): 1) Relació lineal: Y = a + bx (+error) Coeficient lineal o teòric Si (X1, X2), (X2, Y2), ..., (Xn, Yn) són els valors obtinguts respecte les variables x (alçada) i y (pes), la seva representació en el pla OXY ens dóna un gràfic de dispersió (o núvol de punts) 2) Regressió lineal simple: Determinar la recta que millor aproxima als punts (X1, X2), (X2, Y2), ..., (Xn, Yn) en el sentit que SQ = ∑( − ) sigui mínima.
on = a + bx (valor de Y predit pel model) b = pendent de la recta = a= ∑( ∑( )( ) ) - b ̅ [( ̅ , ) és un punt de la recta] Sxy = Covariancia corregida = ∑( = = ∑ ∑ − )( − ) ̅ ̅ 7 Coeficient de Correlació (de Pearson): r. = = ∑ ∑ ̅ ∑ ̅ Sx & Sy = Desviació típica de x o y respectivament.
PROPIETATS: a) -1 ≤ r ≤ 1 b) r = b  r té el mateix signe que b.
Si r > 0 la relació és directe: b > 0 r>0 Si r < 0 la relació és inversa: b < 0 r < 0 c) r2 = coeficient de determinació, 0 ≤ r2 ≤ 1 correspon a la proporció de variabilitat de Y determinada per la variabilitat de X.
d) Si r ≈ 0 (  b≈0) Si |r| ≈ 1 la relació lineal és molt forta.
Si |r| ≥ 0,7  r2 ≥ 0,5 Si |r| < 5  r2 < 0,25 ...