Estadística I - Tema 2 - Anàlisis Descriptiva de les Dades (2011)

Apunte Catalán
Universidad Universidad Rovira y Virgili (URV)
Grado Administración y Dirección de Empresas + Finanzas y Contabilidad - 1º curso
Asignatura Estadística 1
Año del apunte 2011
Páginas 18
Fecha de subida 29/05/2016
Descargas 1

Descripción

Apuntes de TEMA 2 -- ANÀLISI DESCRIPTIVA DE LES DADES con gràficos y esquemas y explicaciones de las funciones.
2.1. DISTRIBUCIÓ DE FREQÜÈNCIES D'UNA VARIABLE
2.2. REDACCIÓ DE LES DADES. AGRUPACIÓ EN INTERVALS.
2.4. PARÀMETRES POBLACIONS. MESURES I ESTADÍSTICS MOSTRATS
2.5. MESURES I ESTADÍSTICS DE POSICIÓ: MESURES DE TENDÈNCIA CENTRAL

Vista previa del texto

Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei ESTADÍSTICA I 2010-09-14 TEMA 2 -- ANÀLISI DESCRIPTIVA DE LES DADES 2 2 1 2 3 4 1 X = nombre ocupants del cotxe N = 10 (nombre total del cotxe disponible) K = 5 (valors diferents: 1, 2, 3, 4, 5) QUANTITATIVA DISCRETA 2.1. DISTRIBUCIÓ DE FREQÜÈNCIES D'UNA VARIABLE 2.1.1. FREQ. ABSOLUTA (ni) X1 X2 X3 X4 Xk(5) X 1 2 3 4 5 n1 n2 n3 n4 nk ni 2 4 1 2 1 10 Propietat: k n  N  n  n i 1 2  ...  nk i 1 2.1.2. FREQÜÈNCIA RELATIVA (fi) X1 X2 X3 X4 Xk(5) fi  ni (x100) --> N X 1 2 3 4 5 ni 2 4 1 2 1 10 n1 n2 n3 n4 nk k  f  1( x100) i i 1 1 Fi (%) 20 40 10 20 10 100 4 2 5 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei 2.1.3. FREQ. ABSOLUTA ACUMULADA (Ni) X1 X2 X3 X4 Xk(5) X 1 2 3 4 5 ni 2 4 1 2 1 10 n1 n2 n3 n4 nk Fi (%) 20 40 10 20 10 100 Ni 2 6 7 9 10 j Nj   ni , on j = un valor determinat com 3 (X3) i 1 Propietat: Nk  N 2.1.4. FREQ. RELATIVA ACUMULADA (Fi) X1 X2 X3 X4 Xk(5) X 1 2 3 4 5 n1 n2 n3 n4 nk ni 2 4 1 2 1 10 Fi (%) 20 40 10 20 10 100 Ni 2 6 7 9 10 Fi (%) 20 60 70 90 100 j Ni Fi  (x100) ó Fj   fi N i 1 Propietat: Fk = 1 (x100) media.de.
x x1n1 x = 2,6 2.2. REDACCIÓ DE LES DADES. AGRUPACIÓ EN INTERVALS.
1,54 1,83 1,72 1,71 1,64 1,77 1,74 X = alçada en metre N = 10 QUANTITATIVA CONTÍNUA 2 1,65 1,59 1,89 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei Podem agruparse en 4 intervals: Li-1 Li ni Ni Fi (%) Fi (%) (1.50 - 1.60] 2 2 20 20 1.60 - 1.70 2 4 20 40 1.70 - 1.80 4 8 40 80 1.80 - 1.90 2 10 20 100 10 100 Li-1: límit inferior interval Li : límit superior interval ai : amplitud, también se representa como Ci Di : densitat, di  ni ai , dfi  ai 0.10 0.10 0.10 0.10 di 20 20 40 20 dfi 200 200 4000 200 fi ai Podemos trobar la mitjana amb la taula i amb les dades concretes, Amb la taula: Xi ni Xini 1.55 2 3.1 1.65 2 3.3 1.75 4 7 1.85 2 3.7 17.1 mitjX = 1.71 Amb les dades concretes: mitj X = 1.708 , i aquest resultat és més exacta.
X xf f i i i 2010-09-21 2.4. PARÀMETRES POBLACIONS. MESURES I ESTADÍSTICS MOSTRATS El que interessa per l'estadística és la població. Agafa una mostra i a partir d'aquesta data fem els càlculs i trobarem la conclusió, això és el que fem ara.
Estadístics mostrats volen dir les funcions matemàtiques, el resultat que depende del mostra.
3 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei 2.5. MESURES I ESTADÍSTICS DE POSICIÓ: MESURES DE TENDÈNCIA CENTRAL  Mitjana (variables quantitatives, 1+1=2)  Aritmètrica  Geomètrica  Harmònica   Mediana (variables categòriques ordinals + quantitatives) Moda (v.c.nominal (atributs) + altres) El centre es varia depende la pregunta, quin tipus de variable, etc.
4 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei MITJANA ARITMÈTICA k X  xi * ni i 1 k  ni k   xi * ni i 1 N i 1 k x i  fi * i 1 k f i i 1 Propietatas matemàtiques de la mitjana aritmètica:  La suma de les desviacions respecte a la mitjana aritmètica és igual a 0.
N  ( x  mitjX )  0 1 i 1 xi ni xini Xi-mitj.x (xi-mitj.x)ni 1 4 4 1-1.8 = -0.8 -3.2 2 4 8 2-1.8 = 0.2 0.8 3 2 6 3-1.8 = 1.2 2.4 10 18 0 X =1.8   La suma dels quadrats de les desviacions respecte a una constant, b, és minimitza quan aquest constant és igual a la mitjana aritmètica.
xi ni xini Xi-mitj.x (Xi-mitj.x)2 (Xi-mitj.x)2*ni 1 4 4 1-1.8 = -0.8 0.64 2.56 2 4 8 2-1.8 = 0.2 0.04 0.16 3 2 6 3-1.8 = 1.2 1.44 2.88 10 18 5.6 La mitj.arit. queda afectada pels canvis d'origen.
Canvi d'origen: suma / rsta a una variable. xi  X  k    yi  xi  k  y  x  k  La mitj.arit. queda afectada pels canvis d'escala.
xi  x  k    yi  k * xi  y  k * x 5 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei  Si d'un conjunt es fa una partició de dos o més subconjunts disjunts, la mitj.arit.global (de tot el conjunt) és igual a la mitjana ponderada de les mitjanes del subconjunt prenent com a factor de ponderació el nombre d'elements de cada subconjunt.
Dones 30 X dones = 1.69 Homes 20 X homes = 1.80 X classe = 1.69 * 30  1.80 * 20  1.734m , que seria una mitjana de la mitjana.
50 MITJANA ARITMÈTRICA PONDERADA (wi) A B C 50% 30% 20% xi 6 4 8 k xw i X p= i 1 k w i i  58  5.8 10 i 1 Propietats:  La resposta és l'única.
 Sempre es pot calcular.
 Els valors exterms són molt sensible.
 Sempre intenta utilitzar totes les seves informacions.
MITJANA GEOMÈTRICA (G) La mitj.geo.és l'arrel anèssima del producte d'observació.
6 wi 5 3 2 10 xiwi 30 12 16 58 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei Em diu l'anunciat que: P1  P0 * (1  0.15) P 2  P1 * (1  0.10)  P0 * (1  0.15) *1.1  P0(1  r )(1  r ) (1  r ) * (1  r ) * P 0  P 0 *1.15 *1.11 (1  r )(1  r )  1.15 *1.11 1  r  1.15 *1.11 r  0.1298 k  G   ( producte) xi ni N i 1 2010-09-28 Característiques  La solució és l'única  S'utilitza tots els valors de l'observació  És menys sensible que aritmètica Inconvenients Quan un valor x=0, ja no es pot fer el càlcul.
Propietat N  ( x ) i G  i 1 N MITJANA HARMÒNICA (H) La mitjana harmònica de n observacions és la inversa de la mitjana aritmètica dels inversos dels valors de la variable.
H BCN -- TRGN TRGN -- BCN N k ni  i 1 xi DIST. (Km)(ni) 100 100 200 V (Km/h) (xi) 100 80 7 Temps (h) 1 1.25 2.25 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei mitj .V  total .dist ( Km) 200   88.89km / h total .temps (h) 2.25 Característiques:  La solució és l'única i s'utilitza tots els valors del seu poble.
Inconvenients:  No sempre té la resposta (en el cas que x=0)  Quan x  0, la mitjana harmònica és molt sensible Les tres mitjanes són quantitatives: X G H MEDIANA (Me) La mediana és el valor que fa mínima la suma dels desviacions absolutes respecte una ocnstant b. La suma de les desviacions absolutes es fa mínima que b fa mediana.
Nº imparell: Me  xi xi Nº parell: Me    N 2 N 1 2  xi  1 2 TAULA FREQ. AMB INTERVALS 1) Busca interval media 1.1. troben Ni o Fi 1.2. Busca N ( La primera que ho complexi) 2 Fi  50% ( La primera que ho complexi) Ni  Us queden amb interval d'aquesta fila 2) Assigna valor interval N  Ni  1 50  Fi  1 2 Me  Li  1  * ai /////// Me  Li  1  * ai n fi 8 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei Característiques: - categòriques quantitatives / ordenades - no és sensible - es basa en ordre Inconvenients: - no inclou totes les info.
Propietat: N  Xi  Me i 1 TAULA FREQ. SENSE INTERVALS 1) Busca Ni ( o Fi) N 2) Busca ----> 2 / Fi  50(0.5) Ni  - No troben Ni  Ni  - Trobem  Me  N N , molt bé. Me = xi corresponent a la 1a fila Ni  2 2 N 2 , Xi de la fila Ni  N 2 i X i+1 de la fila següent: xi  xi  1 2 Exercici 1: 5 10 3 5 2 8 1r: ordenar els números: 2 3 5 5 8 10 2n: saber el tipus: NºPARELL  Me  xi  N 1 2 9  55 5 2 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei Exercici 2 Xi 1 5 8 12 15 ni 2 1 3 3 1 Ni 2 3 6 9 10 Troba Ni Busca N N 10 aNi   5  busquem la 1a fila amb valor Ni  que és la fila següent  2 2 2 Me = 8 Exercici 3 xi 1 5 8 12 15 ni 2 1 2 3 2 Ni 2 3 5 8 10 N 10 8  12   5  Me   10 2 2 2 MODA (Mo) La moda és el valor x més frequent.
1) construir taula freq.
2) Busca valor(s) Xi corresponent(s) f la major ni o fi (lo que repeteix més vegades) Xi -3 0 9 10 ni 2 6 20 18 Xi -2 8 12 15 ni 14 2 14 10 Taula freq. Interval A) busca interval(s) modal(s). (s'interessa més quan només tingui una moda que hi ha moltes.) Major di 10 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei B) Assignar valors moda (no entra examen) Mo  Li  1  di  1 ai di  1  di  1 Característiques_: - dona una posició del centre Inconvenients: - la solució pot ser més d'una MESURES DE CONCENTRACIÓ Índex de Gini  un Nº que representa el nivell de riquesa.
Corba de Lorenz.
golapes persones accumulades % (Pi) riquesa % riquesa accumulada % (qi) Pi-qi 25M 25A 25N 25A 25 50 75 100 9 16 25 50 9 25 50 100 16 25 25 0 Qi= % riquesa accumulada comencat pels + pobres Pi= % individus accumulats de - a + rics 11 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei Àrea més petit  - concentració Àrea més gran  + concentració IG  n 1 IG   ( Pi  qi) i 1 n 1  Pi n 1  1 i 1 Li-1 Li 1000 2000 4000 5000 10000 2000 4000 5000 10000 20000 IG  ni(perso nes) 12000 6000 1000 800 200 20000 16  25  25 9  25  50  0.44  1   0.44 25  50  75 25  50  75  qi i 1 n 1  Pi ,0  IG  1 i 1 fi % Fi = Pi % xi (marque s de classes) 60 30 5 4 1 60 90 95 99 100 1500 3000 4500 7500 15000 riquesa (ni*xi) %riques a 18000000 18000000 4500000 6000000 3000000 49500000 36.36 36.36 9.09 12.12 6.06 100 % riquesa accumulad a (qi) 36.36 72.73 81.82 93.94 100 23.6  17.2  13.1  5 58.9 36.4  72.8  81.9  94  100   1  0.13 60  90  95  99  100 444 60  90  95  99  100 12 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei Xi (pib/cap) ni(habitante) BCN 17053.19 4706325 girona 16523.06 533348 lleida 15737.96 359361 tarragona 18082.81 588499 1) 2) 3) Qi pib total 80.258 x10 9 8.8125 x10 9 5.6556 x10 9 10.6417 x10 9 Ordena per variable / interés Pi a pobre hab / %habitants / %habitants (accumulada  Pi) Qi a partir de la riquesa total (pib/cap habitants en %, accumulada  Qi) 1) lleida Xi (pib/cap) ni(habitant e) qi pib total 15737.96 359361 5.6556 Fi = Pi x109 BCN 17053.19 4706325 80.258 x109 girona 16523.06 533348 8.8125 x109 BCN 17053.19 4706325 80.258 x109 tarragona 18082.81 588499 10.6417 x109 IG=0.01077 13 Riquesa total Riquesa total en % (qi) fi Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei MESURES DE POSICIÓ  Centrals QUANTILS  PERCENTILS (CENTILS)  QUANTILS: 3 mesures Els quantils són k mesures que divideixen les observacions ORDENADES en r parts iguals (de mateix nº  Qk d'observació.
r Ejemplos amb taula freqüents: xi ni Ni 1 2 2 2 3 5 3 4 9 4 5 14 8 6 20 1) ORDENAR DADES 2) CONSTRUIR Ni / Fi 3) CALCULAR 4) TROBAR k * N (*100) desitjat r Ni  k , *N r - mitjana d'aquesta fila i la seguent 3 quantils - no troba: Ni   Q1  20 * 1  2.5 , 4 4 k N  , per la 1a fila valor que r Ni  k N r com que no en trobo directament, agafo el valor d'aquesta fila que compleixi 2.5 (2.3) i faig la mitjana d'aquests dos valors: x  23  2.5 2  Q2  20 * 0.5  10, Q2  4 (el trobo directament) 4 4  Q3  20 * 0.75  15, Q2  8 4 4 1) localitza intervals que conte Qk  r Ejemplos con tabla interval: Li-1 L ni Ni 0 2 5 5 2 4 3 8 4 6 1 9 6 8 3 12 compleixi k N  Ni r k N , busquem la 1a fila que r k N  N i 1 Qk  Li  1  r ai r ni 2) Assigna valors de l'interval PS: Ni 1  Ni  1 , una és el Nº de N de la fila anterios anterior, i altre és Nºd'aquesta fila - 1!!! 14 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei 30 * 2  1.2 4 4 5 65 Q2  12 * 2 / 4  6,  Q2  2  * 2  2.3 4 4 3 98 Q3  12 * 3 / 4  9,  Q 1  4  *2  6 4 4 1 Q 1  12 *1 / 4  3,  Q 1  0  CARACTERÍSTIQUES: 1) es basa en l'ordre 2) Són únics 3) No estan afectatas per valors extremes  No centrlas DISPERSIÓ  Absolutes (unitat mesura)  Rang / recorregut Es la diferència entre el valor màx de x i el valor mínim de x.
R  X max  X min  Rang / recorregut interquartíl·lic RI  Q3  Q1 4 4  Desviació absoluta mitjana k XN  X    N  DAM , o sigui, DAM   Xi  X ni i 1 N  Variancia Mitjana aritmètica de les desviacions respecte a la mitjana aritmetica al quadrat.
 x1  x  ni k X N X   2   N , k 2 i 1 N  S 2 /  2 / m 2 / varx   x ni 2 i i 1 N Problema: unitat de mesura. La variancia té les unitats de mesures quadrades.
Característiques: - no pot ser negatiu Quantitativa 15 X Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei Propietats 1) S  0 2 2) Mesura quadrètica de dispersió òptim  x ni  x * 2 3) S  m  a  a 2 2 2 2 1 2 N 4) Canvi d'origen : no sensible 5) Canvi escalar: sí sensible X  S X2 Y  KX  SY2  K 2 S X2  Desviació estàndard / desviació típica  S 2 Propietat: tenen les mateixes propietats excepte el punt 5 d'anterior, ja que X  SX Y  KX  SY2  K 2 S X2  SY  KY2 S X2  KS X  Relatives (no um) X max X min R  Rang/recorregut relatiu X  Coeficient apertura  Rang / recorregut interquartil·lic relatiu  Coeficient de variació de Pearson RI Me DE X 16 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei MESURES DE FORMA  Asimetria També podria dir : positiva  dreta, negativa  esquerra Coeficient asimetria de fisher k g1   (x i 1 1  x)3 ni S3 m3  3 s (  Teresa) (  internet) Según sea el valor de g1, diremos que la distribución es asimétrica a derechas o positiva, a izquierdas o negativa, o simétrica, o sea: Si g1 > 0, la distribución será asimétrica positiva o a derechas (desplazada hacia la derecha).
Si g1 < 0, la distribución será asimétrica negativa o a izquierdas (desplazada hacia la izquierda).
Si g1 = 0, la distribución puede ser simétrica; si la distribución es simétrica, entonces si podremos afirmar que g1 = 0.
17 Si necesitas más apuntes relacionados de ADE y/o Finanzas & Contabilidad puedes encontrarlos en Unybook.com buscando el usuario ypei  Curtosi o apontament g2  0 g2  0 g2  0 Coeficient curtosi de Fisher k g2   (x i 1 1  x) 4 ni S4 18 3 ...