Exercici individual 3 (2014)

Apunte Catalán
Universidad Universidad Pompeu Fabra (UPF)
Grado Criminología y Políticas Públicas de Prevención - 2º curso
Asignatura Estadística Descriptiva
Profesor T.V.
Año del apunte 2014
Páginas 5
Fecha de subida 31/03/2015
Descargas 6
Subido por

Vista previa del texto

Anàlisi de Dades Criminològiques Grau en Criminologia i Polítiques Públiques de Prevenció EXERCICI 3. CORRELACIÓ I REGRESSIÓ S’han recollit dades en 31 districtes sobre la taxa de delictes per cada 1000 habitants (variable dependent) i el temps de resposta de la policia (és a dir, per arribar al lloc) en minuts a una trucada demanant ajuda (variable independent). Sabent que la mitjana de la taxa de delictes és de 52,8 (amb una desviació típica de 17,33) i del temps de resposta és de 7,72 (amb una desviació típica de 3,73) i que el coeficient de correlació val 0,698: 1. Formula la hipòtesi nul·la i la hipòtesi alternativa (0,5 punts).
Com que el coeficient de correlació és de 0,698 podem dir que es tracta d’una relació moderada ja que es troba entre ±0,30 a ± 0,70. Com que la relació és moderada les variables estan relacionades i aleshores afirmem la hipòtesis alternativa.
La hipòtesis seria nul·la en el cas de que el temps de resposta i la taxa de delictes no tinguessin cap relació.
2. Identifica la recta de regressió (2 punts).
Per identificar la recta hem d’usar la fórmula: Aleshores, hem d’identificar la b de la funció mitjançant aquesta altra fórmula: b S YX Sx 2 Per saber quin és el coeficient de covariació (Syx) utilitzem una altre fórmula: r cov YX S  YX desv.típ x desv.típ Y S X S Y Tenint en compte que tenim r, que és el coeficient de correlació, i les dues desviacions típiques, substituïm en la fórmula anterior: Ara hem de calcular la variància de x: Variància Es calcula fent la mitjana de x al quadrat.
Sx2 3,732 = 13,91 Per tant, si els valors resultants els substituïm en la fórmula de b: b cov YX 45,12   3,24 13,91 Sx 2 Ara doncs, ja podem obtenir el valor d’a.
1 Anàlisi de Dades Criminològiques Grau en Criminologia i Polítiques Públiques de Prevenció Per obtenir A hem de seguir la fórmula Ȳ = a + b x Ȳ= 52,8 b= 3,24 x = 7,72 3. Interpreta el valor de la b obtingut. (0,5 punts) La b ens indica la pendent de la funció. Per tant, per cada unitat que canvia “x”, “y” augmenta en 3,24 unitats. Com que b és 3,24 podem concloure que tenim una relació lineal positiva.
4. Calcula el coeficient de determinació i interpreta’l. (0,5 punts) El coeficient de determinació és el coeficient de correlació al quadrat.
Coeficient de correlació (r) 0,698 Per tant, Per a interpretar el coeficient de determinació l’hem de multiplicar per 100, aleshores el resultat és del 49%. És a dir, un 49% de cada cas queda explicat per la variable x.
5. Què ens indica el coeficient de correlació sobre la relació entre les dues variables? (0,5 punts).
El coeficient de correlació ens indica la força de la relació lineal entre la variable x i y. En aquest cas la relació és moderada ja que 0,698 es troba entre el valor ±0,30 a ± 0,70.
6. Dibuixa la recta de regressió que has trobat en el següent gràfic de dispersió i detecta, en cas que n’hi hagi, algun cas atípic. Justifica per què creus que és atípic. (1 punt) Tot i que no podem dibuixar la recta de regressió de manera exacta perquè es tracta d’una imatge, el cas més clar d’outlier el trobem en 15 minuts per una taxa de delictes de 30 per cada 1000 habitants.
I també trobem uns 5 casos més, amb un menor temps de resposta d’entre 5 i 7 minuts i una taxa de delictes entre el 60 i el 65 per cada 1000 habitants, aquests serien casos atípics però més moderats. També podríem considerar els 3 casos que es troben entre els 4 minuts amb una taxa de delictes d’entre 20-30 per cada 1000 habitants.
Són casos atípics (=outliers) perquè són casos extrems que no s’expliquen com la resta de variables, a vegades això es pot donar per pur atzar.
2 Anàlisi de Dades Criminològiques Grau en Criminologia i Polítiques Públiques de Prevenció 7. Si en un districte el temps de resposta de la policia fos de 11 minuts, quina taxa de delictes pots preveure que tindria? I si fos de 23 minuts? (1 punt) Si el temps de resposta fos d’11 minuts: Si el temps de resposta fos de 23 minuts: 8. En una altra ciutat, les dades són les següents. Calcula la pendent de la regressió i l’intercepte i interpreta el resultat: (3 punts) Taxa de delictes Temps de resposta 50 44 42 80 95 55 57 72 43 70 10 8 6 25 30 12 16 22 9 26 Per calcular la recta de regressió utilitzarem la fórmula Primer, hem de trobar B (pendent) amb la fórmula: b  S YX Sx 2 Per tant, primer buscarem el coeficient de covariació (Syx) amb la següent fórmula: n Sxy  Taxa de delictes 50 44 42 80 95 55 57 72 43 70 Mitjana: 60,8  ( x  x )( y i 1 i j  y) n Temps de resposta 10 8 6 25 30 12 16 22 9 26 16,4 3 (Y-Ȳ) -10,8 -16,8 -18,8 19,2 34,2 -5,8 -3,8 11,2 -17,8 9,2 (x- ) -6,4 -8,4 -10,4 8,6 13,6 -4,4 -0,4 5,6 -7,4 9,6 Anàlisi de Dades Criminològiques Grau en Criminologia i Polítiques Públiques de Prevenció Per obtenir el coeficient de covariació hem de multiplicar la columna de (Y-Ȳ)* (x- ) i dividir-la entre el número de casos totals, que en aquest cas són 10.
(Y-Ȳ) -10,8 -16,8 -18,8 19,2 34,2 -5,8 -3,8 11,2 -17,8 9,2 (x- ) -6,4 -8,4 -10,4 8,6 13,6 -4,4 -0,4 5,6 -7,4 9,6 (Y-Ȳ)*(x- ) 69,12 141,12 195,52 165,12 465,12 25,52 1,52 62,72 131,72 88,32 1345,8/10= 134,58 El coeficient de covariació és igual a 134,58.
El següent pas es trobar Sx2 per això hem de trobar la desviació típica i la variància.
La desviació típica es calcula sumant tots els números resultants de la columna (x- )2 i dividintlos entre els números de casos que hi ha menys 1 perquè es tracta d’una mostra. Per calcular la variància només hem d’elevar al quadrat la desviació típica. Només ens fixarem en la columna de la x ja que el que volem esbrinar és Sx2.
Temps de resposta (x- ) (x- )^2 10 8 6 25 30 12 16 22 9 26 -6,4 -8,4 -10,4 8,6 13,6 -4,4 -0,4 5,6 -7,4 9,6 40,96 70,56 108,16 73,96 184,96 19,36 0,16 31,36 54,76 92,16 8,67 75,17 Així doncs, ja podem saber quant és b: b Desviació típica Variancia S YX Sx 2 4 Anàlisi de Dades Criminològiques Grau en Criminologia i Polítiques Públiques de Prevenció Aleshores, per trobar l’a usem la fórmula: Y = 60,8 b = 1,79 x= 16,4 Concloem que la recta de regressió és: Y= 31,43 + 1,79* 16,4. És a dir, l’intercepta és de -31,43 i té una pendent positiva d’1,79. Això vol dir que per cada augment d’un minut en el temps de resposta de policia, augmentarà en un 1,79 la taxa de delictes per cada 1000 habitants.
9. En quin dels dos casos la relació és més forta? (0,5 punts) Abans d’extreure conclusions hem de fer el càlcul de la correlació del segon cas. Es calcula fent: (Y-Ȳ)2 116,64 282,24 353,44 368,64 1169,64 33,64 14,44 125,44 316,84 84,64 17,84 (x- )2 40,96 70,56 108,16 73,96 184,96 19,36 0,16 31,36 54,76 92,16 8,67 Desviació típica Per tant, la correlació és de: Aleshores, la correlació del primer exercici és de 0,698 i del segon és de 0,87.
En el primer cas tenim una correlació moderada ja que el 0,698 es troba entre ±0,30 a ± 0,70, moderada i en el segon, la relació és alta perquè es troba entre ±0,70 a ±1.
Per tant, en el segon cas la relació és més forta.
10. Globalment, quina recomanació es pot fer a la policia a partir de les dades analitzades? (0,5 punts) Com que la relació entre les variables és moderada i forta, podríem dir que es tracta d’una relació bastant rellevant. En ambdós casos, el temps de resposta junt amb la taxa de delictes estan efectivament relacionats. Aleshores, recomanaríem a la policia que intentes reduir el temps de resposta el màxim possible, ja que s’ha demostrat que com més temps tardin en contestar més alta serà la taxa de delictes.
5 ...