Test en Clase 3 tarda (2013)

Examen Catalán
Universidad Universidad Pompeu Fabra (UPF)
Grado Economía - 1º curso
Asignatura Analisi de dades
Año del apunte 2013
Páginas 48
Fecha de subida 06/10/2014
Descargas 3
Subido por

Descripción

Exámenes parciales. Los Parciales no varían de un año a otro, sólo cambian permuta. Están con las soluciones

Vista previa del texto

Respostes a l’examen Universitat Pompeu Fabra ´ Permutaci´o Numero: 1 Usa sols llapis, bol´ıgraf o retolador negre i omple b´e les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix´ı com el grup.
´ i el GRUP.
Omple (marcant les caselles de la plantilla) el DNI, la PERMUTACIO DNI: el teu n´umero de document d’identitat (si no tens, el n´umero que et van assignar en el moment de matricularte).
PERMUT.: Entra un 1 GRUP: Posa el n´umero de grup (amb un 0 endavant) Entra la respostes en les l´ınies de baix, de la 1 a la 12. Cada resposta disposa de dues l´ınies, la primera e´ s per la resposta correcta i la segona per anul·lar en cas d’equivocaci´o: Test en classe 3 Exercici 1: Puntualitat de dues companyes a`eres Tenim dades dels vols puntuals i impuntuals de les companyies a`eries Ib`eria i Air France, amb les dades totals (Taula 1) i despr´es per Barajas (Taula2) i per Orly (Taula 3): Taula 2 Total Puntual Amb retard Ib`eria 620 46 Air France 1000 172 Puntual Amb retard (Barajas) Ib`eria 600 40 Taula 3 Air France 50 2 Puntual Amb retard (Orly) Ib`eria 20 6 Air France 950 170 En base a aquesta informaci´o contesta les preguntes seg¨uents: Pregunta 1: Les freq¨ue` ncies relatives de la distributi´o de puntualitat condicionals a la companya a`eria a la taula 1 (arrodonides a 1 decimal) s´on: (A) Per a Ib`eria vols puntuals = 73,1% i amb retard=26,9%, mentre que per a Air France vols puntuals 65,3% i amb retard = 34,7%.
(B) Per a Ib`eria vols puntuals = 33,7% i amb retard=2,5%, mentre que per a Air France vols puntuals 54,4% i amb retard = 9,4%.
(C) Per a Ib`eria vols puntuals = 93,1% i amb retard=6,9%, mentre que per a Air France vols puntuals 85,3% i amb retard = 14,7%.
(D) Per a Ib`eria vols puntuals = 83,1% i amb retard=16,9%, mentre que per a Air France vols puntuals 75,3% i amb retard = 24,7%.
(E) Cap d’aquestes opcions e´ s correcta Resposta: S’ha de calcular el percentatge de vols puntuals i amb retard dins del total de vols d’Ib`eria, i fer el mateix dins del total de vols d’Air France. Es pot veure que Air France t´e un percentatge m´es alt de vols impuntuals.
Pregunta 2: En la taula conjunta (Taula 1) es pot apreciar que (A) (B) (C) (D) (E) no sembla haver-hi relaci´o entre les variables hi ha associaci´o negativa entre les variables sembla haver-hi relaci´o entre les variables, Ib`eria t´e un percentatge m´es alt de vols puntuals.
hi ha associaci´o positiva entre les variables Cap d’aquestes opcions e´ s correcta Resposta: De les distribucions condicionals hav´ıem concl`os que un percentatge m´es gran de vols puntuals era d’Ib`eria.
Pregunta 3: En la taula de Barajas (Taula 2) es pot apreciar que: (A) (B) (C) (D) (E) hi ha associaci´o negativa entre les variables no sembla haver-hi relaci´o entre les variables sembla haver-hi relaci´o entre les variables, Air France e´ s una mica m´es puntual sembla haver-hi relaci´o entre les variables, Ib`eria e´ s m´es puntual Cap d’aquestes opcions e´ s correcta Resposta: Si calculem les distribucions condicionals a companyia a`erea, veiem que ara Air France e´ s m´es puntual.
Pregunta 4: En la taula d’Orly (Taula 3) es pot apreciar que: (A) (B) (C) (D) (E) sembla haver-hi relaci´o entre les variables, Ib`eria e´ s m´es puntual sembla haver-hi relaci´o entre les variables, Air France e´ s m´es puntual no sembla haver-hi relaci´o entre les variables hi ha associaci´o negativa entre les variables Cap d’aquestes opcions e´ s correcta Resposta: Si calculem les distribucions condicionals a companyia a`erea, veiem que ara Air France e´ s m´es puntual.
Pregunta 5: La relaci´o real que hi entre les variables en aquest cas e´ s: (A) (B) (C) (D) (E) sembla haver-hi relaci´o entre les variables, Air France e´ s m´es puntual no sembla haver-hi relaci´o entre les variables sembla haver-hi relaci´o entre les variables, Ib`eria e´ s m´es puntual hi ha associaci´o negativa entre les variables Cap d’aquestes opcions e´ s correcta Resposta: Tot i que les dades agregades mostren el contrari, les taules per aeroport ens demostren que la relaci´o e´ s que Air France e´ s m´es puntual.
Pregunta 6: En la Taula 1 hi ha una variable latent i e´ s (A) (B) (C) (D) (E) La variable ”Companya A`erea” La variable ”Ib`eria” La variable ”Puntualitat” La variable ”Aeroport” Cap d’aquestes opcions e´ s correcta Resposta: La variable que no es t´e en compte a la Taula 1 e´ s que hi ha dos tipus d’aeroports, i que el percentatge de vols impuntuals e´ s per a totes les companyies m´es alta a Orly.
Exercici 2: Colesterol i l’´us del menjador universitari Es fa un estudi amb 10 professors per saber si hi ha relaci´o entre els dies que s’utilitza el menjador universitari i el nivell de colesterol. Els resultats els podem trobar aqu´ı: En base a aquesta informaci´o contesta les preguntes seg¨uents: Pregunta 7: Cada dinar al menjador incrementa el nivell de colesterol en (arrodonit a dos decimals): (A) (B) (C) (D) (E) 1,73 6,05 7,05 -1,73 Cap d’aquestes opcions e´ s correcta Resposta: Es refereix al pendent, per quant puja la variable dependent quan la variable explicativa puja en una unitat.
Pregunta 8: La mesura de bondat de l’ajust (arrodonida a 2 decimals) e´ s (A) (B) (C) (D) (E) -1,72 0,99 6,04 0,98 Cap d’aquestes opcions e´ s correcta Resposta: Ens pregunten sobre la R2 que e´ s igual a 0,98.
Pregunta 9: La recta de regressi´o prediu que un professor que mengi 15 dies a la cafeteria tindr`a un nivell de colesterol (arrodonit a 2 decimals) igual a: (A) (B) (C) (D) (E) 101,83 78,02 6,05 89,02 Cap d’aquestes opcions e´ s correcta Resposta: Hem de multiplicar 15 pel pendent i sumar-li la constant.
Pregunta 10: La relaci´o ens mostra (A) (B) (C) (D) (E) no hi ha associaci´o entre les variables una associaci´o positiva feble entre les variables una associaci´o negativa molt forta entre les variables una associaci´o positiva molt forta entre les variables Cap d’aquestes opcions e´ s correcta Resposta: Tots els resums num`erics i gr`afics mostren una associaci´o positiva molt forta.
Pregunta 11: Un residu positiu vol dir que (A) (B) (C) (D) (E) el valor real e´ s m´es gran que el valor predit per la recta de regressi´o el valor real e´ s igual al valor predit per la recta de regressi´o el coeficient de correlaci´o e´ s positiu el valor real e´ s m´es petit que el valor predit per la recta de regressi´o Cap d’aquestes opcions e´ s correcta Resposta: El residu e´ s igual al valor real menys el valor predit.
Pregunta 12: Per al cas del professor que dina 14 dies al menjador el valor del residu e´ s (arrodonit a dos decimals): (A) (B) (C) (D) (E) 4,23 -4,23 -7,97 7,97 Cap d’aquestes opcions e´ s correcta Resposta: Ser`a igual al valor real 75 menys el valor predit per a 14, 82,97.
Respostes a l’examen Universitat Pompeu Fabra ´ Permutaci´o Numero: 2 Usa sols llapis, bol´ıgraf o retolador negre i omple b´e les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix´ı com el grup.
´ i el GRUP.
Omple (marcant les caselles de la plantilla) el DNI, la PERMUTACIO DNI: el teu n´umero de document d’identitat (si no tens, el n´umero que et van assignar en el moment de matricularte).
PERMUT.: Entra un 2 GRUP: Posa el n´umero de grup (amb un 0 endavant) Entra la respostes en les l´ınies de baix, de la 1 a la 12. Cada resposta disposa de dues l´ınies, la primera e´ s per la resposta correcta i la segona per anul·lar en cas d’equivocaci´o: Test en classe 3 Exercici 1: Especialitat en Administraci´o i Direcci´o d’Empreses Tenim informaci´o sobre 386 alumnes que han cursat el cicle b`asic d’Administraci´o i Direcci´o d’Empreses i han de triar una especialitat. Aqu´ı presentem el nombre i les proporcions d’alumnes que han escollit cada especialitat, desglossat per sexes: En base a aquesta informaci´o contesta les preguntes seg¨uents: Pregunta 1: Les freq¨ue` ncies relatives de la distribuci´o marginal de les especialitats s´on: (A) (B) (C) (D) (E) Comptabilitat=0,18, Administraci´o=0,24, Economia=0,01 i Finances=0,16 Comptabilitat=124, Administraci´o=131, Economia=11 i Finances=120 Comptabilitat=0,32, Administraci´o=0,34, Economia=0,03 i Finances=0,31 Comptabilitat=0,42, Administraci´o=0,15, Economia=0,02 i Finances=0,15 Cap d’aquestes opcions e´ s correcta Resposta: La distribuci´o marginal les trobem al costat de la taula, i les corresponents a especialitat es calculen mirant el total d’alumnes de cada especialitat sobre el total d’alumnes.
Pregunta 2: Les freq¨ue` ncies relatives de la distribuci´o marginal del sexe e´ s: (A) (B) (C) (D) (E) 0,42 per a homes i 0,58 per a dones 0,10 per a homes i 0,24 per a dones 0,15 per a homes i 0,18 per a dones 0,02 per a homes i 0,01 per a dones Cap d’aquestes opcions e´ s correcta Resposta: Les freq¨ue` ncies relatives al sexe les podem trobar al marge de la taula i es calculen com la proporci´o d’homes sobre el total d’alumnes i la proporci´o de dones sobre el total d’alumnes.
Pregunta 3: La distribuci´o de les especialitats condicional a qu`e el sexe sigui homes e´ s: (A) (B) (C) (D) (E) Comptabilitat=0,18, Administraci´o=0,24, Economia=0,01 i Finances=0,16 Comptabilitat=0,35, Administraci´o=0,25, Economia=0,04 i Finances=0,37 Comptabilitat=0,32, Administraci´o=0,03, Economia=0,03 i Finances=0,31 Comptabilitat=0,30, Administraci´o=0,40, Economia=0,02 i Finances=0,27 Cap d’aquestes opcions e´ s correcta Resposta: Aquesta distribuci´o es calcula mirant el total de homes i mirant la proporci´o que fa cada especialitat. Total de homes: 161. Comptabilitat: 56/161=0,35. Administraci´o: 40/161=0,25, Economia: 6/161=0,04 i Finances: 59/161=0,37.
Pregunta 4: La distribuci´o de les especialitats condicional a qu`e el sexe sigui dones e´ s: (A) (B) (C) (D) (E) Comptabilitat=0,35, Administraci´o=0,25, Economia=0,04 i Finances=0,37 Comptabilitat=0,32, Administraci´o=0,03, Economia=0,03 i Finances=0,31 Comptabilitat=0,18, Administraci´o=0,24, Economia=0,01 i Finances=0,16 Comptabilitat=0,30, Administraci´o=0,40, Economia=0,02 i Finances=0,27 Cap d’aquestes opcions e´ s correcta Resposta: Aquesta distribuci´o es calcula mirant el total de dones i mirant la proporci´o que fa cada especialitat. Total de dones: 225. Comptabilitat: 68/225=0,30. Administraci´o: 91/225=0,40, Economia: 5/225=0,02 i Finances: 61/225=0,27.
Pregunta 5: La relaci´o entre les variables la podem veure perqu`e: (A) (B) (C) (D) (E) les distribucions condicionals s´on diferents les distribucions marginals s´on diferents les distribucions condicionals s´on iguals les distribucions marginals s´on iguals Cap d’aquestes opcions e´ s correcta Resposta: La relaci´o entre variables es veu perque les distribucions condicionals s´on diferents.
Pregunta 6: Segons els resultats que tenim el sexe (A) (B) (C) (D) (E) est`a correlacionat positivament amb l’elecci´o de especialitat est`a relacionat negativament amb l’elecci´o d’especialitat no afecta a l’elecci´o d’especialitat est`a relacionat positivament amb l’elecci´o d’especialitat Cap d’aquestes opcions e´ s correcta Resposta: S´ı que hi ha una relaci´o, les dones fan m´es Administraci´o i els homes fan m´es finances, havent-hi altres difer`encies per`o no tan clares com aquestes. Per un altre cant´o no pot parlar-se d’associaci´o positiva o negativa.
Exercici 2: Relaci´o entre hores d’estudi i nota a un examen Volem veure la relaci´o entre les hores d’estudi i els resultats que han obtingut 10 estudiants a un examen. Els resultats s´on: Pregunta 7: El residu corresponent a 4 hores d’estudi e´ s (A) (B) (C) (D) (E) Positiu 0 No ho sabem Negatiu Cap d’aquestes opcions e´ s correcta Resposta: El residu e´ s el valor real per a 4 hores d’estudi, 6, i li restem el valor predit per a 4 hores d’estudi, 3,93, per tant el residu e´ s positiu.
Pregunta 8: Segons els resultats un estudiant que no hagi dedicat temps a l’estudi (0 hores) treur`a un (A) (B) (C) (D) (E) 2,28 4,11 0,63 0,41 Cap d’aquestes opcions e´ s correcta Resposta: Aquesta e´ s la constant de la regressi´o.
Pregunta 9: Els resultats de la regressi´o em diuen que per cada hora d’estudi el resultat obtingut puja (A) (B) (C) (D) (E) 2,28 punts 0,41 punts 4,11 punts 0,63 punts Cap d’aquestes opcions e´ s correcta Resposta: Aqu´ı es pregunta pel pendent de la regressi´o.
Pregunta 10: El coeficient de correlaci´o e´ s aproximadament igual a (A) (B) (C) (D) (E) 0,90 0,80 0,60 0,70 Cap d’aquestes opcions e´ s correcta Resposta: ´ el valor de r que trobem a la gr`afica inicial.
Es Pregunta 11: La recta de regressi´o prediu que un estudiant que dediqui 10 hores a l’estudi treur`a aproximadament un (A) (B) (C) (D) (E) 7,52 6,39 4,52 2,28 Cap d’aquestes optioncs e´ s correcta Resposta: Hem de multiplicar 10 pel pendent i sumar-li la constant.
Pregunta 12: El percentatge en la variaci´o de notes que aconseguim explicar mitjanc¸ant les hores d’estudi e´ s aproximadament (A) (B) (C) (D) (E) 70 % 63 % 45 % 55 % Cap d’aquestes opcions e´ s correcta Resposta: Aqu´ı es pregunta pel valor de la R2 .
Respostes a l’examen Universitat Pompeu Fabra ´ Permutaci´o Numero: 3 Usa sols llapis, bol´ıgraf o retolador negre i omple b´e les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix´ı com el grup.
´ i el GRUP.
Omple (marcant les caselles de la plantilla) el DNI, la PERMUTACIO DNI: el teu n´umero de document d’identitat (si no tens, el n´umero que et van assignar en el moment de matricularte).
PERMUT.: Entra un 3 GRUP: Posa el n´umero de grup (amb un 0 endavant) Entra la respostes en les l´ınies de baix, de la 1 a la 12. Cada resposta disposa de dues l´ınies, la primera e´ s per la resposta correcta i la segona per anul·lar en cas d’equivocaci´o: Test en classe 3 Exercici 1: Renda i u´ s de la televisi´o La seg¨uent taula presenta per a 20 individus informaci´o sobre la seva renda i el nombre d’hores que miren la televisi´o: Individu 1 2 3 4 5 6 7 8 9 10 Renda Hores TV Baixa 5 Baixa 3 Mitjana 2 Alta 3 Alta 4 Mitjana 2 Mitjana 3 Baixa 3 Baixa 6 Alta 1 L’an`alisi d’ordinador ens d´ona les gr`afiques seg¨uents: Individu 11 12 13 14 15 16 17 18 19 20 Renda Hores TV Alta 2 Mitjana 5 Mitjana 2 Mitjana 3 Alta 2 Baixa 5 Baixa 6 Alta 1 Mitjana 2 Mitjana 3 Utilitzant els resultats d’ordinador contesta les preguntes seg¨uents: Pregunta 1: La variable ”Individu” (A) (B) (C) (D) (E) e´ s una variable num`erica no serveix per a l’an`alisi estad´ıstica serveix per a l’an`alisi estad´ıstica e´ s asim`etrica cap a la dreta Cap de les respostes anteriors e´ s correcta Resposta: La variable ”Individu” no es pot utilitzar per a l’an`alisi estad´ıstica perqu`e e´ s simplement un codi per cada observaci´o, no e´ s una variable rellevant per a l’an`alisi. En tot cas seria una variable categ`orica, perqu`e li assigna a cada individu un codi arbitrari.
Pregunta 2: La variable ”Renda” e´ s (A) (B) (C) (D) (E) una variable num`erica cont´ınua una variable num`erica discreta una variable categ`orica amb ordre una variable categ`orica sense ordre Cap de les respostes anteriors e´ s correcta Resposta: Es tracta de una variable categ`orica perqu`e classifica els individus en tres categories d’acord amb la seva renda, per`o com prov´e d’una variable num`erica ”t´e ordre”.
Pregunta 3: Creus que hi ha relaci´o entre la renda i el nombre d’hores que miren la TV aquests individus? (A) (B) (C) (D) (E) No hi ha relaci´o entre les dues variables Es produeix la paradoxa de Simpson S’hauria de fer una regr´essi´o lineal entre les dues variables Hi ha relaci´o entre les dues variables Cap de les respostes anteriors e´ s correcta Resposta: Per veure si hi ha relaci´o, s’ha d’analitzar com varia la distribuci´o de la variable num`erica condicionada als diferents grups definits per la categ´orica. Mirem la distribuci´o d’hores de TV per a la gent de renda baixa, mitjana i alta. Veiem que els resums num`erics s´on forc¸a diferents, la mitjana d’hores de TV e´ s m´es gran per als de renda baixa per`o la resta de caracter´ıstiques de les distribucions tamb´e s´on diferents com ho ensenyen els diagrames de caixa. Per tant com les distribucions condicionals s´on diferents conclu¨ım que, pel que fa a aquesta mostra, sembla haver-hi relaci´o entre les dues variables.
Pregunta 4: La relaci´o entre les variables ”Hores d’´us de la TV” i ”Renda” mostra (A) (B) (C) (D) (E) una associaci´o negativa o inversa una associaci´o positiva o directa una asimetria cap a l’esquerra una asimetria cap a la dreta Cap de les anteriors respostes e´ s correcta.
Resposta: Com la nostra variable categ`orica e´ s una variable num`erica agrupada, podem dir que s´ı que hi ha associaci´o i aquesta associaci´o e´ s de tipus negativa o inversa. Ara b´e, s’ha de recordar que associaci´o no implica causalitat, i considerant la possibilitat de l’exist`encia de variables latents, no hem d’extreure conclusions sobre la causalitat entre les variables a partir de l’associaci´o negativa observada.
Pregunta 5: Per a la variable ”Hores d’´us de la TV”, els individus que mostren una dispersi´o m´es gran s´on (A) (B) (C) (D) (E) els individus de renda baixa els individus de renda mitjana els individus amb una observaci´o at´ıpica els individus de renda alta Cap de les respostes anteriors e´ s correcta Resposta: Tant si ho mirem pel valor de la desviaci´o t´ıpica com pels diagrames de caixa podem veure que els individus de renda baixa s´on els que mostren una dispersi´o m´es gran.
Pregunta 6: La distribuci´o de la variable ”Hores d’´us de la TV” per als individus de renda ”Baixa” e´ s (A) (B) (C) (D) (E) ni asim`etrica ni sim`etrica asim`etrica cap a l’esquerra uniforme asim`etrica cap a la dreta Cap de les anteriors respostes e´ s correcta Resposta: Segons els diagrames de caixa, veiem que aquesta distribuci´o e´ s asim`etrica cap a l’esquerra.
Exercici 2: Alc¸ada i renda Tenim informaci´o sobre quatre persones en quant a la seva alc¸ada i la seva renda mensual: Mitjana alc ¸ada = 180 cm.
Deviaci´ o t´ ıpica alc ¸ada = 11,547 cm Mitjana renda mensual (en milers d’euros) = 2 Deviaci´ o t´ ıpica renda mensual (en milers d’euros) = 1,1547 Covari` ancia en renda i alc ¸ada = 0.
Volem esbrinar si l’alc¸ada afecta a la renda. Les seg¨uentes f´ormules poden esser d’utilitat: s= n 1 (xi − x¯)2 n − 1 i=1 n 1 (xi − x¯)(yi − y¯) n − 1 i=1 sxy rxy = sx sy sy a = y¯ − b¯ x b=r , sx sxy = Contesta a les preguntes seg¨uents: Pregunta 7: El coeficient de correlaci´o e´ s igual a: (A) (B) (C) (D) (E) 0,6 0 0,8 1 Cap d’aquestes opcions e´ s correcta Resposta: Degut a qu`e la covari`ancia e´ s igual a 0, el coeficient de correlaci´o ser`a igual a 0.
Pregunta 8: El pendent de la recta de regressi´o e´ s igual a: (A) (B) (C) (D) (E) 3 1 0,18 0 Cap d’aquestes opcions e´ s correcta Resposta: Si el coeficient de correlaci´o e´ s 0 el pendent tamb´e ser`a 0.
Pregunta 9: Segons els resultats que tenim l’alc¸ada (A) (B) (C) (D) (E) est`a associada positivament amb la renda no afecta a la renda est`a associada negativament amb la renda fa dismunuir la renda Cap d’aquestes opcions e´ s correcta Resposta: Tots els resultats mostren que l’alc¸ada no afecta a la renda.
Pregunta 10: La constant de la recta de regresi´o e´ s igual a: (A) (B) (C) (D) (E) 170 2 1 160 Cap d’aquestes opcions e´ s correcta Resposta: Si el pendent e´ s igual a 0, la constant e´ s igual a la mitjana de la Y , o sigui la mitjana de la renda que e´ s igual a 2.
Pregunta 11: En aquest cas, La recta de regressi´o (A) (B) (C) (D) (E) t´e pendent positiu e´ s vertical e´ s horitzontal t´e pendent negativa Cap d’aquestes opcions e´ s correcta Resposta: ´ una recta horitzontal, el pendent e´ s igual a 0, i l’alc¸ada no explica la renda.
Es Pregunta 12: L’alc¸ada aconsegueix explicar un (A) (B) (C) (D) (E) 0% de la variaci´o de la renda 10% de la variaci´o de la renda 100% de la variaci´o de la renda 20% de la variaci´o de la renda Cap d’aquestes opcions e´ s correcta Resposta: Com la dispersi´o e´ s total, l’alc¸ada no aconsegueix explicar res de la renda (0%).
Respostes a l’examen Universitat Pompeu Fabra ´ Permutaci´o Numero: 4 Usa sols llapis, bol´ıgraf o retolador negre i omple b´e les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix´ı com el grup.
´ i el GRUP.
Omple (marcant les caselles de la plantilla) el DNI, la PERMUTACIO DNI: el teu n´umero de document d’identitat (si no tens, el n´umero que et van assignar en el moment de matricularte).
PERMUT.: Entra un 4 GRUP: Posa el n´umero de grup (amb un 0 endavant) Entra la respostes en les l´ınies de baix, de la 1 a la 12. Cada resposta disposa de dues l´ınies, la primera e´ s per la resposta correcta i la segona per anul·lar en cas d’equivocaci´o: Test en classe 3 Exercici 1: Dues variables categ`oriques Es recull informaci´o sobre el nombre d’aprovats i suspensos a l’examen de conduir a les ciutats de Barcelona i Madrid: Aprovat Suspens Barcelona 1640 460 Madrid 1736 364 Pregunta 1: Les freq¨ue` ncies relatives de la distribuci´o marginal de la variable ciutat s´on (arrodonides a 1 decimal): (A) Barcelona = 0,1, Madrid = 0,1 (B) (C) (D) (E) Barcelona= 0,5 , Madrid = 0,5 Barcelona = 0,4, Madrid = 0,4 Barcelona= 0,8 , Madrid = 0,2 Cap de les resposts anteriors s´on correctes Resposta: La distribuci´o marginal e´ s la distribuci´o per ciutat independentment de si s’hagi aprovat o no, per tant a Barcelona hi ha 2100 presentats a l’examen i a Madrid hi ha 2100, per tant les freq¨ue` ncies relatives s´on igual a 0,5 per a cada valor de la variable ciutat.
Pregunta 2: Les freq¨ue` ncies relatives de la distribuci´o de la variable ”Resultat de l’examen” condicionada a viure en Barcelona s´on (arrodonides a 2 decimals): (A) (B) (C) (D) (E) Aprovat = 0,83, Suspens = 0,17 Aprovat = 0,49, Suspens = 0,51 Aprovat = 0,78, Suspens = 0,22 Aprovat = 0,55, Suspens = 0,44 Cap de les respostes anteriors e´ s correcta Resposta: Hi ha 2100 que s’han presentat a l’examen a Barcelona dels quals 1640 han aprovat i 460 han suspens, per tant les freq¨ue` ncies relatives s´on 1640/2100=0,78 per a aprovats, i 460/2100=0,22 suspensos.
Pregunta 3: D’acord amb la taula podem dir que (A) hi ha associaci´o positiva entre les variables ”Ciutat de l’examen” i ”Resultats de l’examen” (B) no hi ha relaci´o entre les variables ”Ciutat de l’examen” i ”Resultats de l’examen”, el percentatge d’aprovats e´ s exactament igual (C) hi ha relaci´o no massa forta entre ”Ciutat de l’examen” i ”Resultats de l’examen”, a Madrid hi ha un percentatge una mica m´es alt d’aprovats (D) hi ha associaci´o negativa entre les variables ”Ciutat de l’examen” i ”Resultats de l’examen” (E) Cap de les respostes anteriors e´ s correcta Resposta: Mirem les distribucions condicionals i veiem que hi ha un percentatge m´es alt d’aprovats a Madrid que a Barcelona (tot i que u´ nicament uns pocs punts percentuals) i per tant s´ı que hi ha relaci´o entre les variables. En el cas de variables categ`oriques no es pot parlar d’associaci´o de tipus positiva o negativa.
A continuaci´o rebem m´es informaci´o, i ens donen taules desglosades per dones i homes. Les dades s´on les seg¨uents: Dones Aprovades Suspenses Homes Barcelona 488 32 Madrid 1404 216 Aprovats Suspensos Barcelona 1152 428 Madrid 332 148 Pregunta 4: A la taula per a les dones, la distribuci´o conjunta mostra les seg¨uents freq¨ue` ncies relatives (arrodonides a dos decimals): (A) (B) (C) (D) (E) Aprovades-Barcelona = 0,23, Aprovades-Madrid= 0,66, Suspenses-Barcelona =0,01, Suspenses-Madrid=0,10 Aprovades-Barcelona = 0,94, Aprovades-Madrid= 0,87, Suspenses-Barcelona =0,06, Suspenses-Madrid=0,13 Aprovades-Barcelona = 0,26, Aprovades-Madrid= 0,75, Suspenses-Barcelona =0,13, Suspenses-Madrid=0,87 Aprovades-Barcelona = 0,33, Aprovades-Madrid= 0,56, Suspenses-Barcelona =0,11, Suspenses-Madrid=0,01 Cap de les respostes anteriors e´ s correcta Resposta: Calculem les freq¨ue` ncies relatives com la freq¨ue` ncia de cada parell de valors sobre el total de casos, per exemple per aprovades-Barcelona = 488/2140 = 0,23 i aix´ı successivament.
Pregunta 5: Les variables ”Ciutat de l’examen” i ”Resultat de l’examen” (A) (B) (C) (D) (E) estan relacionades en la taula per homes per`o no per dones no estan relacionades en cap de les dues taules estan relacionades en ambdues taules per homes i dones estan relacionades en la taula per dones per`o no per homes Cap de les respostes anteriors e´ s correcta Resposta: Ara el percentatge d’aprovats e´ s m´es gran a Barcelona per les dues taules, per tant continuen relacionades en les dues taules.
Pregunta 6: Un cop que desglosem les taules per sexe (A) (B) (C) (D) (E) trobem una associaci´o positiva entre sexe i ciutat de l’examen trobem que no es compleix la paradoxa de Simpson trobem que es compleix la paradoxa de Simpson no podem dir si es compleix o no la paradoxa de Simpson Cap de les respostes anteriors e´ s correcta Resposta: Trobem que es compleix la paradoxa de Simpson perqu`e ara en les dues taules el percentatge d’aprovats e´ s m´es alta a Barcelona que a Madrid, a l’inrev`es del que passava en la taula global Exercici 2: Recta de regressi´o 200 estudiants de la Pompeu s´on contractats per les vacances de Nadal per treballar a restaurants. Els paguen un salari mitj`a de 500 euros amb una desviaci´o t´ıpica de 60 euros. Aquest salari est`a compost per una part fixa i una part variable. La part fixa e´ s igual a 300 euros i la part variable dep`en del nombre de cops que els clients els donen una propina. El nombre mitj`a de cops que es rep propina e´ s de 25.
Volem entendre l’efecte que t´e el nombre de cops que es rep propina sobre el salari que guanyen aquests estudiants durant el Nadal, i sabem que el nombre de cops que es rep propina aconsegueix explicar un 70% de la variaci´o en el salari rebut.
Les seg¨uentes f´ormules poden esser d’utilitat: s= n 1 (xi − x¯)2 n − 1 i=1 n 1 (xi − x¯)(yi − y¯) n − 1 i=1 sxy rxy = sx sy sy b=r , a = y¯ − b¯ x sx sxy = Contesta a les preguntes seg¨uents: Pregunta 7: Si pensem aquest problema com una regressi´o entre el nombre de cops que es rep propina i el salari rebut: (A) (B) (C) (D) (E) el salari rebut e´ s la variable explicativa i el nombre de cops que es rep propina e´ s la variable dependent.
el salari rebut e´ s la variable dependent i el nombre de cops que es rep propina e´ s la variable explicativa.
tant el salari rebut com el nombre de cops que es rep propina s´on variables dependents.
tant el salari rebut com el nombre de cops que es rep propina s´on variables explicatives.
Cap de les respostes anteriors e´ s correcta.
Resposta: Volem estudiar l’efecte del nombre de cops que es rep propina sobre el salari rebut, per tant el nombre de cops que es rep propina e´ s la variable explicativa i el salari rebut e´ s la variable dependent.
Pregunta 8: La regressi´o prediu que per cada propina rebuda el salari final s’incrementa en (A) (B) (C) (D) (E) 15 euros.
10 euros.
5 euros.
8 euros.
Cap de les respostes anteriors e´ s correcta.
Resposta: Ens pregunten pel pendent de la recta, l’efecte del nombre de cops que es rep propina sobre el salari rebut.
L’enunciat ens d´ona la constant de la regressi´o (a) perqu`e diu que la part de salari independent del nombre de cops que es rep propina e´ s igual a 300. Tamb´e ens d´ona la mitjana de la variable dependent (mitjana dels salaris igual 500) i la mitjana de la variable explicativa (mitjana del nombre de cops que es rep propina igual a 25). Podem aplicar la f´ormula: ¯ Y¯ = a + bX llavors b= Y¯ − a 500 − 300 = ¯ X 25 i obtenim b = 8.
Pregunta 9: El coeficient de correlaci´o entre el salari rebut i el nombre de cops que es rep propina e´ s igual a: (A) (B) (C) (D) (E) 0,84 -0,84 0,7 -0,7 Cap de les respostes anteriors e´ s correcta Resposta: Ens donen el percentatge que aconseguim explicar dels salaris rebuts mitjanc¸ant el nombre de cops que es rep propina,√aix`o e´ s el coeficient de determinaci´o o R2 , el coeficient de correlaci´o e´ s l’arrel quadrada d’aquest valor, e´ s a dir 0, 7 = ±0, 84. Per`o per una altra part sabem que r t´e que ser positiu perqu`e el nombre de propines t´e un efecte positiu sobre el salari.
Pregunta 10: La desviaci´o t´ıpica del nombre de cops que es rep propina e´ s igual a: (A) (B) (C) (D) (E) 2,1 6,3 3,0 2,8 Cap de les respostes anteriors e´ s correcta Resposta: Anteriorment hav´ıem calculat el pendent de la recta de regressi´o, b = 8, aix´ı com el coeficient de correlaci´o r = 0, 84. A m´es sabem que: sy b=r sx Per tant sy 60 sx = r = 0, 84 = 6, 3 b 8 Pregunta 11: Un estudiant que rep 30 cops propina, guanyar`a aproximadament un salari de (A) (B) (C) (D) (E) 700 euros 400 euros 540 euros 600 euros Cap de les respostes anteriors e´ s correcta Resposta: Hem de predir per aquest valor: 300 + 8 · 30 = 540 Pregunta 12: Al diagrama de dispersi´o d’aquestes dades, per a un cas representat per un estudiant que rep 10 cops propina i amb un salari cobrat igual a 380 euros (A) (B) (C) (D) (E) amb aquesta informaci´o no podem dir per on passa la recta de regressi´o en relaci´o amb aquest punt.
la recta de regressi´o passa per sota d’aquest punt.
la recta de regressi´o passa just per aquest punt.
la recta de regressi´o passa per sobre d’aquest punt.
Cap de les respostes anteriors e´ s correcta Resposta: El residu e´ s igual al valor real menys el valor predit, per tant la recta de regressi´o passa per sobre del punt si el residu e´ s negatiu, passa just pel punt si el residu e´ s 0 i passa per sota del punt si el residu e´ s positiu. En aquest cas el residu e´ s: 380 − 300 − 8 · 10 = 0 per tant la recta passa just per sobre del punt associat amb aquest cas.
Respostes a l’examen Universitat Pompeu Fabra ´ Permutaci´o Numero: 5 Usa sols llapis, bol´ıgraf o retolador negre i omple b´e les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix´ı com el grup.
´ i el GRUP.
Omple (marcant les caselles de la plantilla) el DNI, la PERMUTACIO DNI: el teu n´umero de document d’identitat (si no tens, el n´umero que et van assignar en el moment de matricularte).
PERMUT.: Entra un 5 GRUP: Posa el n´umero de grup (amb un 0 endavant) Entra la respostes en les l´ınies de baix, de la 1 a la 12. Cada resposta disposa de dues l´ınies, la primera e´ s per la resposta correcta i la segona per anul·lar en cas d’equivocaci´o: Test en classe 3 Exercici 1: Notes per a 16 estudiants d’An`alisi de Dades Tenim informaci´o sobre les notes de 16 estudiants d’An`alisi de Dades en dues altres assignatures (fent un total de 32 observacions). La informaci´o es presenta en diagrames de caixa: Usant aquests resultats d’ordinador, contesteu les preguntes seg¨uents: Pregunta 1: La forma de la distribuci´o (A) (B) (C) (D) (E) e´ s asim`etrica cap a l’esquerra per a totes les assignatures e´ s la mateixa per a totes les assignatures e´ s asim`etrica cap a la dreta per a totes les assignatures no e´ s la mateixa per a totes les assignatures Cap de les respostes anteriors e´ s correcta Resposta: No e´ s la mateixa per`o no t´e l’asimetria cap a la mateixa direcci´o per a totes les assignatures.
Pregunta 2: Observem una relaci´o que podem descriure com (A) (B) (C) (D) (E) associaci´o positiva entre les notes i les assignatures associaci´o no lineal entre notes i assignatures dispersi´o creixent associaci´o negativa entre notes i assignatures Cap de les respostes anteriors e´ s correcta Resposta: No podem descriure cap mena d’associaci´o perqu`e la variable categ`orica no est`a ordenada.
Pregunta 3: La variable “Assignatura” e´ s una (A) (B) (C) (D) (E) variable num`erica cont´ınua variable num`erica discreta variable categ`orica sense ordre variable categ`orica amb ordre Cap de les respostes anteriors e´ s correcta Resposta: ´ categ`orica, per`o no t´e ordre. No t´e un ordre natural als seus valors.
Es Pregunta 4: Considerant el tipus de variables que tenim (A) (B) (C) (D) (E) no podem descriure la direcci´o de l’associaci´o podem calcular la l´ınia de regressi´o podem calcular el coeficient de correlaci´o podem descriure la direcci´o de l’associaci´o Cap de les respostes anteriors e´ s correcta Resposta: No podem descriure la direcci´o de l’associaci´o perqu`e la variable categ`orica no t´e ordre.
Pregunta 5: D’acord amb el que observem als diagrames de caixa (A) (B) (C) (D) (E) no hi ha dispersi´o entre les assignatures hi ha una dispersi´o creixent entre les assignatures la dispersi´o no canvia amb les assignatures hi ha una dispersi´o decreixent entre les assignatures Cap de les respostes anteriors e´ s correcta Resposta: Com podem veure als diagrames de caixa, la dispersi´o no e´ s la mateixa per les dues assignatures, per`o com la variable categ`orica no est`a ordenada no podem descriure la dispersi´o com creixent o decreixent.
Pregunta 6: Per verificar si hi ha relaci´o entre les dues variables hem de verificar si hi ha difer`encies (A) (B) (C) (D) (E) als coeficients de correlaci´o entre les distribucions de la variable “Assignatures” condicionada a les notes a la distribuci´o de cada variable considerada de manera separada entre les distribucions de la variable “Notes” condicionada a les assignatures Cap de les respostes anteriors e´ s correcta Resposta: Hem de verificar com les notes canvien per a cada assignatura (distribuci´o de les notes condicionada a les assignatures). Si hi ha difer`encies llavors las variables estan relacionades.
Exercici 2: Consum i renda Una regressi´o entre el consum i la renda de 35 fam´ılies proporciona la seg¨uent relaci´o: El coeficient de correlaci´o e´ s r = 0, 9.
Amb aquesta informaci´o contesta les preguntes seg¨uents: Pregunta 7: L’estudi preveu que una fam´ılia amb una renda de 5000 euros tindr`a un consum de (A) (B) (C) (D) (E) 1990 euros 1250 euros 2000 euros 5000 euros Cap de les respostes anteriors e´ s correcta Resposta: Substitu¨ım 740 + 0, 25 × 5000 = 1990.
Pregunta 8: L’an`alisi realitzat aproximadament aconsegueix explicar (A) (B) (C) (D) (E) un 90% del consum un 10% del consum un 81% del consum un 9% del consum Cap de les respostes anteriors e´ s correcta Resposta: Com el coeficient de correlaci´o e´ s de 0,9, la R2 , que d´ona el percentatge buscat, e´ s el quadrat de 0,9 o sigui 0,81, per tant un 81%.
Pregunta 9: En el cas d’una fam´ılia amb renda zero, el consum ser`a (A) (B) (C) (D) (E) aproximadament 1640 euros, la mitjana del consum 740 euros 0 euros el consum ser`a negatiu Cap de les anteriors respostes e´ s correcta Resposta: Es demana per la constant de la recta de regressi´o, o sigui 740 euros.
Pregunta 10: El pendent ens diu que (A) (B) (C) (D) (E) cada euro addicional de renda es converteix en 740 euros de consum addicional cada euro addicional de consum es converteix en 0,25 euros de renda addicional cada euro addicional de renda es converteix en 0,25 euros de consum addicional cada euro addicional de renda es converteix en 0,9 euros de consum addicional Cap de les respostes anteriors e´ s correcta Resposta: El valor del pendent e´ s de 0,25, i e´ s positiu, per tant prediu que un augment de renda fa augmentar el consum Pregunta 11: La mitjana de renda de les 35 fam´ılies e´ s 2610 euros. Si volem predir el consum d’una fam´ılia amb uns ingressos mensuals de 100.000 euros (A) (B) (C) (D) (E) la predicci´o ser`a probablement incorrecta perqu`e extrapolem massa lluny de la mostra que tenim es predir`a una mitjana de consum de 25.000 la predicci´o ser`a 15.742 euros aproximadament es predir`a un consum negatiu Cap de les respostes anteriors e´ s correcta.
Resposta: 100.000 euros estan massa allunyats de la mitjana de la mostra, per tant estem extrapolant i la predicci´o no ser`a correcta.
Teniu en compte les observacions 19 i 36: Pregunta 12: En aquesta an`alisi de regressi´o (A) (B) (C) (D) (E) segurament no hi ha observacions influents sols la observaci´o 19 e´ s influent la observaci´o 36 podria ser influent, haurem de analitzar la seva exclusi´o les observacions 19 i 36 s´on influents Cap de les respostes anteriors e´ s correcta Resposta: L’observaci´o 19 no e´ s at´ıpica respecte a la variable explicativa, i per tant no pot ser influent. L’observaci´o 36 e´ s at´ıpica respecte a la variable explicativa i per tant haurem d’analitzar la seva influ`encia si l’excloem de la mostra.
Respostes a l’examen Universitat Pompeu Fabra ´ Permutaci´o Numero: 6 Usa sols llapis, bol´ıgraf o retolador negre i omple b´e les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix´ı com el grup.
´ i el GRUP.
Omple (marcant les caselles de la plantilla) el DNI, la PERMUTACIO DNI: el teu n´umero de document d’identitat (si no tens, el n´umero que et van assignar en el moment de matricularte).
PERMUT.: Entra un 6 GRUP: Posa el n´umero de grup (amb un 0 endavant) Entra la respostes en les l´ınies de baix, de la 1 a la 12. Cada resposta disposa de dues l´ınies, la primera e´ s per la resposta correcta i la segona per anul·lar en cas d’equivocaci´o: Test en classe 3 Exercici 1: Missatges SMS als m`obils Tenim informaci´o sobre el nombre de SMS (missatges de text al m`obil) que reben al dia al tel`efon m`obil 9 joves classificats en 3 grups d’edat diferents: En base a aquesta informaci´o contesta les preguntes seg¨uents: Pregunta 1: La variable “grup d’edat” e´ s una variable (A) (B) (C) (D) (E) categ`orica amb ordre num`erica cont´ınua categ`orica sense ordre num`erica discreta Cap d’aquestes opcions e´ s correcta Resposta: ´ una variable categ`orica amb ordre perqu`e est`a basada en l’edat, que e´ s num`erica.
Es Pregunta 2: Pel tipus de variable que tenim (A) (B) (C) (D) (E) podem calcular un coeficient de correlaci´o podem parlar de la direcci´o de l’associaci´o podem calcular una recta de regress´ıo´ no podem parlar de la direcci´o de l’associaci´o Cap d’aquestes opcions e´ s correcta Resposta: Com es tracta d’una variable categ`orica amb ordre podem parlar de la direcci´o de l’associaci´o.
Pregunta 3: D’acord amb el que observem als diagrames de caixa i els resums num`erics (A) (B) (C) (D) (E) la dispersi´o no canvia amb l’edat hi ha una dispersi´o creixent amb l’edat no hi ha dispersi´o a l’edat hi ha una dispersi´o decreixent amb l’edat Cap d’aquestes opcions e´ s correcta Resposta: Es pot apreciar que la dispersi´o (l’amplada de la caixa) es fa m´es gran amb l’edat.
Pregunta 4: La forma de la distribuci´o (A) (B) (C) (D) (E) no e´ s igual per a tots els grups d’edat e´ s asim`etrica cap a la dreta per a tots els grups d’edat e´ s asim`etrica cap a l’esquerra per a tots els grups d’edat e´ s igual per a tots els grups d’edat Cap d’aquestes opcions e´ s correcta Resposta: La forma no e´ s igual, per al grup 18-20 e´ s asim`etrica cap a l’esquerra, mentre que per als altres grups e´ s relativament sim`etrica.
Pregunta 5: La relaci´o que s’observem e´ s de (A) (B) (C) (D) (E) associaci´o negativa entre l’edat i el nombre de SMS associaci´o positiva entre l’edat i el nombre de SMS no hi ha associaci´o hi ha associaci´o no lineal Cap d’aquestes opcions e´ s correcta Resposta: Observem que la mitjana de SMS e´ s decreixent amb l’edat, per tant es pot dir que hi ha una associaci´o negativa.
Pregunta 6: Per veure si hi ha relaci´o entre les dues variables s’ha de mirar si hi ha difer`encies en (A) (B) (C) (D) (E) les distribucions de la variable “SMS” condicionades a cada possible valor de “Nombre de SMS” el coeficient de correlaci´o les distribucions de les variables per separat les distribucions de la variable “Nombre de SMS” condicionades als grups de edat Cap d’aquestes opcions e´ s correcta Resposta: S’ha de mirar si la distribuci´o de la num`erica canvia si condicionem pels diferents valors de la categ`orica.
Exercici 2: Nombre de passades encertades i gols convertits Un equip de futbol fa un estudi sobre la relaci´o entre el nombre de passades encertades i el nombre de gols convertits. El resultat que s’obt´e e´ s: Gols convertits = 0, 2 + 0, 02 × Passades encertades El coeficient de correlaci´o e´ s r = 0, 20.
Amb aquesta informaci´o contesta les preguntes seg¨uents: Pregunta 7: L’estudi preveu que si hi ha 50 passades correctes, es convertiran una mitjana de (A) (B) (C) (D) (E) 1,2 gols 0 gols 2 gols 1,5 gols Cap de les respostes anteriors e´ s correcta.
Resposta: Substitu¨ım 0, 2 + 0, 02 × 50 = 1, 2gols Pregunta 8: L’an`alisi realitzat aproximadament aconsegueix explicar (A) (B) (C) (D) (E) un 8% de la variaci´o en gols marcats un 2% de la variaci´o en gols marcats un 10% de la variaci´o en gols marcats un 4% de la variaci´o en gols marcats Cap de les respostes anteriors e´ s correcta.
Resposta: Com el coeficient de correlaci´o e´ s de 0,2 la R2 , que d´ona el percentatge buscat, e´ s el quadrat de 0,2 o sigui 0,04, per tant un 4%.
Pregunta 9: Si no hi ha cap passada bona, la regressi´o prediu que es convertir`a una mitjana de (A) (B) (C) (D) (E) 0,2 gols 0,08 gols 0,4 gols 0,02 gols Cap de les anteriors respostes e´ s correcta Resposta: Es demana per la constant de la recta de regressi´o, o sigui 0,2.
Pregunta 10: El pendent ens diu que (A) (B) (C) (D) (E) per cada passada bona la mitjana de gols convertits puja en 0,4 gols per cada passada bona la mitjana de gols convertits puja en 0,2 gols per cada passada bona la mitjana de gols convertits puja en 0,04 gols per cada passada bona la mitjana de gols convertits puja en 0,02 gols Cap de les respostes anteriors e´ s correcta.
Resposta: El valor del pendent e´ s de 0,02, i e´ s positiu, per tant prediu que les passades bones incrementen la mitjana de gols convertits.
Pregunta 11: Dins de la nostra mostra, la mitjana de passades bones e´ s 40, el m´ınim e´ s 5 i el m`axim e´ s 80. Si fem una predicci´o per 1000 passades bones (A) (B) (C) (D) (E) es predir`a un nombre de gols negatiu es prediran una mitjana de 1000 gols convertits la predicci´o ser`a correcta la predicci´o ser`a incorrecta perqu`e extrapolem massa lluny de la mostra que tenim Cap de les respostes anteriors e´ s correcta.
Resposta: 1000 passades est`a massa allunyat de la mitjana de la mostra, per tant estem extrapolant i la predicci´o no ser`a fiable.
Pregunta 12: En aquesta an`alisi de regressi´o (A) no hi ha variable dependent i independent (B) tant el nombre de gols convertits com el nombre de passades encertades s´on variables dependents (C) el nombre de gols convertits e´ s la variable dependent i el nombre de passes encertades e´ s la variable independent (D) el nombre de gols convertits e´ s la variable independent i el nombre de passes encertades e´ s la variable dependent (E) Cap de les respostes anteriors e´ s correcta Resposta: La variable que volem predir e´ s el nombre de gols convertits, per tant aquesta e´ s la variable dependent, mentre que el nombre de passades encertades e´ s el que utilitzem per explicar els gols, per tant aquesta e´ s la variable independent o explicativa.
Respostes a l’examen Universitat Pompeu Fabra ´ Permutaci´o Numero: 7 Usa sols llapis, bol´ıgraf o retolador negre i omple b´e les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix´ı com el grup.
´ i el GRUP.
Omple (marcant les caselles de la plantilla) el DNI, la PERMUTACIO DNI: el teu n´umero de document d’identitat (si no tens, el n´umero que et van assignar en el moment de matricularte).
PERMUT.: Entra un 7 GRUP: Posa el n´umero de grup (amb un 0 endavant) Entra la respostes en les l´ınies de baix, de la 1 a la 12. Cada resposta disposa de dues l´ınies, la primera e´ s per la resposta correcta i la segona per anul·lar en cas d’equivocaci´o: Test en classe 3 Exercici 1: Beure caf`e fa pujar la pressi´o arterial? En un estudi s’intenta esbrinar si beure caf`e fa pujar la pressi´o arterial. Per aix`o se li d´ona un caf`e a 200 persones per`o sense dir-los si cont´e caf`e normal o decafeinat. Els resultats que s’obtenen s´on: Caf`e normal Decafeinat La pressi´o ha pujat 50 20 La pressi´o no ha pujat 50 80 Anomena a les dues variables: Pressi´o i Caf`e. En base a aquestes dades contesta les preguntes seg¨uents: Pregunta 1: Les freq¨ue` ncies relatives de la distribuci´o marginal de la variable Caf`e s´on: (A) (B) (C) (D) (E) Fixeu-vos que la B no és correcta perquè no m'està donant les freqüències de la variable Cafè sinó les de la variable Pressió) La pressi´o ha pujat = 0,1, La pressi´o no ha pujat = 0,4 La pressi´o ha pujat = 0,5, La pressi´o no ha pujat = 0,5 La pressi´o ha pujat = 0,25, La pressi´o no ha pujat = 0,25 La pressi´o ha pujat = 0,35, La pressi´o no ha pujat = 0,65 Cap de les respostes anteriors s´on correctes Resposta: La variable Caf`e t´e com a valors possibles Caf`e normal o Decafeinat, per tant cap d’aquestes respostes e´ s correcta.
Pregunta 2: Les freq¨ue` ncies relatives de la distribuci´o de la variable Pressi´o condicionada a veure caf`e “Normal” s´on: (A) (B) (C) (D) (E) La pressi´o ha pujat = 0,29, La pressi´o no ha pujat = 0,62 La pressi´o ha pujat = 0,71, La pressi´o no ha pujat = 0,38 La pressi´o ha pujat = 0,5, La pressi´o no ha pujat = 0,5 La pressi´o ha pujat = 0,2, La pressi´o no ha pujat = 0,8 Cap de les respostes anteriors e´ s correcta Resposta: Hi ha un total de 100 persones que han begut caf`e normal, de les quals 50 han tingut pressi´o m´es alta (0,5) i 50 no han tingut pressi´o m´es alta (0,5).
Pregunta 3: D’acord amb la taula podem dir que (A) (B) (C) (D) (E) hi ha associaci´o negativa entre ”Caf`e” i ”Pressi´o” no hi ha relaci´o entre les variables ”Pressi´o” i ”Caf`e”.
hi ha associaci´o positiva entre ”Caf`e” i ”Pressi´o” hi ha relaci´o entre les variables ”Pressi´o” i ”Caf`e”.
Cap de les respostes anteriors e´ s correcta Resposta: Mirem la distribuci´o condicionada a veure Caf`e Normal i veiem que a un percentatge m´es alt li puja la pressi´o arterial, que si ho mirem a la distribuci´o condicionada a veure Caf`e Decafeinat.
A continuaci´o rebem m´es informaci´o, a l’estudi s’havia preguntat als participants si eren bebedors habituals de caf`e o no. Ens donen doncs taules desglosades per bebedors habituals i bebedors no habituals de caf`e: Bebedors no habituals La pressi´o puja La pressi´o no puja Bebedors habituals Normal Decafeinat 40 10 10 40 La pressi´o puja La pressi´o no puja Normal Decafeinat 10 10 40 40 Pregunta 4: A la taula de bebedors no habituals, la distribuci´o conjunta mostra les seg¨uents freq¨ue` ncies relatives: (A) Puja pressi´o - Caf`e normal = 0,1, Puja pressi´o - Decafeinat = 0,4, No puja pressi´o - Caf`e normal = 0,4, No puja pressi´o - Decafeinat = 0,1.
(B) Puja pressi´o - Caf`e normal = 0,2, Puja pressi´o - Decafeinat = 0,8, No puja pressi´o - Caf`e normal = 0,8, No puja pressi´o - Decafeinat = 0,2.
(C) Puja pressi´o - Caf`e normal = 0,4, Puja pressi´o - Decafeinat = 0,1, No puja pressi´o - Caf`e normal = 0,1, No puja pressi´o - Decafeinat = 0,4.
(D) Puja pressi´o - Caf`e normal = 0,8, Puja pressi´o - Decafeinat = 0,2, No puja pressi´o - Caf`e normal = 0,2, No puja pressi´o - Decafeinat = 0,8.
(E) Cap de les respostes anteriors e´ s correcta Resposta: Es calcula mirant la freq¨ue` ncia absoluta de cada cel·la i dividint-la pel total, Puja pressi´o - Caf`e normal = 40/100=0,4, Puja pressi´o - Decafeinat = 10/100 = 0,1, No puja pressi´o - Caf`e normal = 10/100 = 0,1, No puja pressi´o - Decafeinat = 40/100 = 0,4.
Pregunta 5: Les variables Pressi´o i Caf`e (A) (B) (C) (D) (E) estan relacionades a la taula de bebedors habituals per`o no a la de bebedors no habituals.
estan relacionades en ambdues taules de bebedors habituals i no habituals.
no estan relacionades en cap de les dues taules estan relacionades a la taula de bebedors no habituals per`o no a la de bebedors habituals.
Cap de les respostes anteriors e´ s correcta Resposta: A la taula de bebedors no habituals les condicionals a beure caf`e s´on diferents, per`o a la de bebedors habituals s´on iguals i per tant les variables en aquesta u´ ltima taula no estan relacionades.
Pregunta 6: Si a la premsa es publica una not´ıcia sota el t´ıtol ”Beure caf`e fa pujar la pressi´o arterial”, la teva resposta seria: (A) (B) (C) (D) Aquesta afirmaci´o e´ s incorrecta, a algunes persones que prenen caf`e decafeinat els puja la pressi´o arterial.
Aquesta afirmaci´o e´ s correcta.
Aquesta afirmaci´o e´ s incorrecta, a algunes persones el caf`e no els provoca una pressi´o m´es alta.
Aquesta afirmaci´o e´ s incorrecta, hi ha una variable latent que e´ s la frequ`encia amb qu`e es beu caf`e que no s’est`a prenent en compte.
(E) Cap de les respostes anteriors e´ s correcta Resposta: L’afirmaci´o es basa en la taula inicial que ignora una variable latent que hem descobert quan es desglosa la taula en bebedors habituals i no habituals.
Exercici 2: Velocitat i consum de benzina Una f`abrica de cotxes fa un estudi sobre un dels seus models i mesura la velocitat mitjana en Km/hora i el consum de benzina en litres consumits en un tram de 100 Km. Els gerents de la f`abrica volen veure la relaci´o entre la velocitat i el consum de benzina.
Les dades i els resultats s´on els seg¨uents: En base a aquesta informaci´o contesta les preguntes seg¨uents: Pregunta 7: La mesura de bondat de l’ajust ens diu que la recta aconsegueix (A) (B) (C) (D) (E) explicar un 10% de la variaci´o del consum de benzina explicar un 15% de la variaci´o del consum de benzina explicar un 5% de la variaci´o del consum de benzina explicar un 0% de la variaci´o del consum de benzina Cap d’aquestes opcions e´ s correcta Resposta: El valor de la mesura R2 mostra 0 a “Resums”, per tant s’aconsegueix explicar un 0% del consum.
Pregunta 8: La recta calculada prediu que un cotxe que va a 0km per hora consumeix (A) (B) (C) (D) (E) 7,92 litres 0 litres 2,14 litres 10,93 litres Cap d’aquestes opcions e´ s correcta Resposta: Quan la velocitat e´ s 0 obtenim la constant de la regressi´o que e´ s igual a 10,93.
Pregunta 9: La relaci´o ens mostra (A) una associaci´o lineal entre les variables (B) no hi ha associaci´o entre les variables (C) una associaci´o lineal positiva molt forta entre les variables (D) una associaci´o lineal negativa molt forta entre les variables.
(E) Cap d’aquestes opcions e´ s correcta Resposta: S’observa una associaci´o clara, per`o no e´ s lineal, per tant cap de les opcions planteades e´ s correcta.
Pregunta 10: La recta calculada prediu que per cada kil`ometre per hora adicional que s’incrementa la velocitat, el consum augmenta en (A) (B) (C) (D) (E) 0,01 litres 1,73 litres 10,92 litres 0,03 litres Cap d’aquestes opcions e´ s correcta Resposta: L’efecte de la velocitat sobre el consum de benzina el trobem al pendent de la recta, que veiem que e´ s igual a 0,01 litres.
Pregunta 11: El valor del coeficient de correlaci´o ens diu que (A) (B) (C) (D) (E) Hi ha correlaci´o negativa No hi ha associaci´o de cap tipus Pr`acticament no hi ha correlaci´o lineal Hi ha correlaci´o positiva Cap d’aquestes opcions e´ s correcta Resposta: El valor que podem observar a “Resums” per a r e´ s 0,07, per tant no hi ha correlaci´o lineal, per`o pot haver-hi correlaci´o no lineal.
Pregunta 12: Al diagrama de residus, pels dos valors m´es baixos de la velocitat els residus seran (A) (B) (C) (D) (E) positius negatius iguals a zero un positiu i un negatiu Cap d’aquestes opcions e´ s correcta Resposta: Com els punts al diagrama de dispersi´o queden per sobre de la recta d’ajust, el valor real ser`a m´es gran que el valor predit i els residus seran positius.
Respostes a l’examen Universitat Pompeu Fabra ´ Permutaci´o Numero: 8 Usa sols llapis, bol´ıgraf o retolador negre i omple b´e les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix´ı com el grup.
´ i el GRUP.
Omple (marcant les caselles de la plantilla) el DNI, la PERMUTACIO DNI: el teu n´umero de document d’identitat (si no tens, el n´umero que et van assignar en el moment de matricularte).
PERMUT.: Entra un 8 GRUP: Posa el n´umero de grup (amb un 0 endavant) Entra la respostes en les l´ınies de baix, de la 1 a la 12. Cada resposta disposa de dues l´ınies, la primera e´ s per la resposta correcta i la segona per anul·lar en cas d’equivocaci´o: Test en classe 3 Exercici 1: Dues variables categ`oriques Fem una investigaci´o sobre l’audi`encia televisiva de “El Internado” per a una mostra de 5000 persones de Barcelona. Dividim la poblaci´o en funci´o de la seva edat, considerant joves els menors de 30 anys i adults els majors de 30 anys. A m´es distingim entre aquelles persones que tenen per norma veure una s`erie cada nit i aquelles persones que veuen alguna de forma espor`adica per`o normalment veuen pel·l´ıcules o altres tipus de programes televisius.
Les taules de conting`encia s´on: Veuen s`eries normalment Joves Adults Veuen “El Internado” 599 392 No veuen “El Internado” 1088 1145 No veuen s`eries normalment Joves Adults Veuen “El Internado” 135 172 No veuen “El Internado” 489 980 Pregunta 1: A la taula dels que “No veuen s`eries normalment”, la freq¨ue` ncia relativa de la distribuci´o marginal de l’edat corresponent a “Joves” e´ s igual a (A) (B) (C) (D) (E) 0,151 0,351 0,451 0,251 Cap de les respostes anteriors e´ s correcta Resposta: Dins d’aquesta taula hi ha un total de 1776 telespectadors dels quals 624 s´on joves, per tant la freq¨ue` ncia relativa buscada e´ s igual a 624/1776= 0,351 Pregunta 2: A la taula dels que “Veuen s`eries normalment”, la freq¨ue` ncia relativa per “Veuen El Internado” dins de la distribuci´o condicionada a “Joves” e´ s (A) (B) (C) (D) (E) 0,355 0,186 0,604 0,422 Cap de les respostes anteriors e´ s correcta Resposta: El total de joves dins de la mostra de tele-espectadors que veuen s`eries habitualment e´ s de 1687, dels quals 599 vuen “El Internado”, per tant la freq¨ue` ncia relativa e´ s 599/1687=0,355.
Pregunta 3: A la taula dels que “No veuen s`eries normalment”, la freq¨ue` ncia relativa de ”Adult” a la distribuci´o condicionada a ”No veuen El Internado” e´ s igual a (A) (B) (C) (D) (E) 0,242 0,560 0,342 0,667 Cap de les respostes anteriors e´ s correcta Resposta: El total de telespectadors dins de la taula “No veuen s`eries normalment”, que no veuen “El Internado” e´ s de 1469, dels quals 980 s´on adults, per tant la freq¨ue` ncia relativa buscada e´ s de 980/1469 = 0,667.
Pregunta 4: A la taula dels que “Veuen s`eries normalment”, la freq¨ue` ncia relativa de la distribuci´o conjunta corresponent al parell de valors “Adult, no veu El Internado” e´ s (A) 0,186 (B) 0,422 (C) 0,355 (D) 0,604 (E) Cap de les respostes anteriors e´ s correcta Resposta: El total de telespectadors dins de la taula “Veuen s`eries normalment”, e´ s de 3224, dels quals 1145 s´on adults i no veuen “El Internado”, per tant la freq¨ue` ncia relativa corresponent e´ s 1145/3224 = 0,355.
Pregunta 5: A les taules presentades: (A) les dues taules mostren que hi ha relaci´o entre les variables categ`oriques, tot i que no gaire forta.
(B) a les dues taules les variables estan associades positivament.
(C) hi ha una taula on les variables s´on independents i una altra on hi ha relaci´o entre les variables tot i que no gaire forta.
(D) les dues taules mostren que les variables analitzades s´on independents.
(E) Cap de les respostes anteriors es correcta.
Resposta: A les dues taules les distribucions condicionals a l’edat mostren que els joves miren una mica m´es “El Internado” que els adults, tot i que la difer`encia no e´ s massa gran, per tant hi ha relaci´o per`o no e´ s massa forta.
Pregunta 6: Si agreguem les dues taules, considerant les dades conjuntament sense prendre en consideraci´o si els telespecatadors miren habitualment s`eries o no (A) (B) (C) (D) (E) no trobem un cas de “Paradoxa de Simpson” les variables passen a estar associades positivament les variables passen a estar associades negativament trobem un cas de “Paradoxa de Simpson” Cap de les respostes anteriors e´ s correcta Resposta: Si agreguem les dades continua havent un percentatge m´es gran de joves que veuen “El Internado”, igual que a les taules individuals, per tant en aquest exemple no es produeix la “Paradoxa de Simpson”.
Exercici 2: Minuts al Facebook i nota a l’examen final de Dades Comptem amb informaci´o sobre els minuts que ocupen 15 estudiants al Facebook durant la setmana, i volem saber l’efecte que t´e sobre la nota de l’examen final d’An`alisi de Dades. Un cop entrem les dades a l’ordinador, obtenim els seg¨uents resums gr`afics i num`erics: En base a aquesta informaci´o contesta les preguntes seg¨uents: Pregunta 7: El coeficient de correlaci´o ens indica (A) (B) (C) (D) (E) una associaci´o lineal inversa feble una associaci´o lineal directa feble una associaci´o lineal directa forta una associaci´o lineal inversa forta Cap d’aquestes opcions e´ s correcta Resposta: T´e un valor de -0,95, prop de -1, per tant indica una relaci´o lineal inversa forta.
Pregunta 8: La variable dependent o de resposta e´ s: (A) (B) (C) (D) (E) els 15 estudiants els minuts empleats al Facebook la nota a l’examen final l’examen d’An`alisi de Dades Cap de les anteriors Resposta: La variable dependent o de resposta e´ s la nota a l’examen final, ja que volem veure quin efecte t´e l’´us de Facebook sobre aquesta variable.
Pregunta 9: El pendent de la recta de regressi´o ens indica (A) (B) (C) (D) (E) que per cada minut empleat a la setmana al Facebook la nota baixa un 2% que per cada 100 minuts a la setmana empleats al Facebook la nota baixa 2 punts que per cada 100 minuts a la setmana empleats al Facebook la nota puja 2 punts que per cada minut empleat a la setmana al Facebook la nota puja un 2% Cap d’aquestes opcions e´ s correcta Resposta: El pendent e´ s -0,02, per tant per cada 100 minuts a la setmana la nota canvia en −0.02 · 100 = −2, o sigui baixa en 2 punts.
Pregunta 10: La variable explicativa aconsegueix explicar aproximadament (A) (B) (C) (D) (E) 2% de la variaci´o de la variable dependent 95% de la variaci´o de la variable dependent 90% de la variaci´o de la variable dependent 100% de la variaci´o de lavariable dependent Cap d’aquestes opcions e´ s correcta Resposta: Mirem R2 i multipliquem per 100 per expressar-lo en percentatge.
Pregunta 11: Sabent que a la mostra hi ha un estudiant que est`a 200 minuts al Facebook a la setmana i ha tret un 4, el residu per a aquest cas e´ s (A) (B) (C) (D) (E) 5,17 -1,93 -5,17 1,93 Cap d’aquestes opcions e´ s correcta Resposta: El residu e´ s el valor real menys el valor predit per la recta, e´ s a dir 4 − 9, 93 + 0, 02 · 200 = −1, 93.
Pregunta 12: La recta de regressi´o calculada prediu que un estudiant que est`a 220 minuts al Facebook a la setmana treur`a un: (A) (B) (C) (D) (E) -5,53 -4,4 4,4 5,53 Cap d’aquestes opcions e´ s correcta Resposta: La predicci´o l’obtenim fent 9, 93 − 0, 02 · 220 = 5, 53 minuts.
Respostes a l’examen Universitat Pompeu Fabra ´ Permutaci´o Numero: 9 Usa sols llapis, bol´ıgraf o retolador negre i omple b´e les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix´ı com el grup.
´ i el GRUP.
Omple (marcant les caselles de la plantilla) el DNI, la PERMUTACIO DNI: el teu n´umero de document d’identitat (si no tens, el n´umero que et van assignar en el moment de matricularte).
PERMUT.: Entra un 9 GRUP: Posa el n´umero de grup (amb un 0 endavant) Entra la respostes en les l´ınies de baix, de la 1 a la 12. Cada resposta disposa de dues l´ınies, la primera e´ s per la resposta correcta i la segona per anul·lar en cas d’equivocaci´o: Test en classe 3 Exercici 1: Notes a quatre assignatures Tenim informaci´o sobre les notes de 16 estudiants en quatre assignatures, aix´ı com els diagrames de caixa de les seves notes: En base a aquesta informaci´o contesta les preguntes seg¨uents: Pregunta 1: D’acord amb el que observem als diagrames de caixa (A) (B) (C) (D) (E) la dispersi´o no canvia amb les assignatures no hi ha dispersi´o amb les assignatures hi ha una dispersi´o creixent amb les assignatures hi ha una dispersi´o decreixent amb les assignatures Cap d’aquestes opcions e´ s correcta Resposta: Cap d’aquests opcions e´ s correcta, perqu`e com no hi ha associaci´o no es pot parlar de dispersi´o creixent o decreixent, tot i que la dispersi´o e´ s diversa entre les assignatures Pregunta 2: La relaci´o que observem e´ s de (A) (B) (C) (D) (E) associaci´o negativa entre les notes i l’assignatura.
hi ha associaci´o no lineal dispersi´o creixent associaci´o positiva entre les notes i l’assignatura.
Cap d’aquestes opcions e´ s correcta Resposta: No es pot parlar d’associaci´o positiva o negativa o dispersi´o creixent perqu`e e´ s una variable categ`orica sense ordre.
Pregunta 3: La forma de la distribuci´o (A) no e´ s igual per a totes les assignatures (B) (C) (D) (E) e´ s asim`etrica cap a la dreta per a totes les assignatures e´ s asim`etrica cap a l’esquerra per a totes les assignatures e´ s sim`etrica per a totes les assignatures Cap d’aquestes opcions e´ s correcta Resposta: La forma e´ s igual, sim`etrica, per a totes les assignatures Pregunta 4: Per veure si hi ha relaci´o entre les dues variables s’ha de mirar si hi ha difer`encies en (A) (B) (C) (D) (E) les distribucions de la variable “Notes” condicionades a les assignatures les distribucions de la variable “Assignatura” condicionades a cada possible valor de les notes el coeficient de correlaci´o les distribucions de les variables per separat Cap d’aquestes opcions e´ s correcta Resposta: Es mira si hi ha difer`encies entre les distribucions condicionades a les assignatures, en aquest cas s´ı que hi ha relaci´o perqu`e les distribucions s´on diferents, si m´es no pel que fa a la dispersi´o de les notes que s’observa.
Pregunta 5: La variable “Assignatura” e´ s una variable (A) (B) (C) (D) (E) categ`orica sense ordre categ`orica amb ordre num`erica discreta num`erica cont´ınua Cap d’aquestes opcions e´ s correcta Resposta: Es tracta d’una variable categ`orica sense ordre, perqu`e no prov´e d’una variable num`erica que h`agim agrupat i per tant no t´e un ordre natural.
Pregunta 6: Pel tipus de variable que tenim (A) (B) (C) (D) (E) podem parlar de la direcci´o de l’associaci´o no podem parlar de la direcci´o de l’associaci´o podem calcular un coeficient de correlaci´o podem calcular una recta de regress´ıo´ Cap d’aquestes opcions e´ s correcta Resposta: No podem parlar de la direcci´o de l’associaci´o perqu`e e´ s una variable categ`orica sense ordre.
Exercici 2: Consum i hores d’oci Tenim informaci´o sobre quatre persones en quant al nombre de xiclets que consumeixen i les hores d’oci que fan a la setmana: Mitjana consum xiclets= 4,8 Deviaci´ o t´ ıpica consum xiclets = 2,1 Mitjana hores d’oci = 5,5 Deviaci´ o t´ ıpica hores d’oci = 2,4 Covari` ancia en consum i hores d’oci = 4,2 Volem esbrinar si les hores d’oci afecten al consum de xiclets. Les seg¨uentes f´ormules poden esser d’utilitat: s= n 1 (xi − x¯)2 n − 1 i=1 n 1 (xi − x¯)(yi − y¯) n − 1 i=1 sxy rxy = sx sy sy a = y¯ − b¯ x b=r , sx sxy = Contesta a les preguntes seg¨uents: Pregunta 7: La variable dependent e´ s: (A) (B) (C) (D) (E) la covari`ancia el producte de les desviacions t´ıpiques les hores d’oci el consum de xiclets Cap de les anteriors Resposta: La variable dependent e´ s el consum de xiclets, que e´ s el que intentar´ıem explicar amb les hores d’oci Pregunta 8: El coeficient de correlaci´o e´ s igual a (arrodonit a dos decimals): (A) (B) (C) (D) (E) 0,43 0,83 0 1 Cap d’aquestes opcions e´ s correcta Resposta: El podem calcular mitjanc¸ant la f´ormula r = sxy /(sx sy ).
Pregunta 9: El pendent de la recta de regressi´o e´ s igual a (arrodonit a dos decimals): (A) (B) (C) (D) (E) 0,83 0,73 0 1 Cap d’aquestes opcions e´ s correcta Resposta: El podem calcular mitjanc¸ant la f´ormula b = r(sy /sx ).
Pregunta 10: La variable explicativa aconsegueix explicar aproximadament (A) (B) (C) (D) (E) 10% de la variaci´o de la variable dependent 20% de la variaci´o de la variable dependent 69% de la variaci´o de la variable dependent 100% de la variaci´o de lavariable dependent Cap d’aquestes opcions e´ s correcta Resposta: Calculem R2 i multipliquem per 100 per expressar-lo en percentatge.
Pregunta 11: En aquest cas, La recta de regressi´o (A) (B) (C) (D) (E) e´ s horitzontal e´ s vertical t´e pendent positiu t´e pendent negativa Cap d’aquestes opcions e´ s correcta Resposta: ´ una recta amb pendent positiu, perqu`e el pendent e´ s positiu.
Es Pregunta 12: Segons els resultats que tenim (A) (B) (C) (D) (E) el consum afecta positivament les hores d’oci les hores d’oci afecten positivament el consum les hores d’oci i el consum no estan relacionats el consum e´ s el triple que les hores d’oci Cap d’aquestes opcions e´ s correcta Resposta: Les hores d’oci tenen una relaci´o lineal amb pendent creixent amb el consum de xiclets.
...