Ejercicios resueltos 2 (2014)

Ejercicio Español
Universidad Universidad Pompeu Fabra (UPF)
Grado Ciencias empresariales-Management - 1º curso
Asignatura Analisi de dades
Año del apunte 2014
Páginas 13
Fecha de subida 30/09/2014
Descargas 1
Subido por

Vista previa del texto

�espostes a l’examen Universitat Pompeu Fabra - An` alisi de Dades Permutaci´ o N´ umero: 1 Examen de Desembre 2009 L’examen consta de 8 exercicis diferents (Exercicis I-VIII). Els exercicis I a IV s’hauran de contestar en les plantilles de respostes que es proveeixen. Cada pregunta compta 1 punt si es respon correctament i resta un quart de punt si la resposta ´es incorrecta. Aquestes preguntes es corregiran mec`anicament, aix´ı que assegureu-vos d’entrar les respostes correctament a les plantilles.
Els Exercicis V a VIII es contesten en fulls d’examen que s’han de lliurar. No es pot utilitzar m´es d’un full per pregunta i s’han de contestar cada una en fulls separats. Aquests quatre exercicis es corregiran de forma manual. Les respostes incorrectes d’aquestes parts no compten negativament. Escriviu de forma clara i precisa.
El total de punts a guanyar de cada exercici consta en el t´ıtol de l’exercici.
Instruccions per omplir les plantilles �Exercicis I-IV) Usa sols llapis, bol´ıgraf o retolador negre i omple b´e les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix´ı com el grup.
´ i el GRUP.
Omple �marcant les caselles de la plantilla) el DNI, la PERMUTACIO DNI: el teu n´ umero de document d’identitat (si no tens, el n´ umero que et van assignar en el moment de matricular-te).
PERMUT.: Entra un 1 GRUP: Posa el n´ umero de grup (amb un 0 endavant, o sigui, 01, 02, 03 ´o 04).
Entra les respostes en les l´ınies de baix. Cada resposta disposa de dues l´ınies, la primera ´es per la resposta correcta i la segona per anul∙lar en cas d’equivocaci´o: Instruccions per contestar els exercicis V a VIII Contesta cada pregunta en un full separat. Pots utilitzar llapis o tinta. No t’oblidis de posar el teu nom, DNI o NIA i grup en cada full.
Distribueix-te el temps adequadament� MOLT BONA SORT� Exercici 1: Immigraci´o (10 punts) El seg¨ uent conjunt de dades mostra el percentatge de la poblaci´o d’immigrants a diferents comarques de Barcelona: Comarca Taxa d’immigrants Bergued`a 9,9 Osona 13,8 Bages 10,8 Vall`es Occidental 11,3 Vall`es Oriental 11,1 Anoia 9,4 Alta Pened`es 12,0 Garraf 15,5 Baix Llobregat 10,9 Barcelon`es 17,1 Maresme 11,8 Font: IDESCAT 2008 En base a aquesta informaci´o contesta les preguntes seg¨ uents: Pregunta 1: En aquest conjunt de dades, un individu ´es (A) (B) (C) (D) (E) un pa´ıs una comarca un any una taxa d’immigrants Cap de les respostes anteriors ´es correcta Resposta: Cada cas representa una comarca, per tant els individus s´on les comarques.
Pregunta 2: La variable “taxa d’immigrants” ´es (A) (B) (C) (D) (E) categ`orica discreta qualitativa num`erica categ`orica cont´ınua Cap de les respostes anteriors ´es correcta Resposta: Es tracta del percentatge d’immigrants, per tant num`erica.
Pregunta 3: Construeix un diagrama de tronc i fulles per a aquesta distribuci´o (no arrodoneixis ni desdoblis els troncs). El nombre de troncs del diagrama ´es: (A) (B) (C) (D) (E) 10 9 Menys de 9 11 Cap de les respostes anteriors ´es correcta Resposta: El diagrama de tronc i fulles ´es: 9 1� 11 12 13 14 15 16 17 | | | | | | | | | 49 89 138 � 8 5 1 Per tant el nombre de tronc ´es 11.
Pregunta 4: Quina ´es la unitat de la fulla? (A) (B) (C) (D) (E) 0,1 1 Les desenes Les mil∙l`esimes Cap de les anteriors ´es correcta Resposta: Les fulles corresponen al primer lloc decimal despr´es de la coma, per tant la unitat de la fulla ´es 0,1.
Pregunta 5: El primer quartil es troba a (A) (B) (C) (D) (E) 11,3 Entre 11,1 i 11,3 11,8 Entre 11,3 i 11,8 Cap de les respostes anteriors ´es correcta Resposta: El primer quartil ´es la mediana dels valors que s´on m´es petits que la mediana de veritat, per tant es troba entre 10,8 i 10,9.
Pregunta 6: D’acord amb el diagrama de tronc i fulles constru¨ıt, el centre (la mediana) de la distribuci´o ´es (A) (B) (C) (D) (E) Entre 11,3 i 11,8 11,3 12,0 11,8 Cap de les respostes anteriors ´es correcta Resposta: S´on 11 casos, per tant el sis`e ´es el centre (mediana) : 11,3 Pregunta 7: Ara volem arrodonir el nombre de troncs ajustant els decimals. El nou diagrama de tronc i fulles d´ona un nombre de troncs (sense desdoblar els troncs) de: (A) (B) (C) (D) (E) 9 entre 7 i 8 menys de 8 el mateix nombre de troncs d’abans Cap de les respostes anteriors ´es correcta Resposta: Els percentatges arrodonits s´on: 10, 14, 11, 11, 11, 9 , 12 , 16, 11, 17, 12. Per tant el nou diagrama de tronc i fulles ´es ara: � | 9 1 | �111122457 Aix´ı hi ha dos troncs.
Pregunta 8: Despr´es d’haver arrodonit el nombre de troncs ajustant els decimals, la moda de la distribuci´o ´es: (A) (B) (C) (D) (E) 12 10 11 10,8 Cap de les respostes anteriors ´es correcta Resposta: Un cop arrodonits els percentatges, el valor m´es repetit ´es 11 (es repeteix 4 cops), aix´ı la moda ´es 11.
Ara considerem un altre conjunt de dades, basat en la distribuci´o del consum de tabac de 10 joves durant el cap de setmana, que trobem descrit en el seg¨ uent diagrama de caixa: En base a aquest diagrama de caixa contesta aquestes dues u ´ ltimes preguntes a aquest exercici: Pregunta 9: La dispersi´o de la distribuci´o ´es (A) (B) (C) (D) (E) una mica menys de 7 una mica menys de 6 una mica menys de 3 una mica menys de 5 Cap de les respostes anteriors ´es correcta Resposta: Mirant l’amplada de la caixa, que ens d´ona el rang interquart´ılic i per tant la dispersi´o, veiem que ´es una mica menys de 5.
Pregunta 10: La forma de la distribuci´o ´es (A) (B) (C) (D) (E) Asim`etrica cap a l’esquerra Asim`etrica cap a la dreta Aproximadament sim`etrica Asim`etrica cap al centre Cap de les respostes anteriors ´es correcta Resposta: Veiem que malgrat el valor at´ıpic a la dreta, el tercer quartil est`a m´es a prop de la mediana que el primer quartil, a m´es les freq¨ u`encies s’estenen m´es cap a l’esquerra i estan m´es concentrades a la dreta, per tant la distribuci´o ´es asim`etrica cap a l’esquerra.
Exercici 2: Pluges al Tur´o de l’Home (6 punts) Durant els u ´ ltims 50 anys, el nivell de pluges al Tur´o de l’Home segueix una distribuci´o aproximadament normal amb una mitjana de 19 ll/m� (litres per metre quadrat) i una desviaci´o est`andard de 4 ll/m� .
Feu els c`alculs que es demanen a continuaci´o.
Pregunta 11: Usant la regla del 68-95-99,7%, quin ´es el nivell aproximat de pluges m`axim del 16% de dies amb menys pluges? (A) (B) (C) (D) (E) 15 ll/m� 11 ll/m� 27 ll/m� 23 ll/m� Cap de les respostes anteriors es correcta Resposta: Aquest ´es el percentatge que ens queda a l’esquerra de la distribuci´o quan al voltant de la mitjana hi ha un 68% de les freq¨ u`encies, per tant hem de fer mitjana menys una desviaci´o t´ıpica, 19 - 4 = 15.
Pregunta 12: Usant la regla del 68-95-99,7%, quin percentatge aproximat d’anys ha plogut menys de 23 ll/m� ? (A) (B) (C) (D) (E) 68% 84% 32% 16% Cap de les respostes anteriors es correcta Resposta: 23 ´es una desviaci´o t´ıpica per sobre de la mitjana (19+4), per tant correspon a la part de la regla del 68% al voltant de la mitjana, i com es demana les freq¨ u`encies totals a l’esquerra d’aquest valor ´es 68+ 16= 84%.
Pregunta 13: Usant la regla del 68-95-99,7%, quin percentatge d’anys ha plogut entre 7 i 31 ll/m� ? (A) (B) (C) (D) (E) 100% 95% 68% 99,7% Cap de les respostes anteriors es correcta Resposta: Aquest interval ´es exactament 3 desviacions t´ıpiques per sota i 3 desviacions t´ıpiques per sobre de la mitjana, per tant 99,7%.
Pregunta 14: Quin ´es el nivell aproximat de pluges m´ınim dels 5% dels anys en qu`e ha plogut m´es? (A) (B) (C) (D) (E) 23,2 27,0 25,6 23,1 Cap ll/m� ll/m� ll/m� ll/m� de les respostes anteriors es correcta Resposta: Busquem el valor z de la taula que deixi un 95% a l’esquerra, i trobem que ens serveix tant z = 1� 64 com z = 1� 65. Desestandaritzem amb el primer valor: x = 19 + 1� 64 × 4 = 25� 56 que arrodonint a un decimal d´ona 25,6. Si ho fem amb el segon valor z = 1� 65 obtenim exactament 25,6, per tant el valors aproximat ´es en ambd´os casos aquest.
Pregunta 15: Usant la regla del 68-95-99,7%, quin ´es el nivell aproximat de pluges m´ınim dins el 2,5% dels anys amb m´es pluges? (A) (B) (C) (D) (E) 11 ll/m� 15 ll/m� 23 ll/m� 27 ll/m� Cap de les respostes anteriors es correcta Resposta: 2,5% ´es el percentatge de freq¨ u`encies que queda a la dreta de la distribuci´o quan hi ha un 95% de freq¨ u`encies al voltant de la mitjana, per tant el valor buscat ´es la mitjana m´es dues desviacions t´ıpiques, 19 + 2 × 4 = 27.
Pregunta 16: Quina forma ha de tenir la distribuci´o de pluges perqu`e els c`alculs fets en aquest exercici siguin v`alids? (A) Asim`etrica cap a la dreta (B) Asim`etrica cap a l’esquerra (C) Sim`etrica (D) Multimodal (E) Cap de les respostes anteriors es correcta Resposta: La distribuci´o ha de ser sim`etrica, sin´o no seria una distribuci´o normal i els c`alculs no serien v`alids.
Exercici 3: Entrenament i resultat final (6 punts) Recollim informaci´o sobre el resultat de l’´ ultim entrenament en la prova de 100 metres llissos entre 10 atletes, i el posterior resultat en una prova oficial i volem veure si l’´ ultim entrenament influeix sobre el resultat de la prova. Hem marcat dos casos amb lletres A i B: Amb aquesta informaci´o contesta les preguntes seg¨ uents: Pregunta 17: El residu corresponent al cas A (A) (B) (C) (D) (E) tindr`a signe negatiu i no ser`a el m´es gran en valor absolut tindr`a signe positiu i ser`a el m´es gran en valor absolut tindr`a signe negatiu i ser`a el m´es gran en valor absolut tindr`a signe positiu i no ser`a el m´es gran en valor absolut Cap d’aquestes opcions ´es correcta Resposta: Per al residu A la recta (valor predit) est`a per sota del valor real, i com el residu ´es el valor real menys valor predit, ser`a positiu. A m´es no ´es el punt m´es allunyat de la recta per tant no ser`a el m´es gran en valor absolut.
Pregunta 18: El residu corresponent al cas B (A) tindr`a signe negatiu i no ser`a el m´es gran en valor absolut (B) tindr`a signe positiu i no ser`a el m´es gran en valor absolut (C) tindr`a signe positiu i ser`a el m´es gran en valor absolut (D) tindr`a signe negatiu i ser`a el m´es gran en valor absolut (E) Cap d’aquestes opcions ´es correcta Resposta: Per al residu B la recta (valor predit) est`a per sobre del valor real, i com el residu ´es valor real menys valor predit, ser`a negatiu. A m´es ´es el punt m´es allunyat de la recta per tant ser`a el m´es gran en valor absolut.
Pregunta 19: El cas A ´es (A) (B) (C) (D) (E) una observaci´o ni influent ni at´ıpica una observaci´o at´ıpica per`o no influent una observaci´o influent per`o no at´ıpica una observaci´o at´ıpica influent Cap d’aquestes opcions ´es correcta Resposta: El cas A ´es una observaci´o at´ıpica, ja que la veiem for¸ca apartada de la resta, i ´es influent perqu`e ´es at´ıpica respecte a la variable explicativa (queda allunyada de la seva mitjana).
Pregunta 20: El cas B ´es (A) (B) (C) (D) (E) una observaci´o at´ıpica influent una observaci´o at´ıpica per`o no influent una observaci´o influent per`o no at´ıpica una observaci´o ni influent ni at´ıpica Cap d’aquestes opcions ´es correcta Resposta: El cas B ´es una observaci´o at´ıpica, ja que la veiem for¸ca apartada de la resta, i no ´es influent perqu`e no ´es at´ıpica respecte a la variable explicativa (no queda allunyada de la seva mitjana) sin´o u ´ nicament respecte a la variable dependent.
Pregunta 21: Si eliminem el cas A de les dades, el pendent de la recta (A) (B) (C) (D) (E) canviar`a substancialment es far`a quadr`atica no canviar`a substancialment es far`a igual a 0 Cap d’aquestes opcions ´es correcta Resposta: Canviar`a substancialment perqu`e ´es una observaci´o influent.
Pregunta 22: Si eliminem el cas B de les dades, el pendent de la recta (A) (B) (C) (D) (E) es far`a igual a 0 canviar`a substancialment no canviar`a substancialment es far`a quadr`atica Cap d’aquestes opcions ´es correcta Resposta: No canviar`a substancialment perqu`e no ´es una observaci´o influent.
Exercici 4: Distribuci´o Educaci´o - Edat 6 punts Tenim informaci´o d’una enquesta sobre Educaci´o i Edat de 41.247 individus, que podem trobar a la taula seg¨ uent: Pregunta 23: La distribuci´o marginal per la variable Edat t´e les seg¨ uents freq¨ u`encies relatives: (A) (B) (C) (D) (E) No es pot deduir amb aquesta informaci´o 25-34=0,35, 35-66=0,34, >55=0,31 25-34=0,03, 35-66=0,05, >55=0,10 25-34=0,25, 35-66=0,44, >55=0,31 Cap de les respostes anteriors s´on correctes Resposta: La distribuci´o marginal de la variable Edat ´es la distribuci´o per edats ignorant l’educaci´o, per tant per exemple total de gent 25-34 (41382) dividit pel total de la mostra (166430), o sigui 41382/166430=0,25, i aix´ı successivament per als altres grups d’edat.
Pregunta 24: La freq¨ u`encia relativa corresponent a l’Edat >55 dintre dels Estudis de Secund`aria ´es (A) (B) (C) (D) (E) 0,29 0,32 0,41 0,27 Cap de les respostes anteriors s´on correctes Resposta: Hi ha un total de 56451 que han cursat Secund`aria, dels quals 18320 tenen >55, per tant 18320/56451=0.3245.
Pregunta 25: La distribuci´o marginal de la variable Educaci´o t´e les seg¨ uents freq¨ u`encies relatives: (A) (B) (C) (D) (E) Menys de Secund`aria=0,28, Secund`aria=0,24, Diplomatura=0,25 i Llicenciatura=0,23.
Menys de Secund`aria=0,18, Secund`aria=0,34, Diplomatura=0,25 i Llicenciatura=0,23.
No es pot deduir amb aquesta informaci´o Menys de Secund`aria=0,03, Secund`aria=0,08, Diplomatura=0,07 i Llicenciatura=0,06.
Cap de les respostes anteriors s´on correctes Resposta: La distribuci´o marginal de la variable Educaci´o ´es la distribuci´o per nivells educatius independentment de l’edat, per tant per exemple total de gent amb estudis Menys de Secund`aria (30512) dividit pel total de gent a la mostra (166430), o sigui 30512/166430=0,18, i aix´ı successivament per als altres nivells educatius.
Pregunta 26: En la distribuci´o condicionada a tenir entre 35 i 55 anys, la variable Educaci´o t´e una freq¨ u`encia absoluta per a “Menys de Secund`aria” igual a (A) (B) (C) (D) (E) 19878 9152 11654 24070 Cap de les respostes anteriors s´on correctes Resposta: Si mirem la columna corresponent a 35-55, veiem que a Menys de Secund`aria li correspon una freq¨ u`encia absoluta de 9152.
Pregunta 27: La freq¨ u`encia relativa corresponent a Estudis de Secund`aria per als d’edat >55 ´es (A) (B) (C) (D) (E) 0,39 0,35 0,27 0,42 Cap de les respostes anteriors s´on correctes Resposta: Hi ha un total de 52022 de gent >55, dels quals 18320 tenen estudis de Secund`aria, per tant 18320/52022= 0,3522.
Pregunta 28: Les dues variables categ`oriques (A) (B) (C) (D) (E) Mostren una associaci´o negativa Tenen relaci´o S´on independents, no tenen relaci´o Mostren una associaci´o positiva Cap de les respostes anteriors s´on correctes Resposta: Les distribucions condicionals s´on diferents, per exemple entre els >55 hi ha m´es proporci´o de gent amb nivells educatius baixos que als altres grups d’edat, i per tant s´ı que hi ha relaci´o.
Exercici 5: Contesta en un full a part – Corba de densitat (6 punts) La seg¨ uent corba de densitat representa una distribuci´o que volem descriure: En base al que observes a la gr`afica, contesta la preguntes seg¨ uents: Pregunta 29: Comenta sobre la forma de la distribuci´o Resposta: La distribuci´o ´es asim`etrica cap a la dreta, ja que els valors s’estenen cap a la dreta de la distribuci´o.
Pregunta 30: Sabent que els punts A, B i C representen mesures de centre, indica que representa cadasc´ u dels punts A, B i C.
Resposta: A representa la moda, B la mediana i C la mitjana.
Exercici 6: Contesta en full a part - Dues variables num`eriques (6 punts) En aquest exercici haur`as d’inventar-te 3 conjunts de dues variables num`eriques X i Y amb u ´ nicament 4 observacions cadasc´ u, totes diferents, que compleixin les seg¨ uents caracter´ıstiques: Pregunta 31: Per al primer conjunt el coeficient de correlaci´o entre X i Y ha de ser exactament igual a 1.
Resposta: Els punts han de caure tots exactament sobre una l´ınia recta. Per exemple: X 1 2 3 4 Y 1 2 3 4 Pregunta 32: Per al segon conjunt de dades el coeficient de correlaci´o entre X i Y ha de ser exactament igual a 0.
Resposta: Ha de ser un conjunt de dades on la dispersi´o de les dades sigui m`axima, ´es a dir que no es pugui esbrinar cap mena de relaci´o, perqu`e la covari`ancia sigui 0. Qualssevol 4 valors que estiguin en els v`ertexs d’un quadrat acompliran aix`o, ja que les desviacions respecte a la mitjana es cancel∙laran entre elles. Per exemple: X 1 1 -1 -1 Y 1 -1 -1 1 Pregunta 33: Per al tercer conjunt de dades, la R� ha de ser exactament igual a 0.
Resposta: Aquest ´es un cas molt similar a l’anterior, perqu`e la R� ´es simplement el coeficient de correlaci´o al quadrat i perqu`e sigui 0 ha de ser 0 el coeficient de correlaci´o. Per tant, un conjunt que serviria ´es el mateix conjunt que a la pregunta anterior o qualsevol altre semblant, per exemple: X 2 2 -2 -2 Y 2 -2 -2 2 Exercici 7: Contesta en un full a part – Transformaci´o de dades (5 punts) A l’empresa Palauet de la M´ usica SA la mitjana dels salaris pagats per mes ´es de 2000 euros i la desviaci´o t´ıpica ´es de 1000 euros. A m´es sabem que la mediana ´es de 1800 euros, el primer quartil ´es de 1200 euros i el tercer quartil ´es de 2300 euros. Durant l’any l’empresa fa una pujada de 100 euros a tots els treballadors. Posteriorment sobre el nou apujat en 100 euros es d´ona una pujada de 10%.
Pregunta 34: Troba la mitjana, la mediana i la desviaci´o t´ıpica dels sous d’aquesta empresa despr´es de les pujades.
Resposta: Mitjana: (2000 + 100) × 1� 10 = 2310. Mediana= (1800 + 100) × 1� 10 = 2090. Desviaci´o t´ıpica = 1000 × 1� 10 = 1100.
Pregunta 35: Troba el nou rang interquart´ılic despr´es de las pujades.
Resposta: Rang interquart´ılic= (2300 − 1200) × 1� 10 = 1210.
Exercici 8: Contesta en un full a part – C`alcul de mesures amb dades agrupades (5 punts) La seg¨ uent taula d´ona el nombre de furts a la L´ınia 1 del Metro durant 25 hores consecutives: Furts Freq¨ u`encia 0-1 10 1-2 6 2-3 5 3-4 2 4-5 1 5-6 1 Pregunta 36: Calcula valors aproximats per al primer quartil, la mediana i el tercer quartil.
Resposta: El primer quartil est`a al lloc (25 +1)/4 = 6,5, o sigui al primer interval, per tant el seu valor aproximat ´es 0,5. La mediana est`a al lloc (25+1)/2=13, per tant est`a al segon interval, i el seu valor aproximat ´es 1,5. I per u ´ ltim el tercer quartil est`a al lloc 3(25+1)/4 = 19,5, o sigui el tercer interval, i el seu valor aproximat ´es 2,5.
Pregunta 37: Calcula una mitjana aproximada Resposta: Aplicant la f´ormula: (0� 5 ∙ 10 + 1� 5 ∙ 6 + 2� 5 ∙ 5 + 3� 5 ∙ 2 + 4� 5 ∙ 1 + 5� 5 ∙ 1)/25 = 1� 74 Pregunta 38: Indica como calcularies una desviaci´o t´ıpica aproximada, per`o no facis els c`alculs.
Resposta: Per calcular una desviaci´o t´ıpica aproximada haur´ıem de calcular la desviaci´o respecte a la mitjana de cada marca de classe, elevar-lo al quadrat, multiplicar per la freq¨ u`encia de cada interval, sumar tots els termes, dividir per 25-1 i finalment prendre l’arrel quadrada d’aquest resultat final.
...