SPSS. Conceptes bàsics. (2013)

Resumen Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Sociología - 2º curso
Asignatura Mètodes quantitatius
Año del apunte 2013
Páginas 7
Fecha de subida 01/11/2014
Descargas 22

Vista previa del texto

SPSS Casos – nombre total de files.
Variables – nombre total de files.
La taula de freqüències a més de si són vàlids o valors perduts, ens donen la freqüència, el percentatge, el percentatge vàlid i l’acumulat. (es poden modificar les opcions perquè ens mostri més dades).
Analitzar  Estadístics descriptius  Freqüències (per fer gràfics i taules de freqüència).
Es pot fer doble clic sobre la gràfica per anar al editor de gràfics i retocar-la.
Si prems el botó dret ens surten diverses opcions depèn d’on premis  Propiedades  Podem prémer mostrar etiquetes de dades, perquè ens mostri els % o les freqüències, per exemple. També podem posar un títol a la gràfica. I si premem sobre el text escrit, podem traduir-lo.
En un gràfic circular es pot “desgajar sector” perquè se’ns vegi un cercle com fora de l’altre.
Els gràfics de Pareto es fan: Analizar  Control de calidad  Gráfico de Pareto.
Premerem simple i a l’eje de categorías posarem la variable que volem representar.
Podem canviar una variable que sigui cadena a una numèrica seguint els passos següents: Transformar  Recodificación automàtica  ...  Variable (el nom de la nova variable) Dóna un número i manté les etiquetes, així en comptes de cadena serà numèrica.
Per agrupar valors en classes o categories: Transformar  Recodificar en distintas variables Variable de entrada (la que vols canviar)  Variable de resultado (la que vols crear)  Valores antiguos y nuevos (poses cada valor antic, quin dels nous vols posar-li. Ex. Antiguo 3  Nuevo 1.
O un altre exemple. Valor antiguo (todos los demás valores), valor nuevo (3).
Seguidament pots posar les etiquetes de la nova variable.
Per classificar les edats s’hauria de procedir de la següent forma: Transformar  Recodificar en distintas variables. Variable de entrada (edat), Variable de resultado (nova variable), Valores antiguos y nuevos: Rango INFERIOR (des del mínim) hasta valor x (el que vulguis); Valor antiguo x (del que vulguis) hasta y (on vulguis). Es pot també procedir així amb els valors perduts.
Seguidament pots posar les etiquetes.
Per analitzar dades numèriques tal com hem dit: Analitzar  Estadístics descriptius  Freqüències. (entre altres, pots fer la moda, mitjana, mediana, suma, desviació típica, variança, quartils...) I pots fer també... histogrames, gràfic de barres, de sectors.
L’histograma és pot modificar com els altres gràfics fent doble clic i anant a l’editor de gràfics.
Si existeixen diverses modes, es mostrarà la inferior (dels valors).
Per fer un polígon de freqüències: Gráficos  Cuadro de diálogos antiguos  Líneas.
Si li donem a simple ens mostra una sola línia que uneix cada cas, variable o categoria.
Alhora si li donem a resumenes para grupos de casos, el gràfic resumeix una única variable dins dels subgrups definits per una variable categòrica.
Quan poses la variable a les categorías, comprova (almenys en el cas de la pràctica) que estigui marcat que les línies representen el nombre de casos.
̄) CV (coeficient de variació) = desviació típica (s) / mitjana (𝑥 Per estimar, per exemple, l’esperança de vida, hem de ponderar casos. (donar valor diferent a cada cas). Això es fa de la manera següent: Datos  Ponderar casos  Ponderar casos mediante...
Escollim la variable població (en cas que tractem en països, així tindran un pes o un altre en funció del nombre d’habitants).
És molt important un cop fet el que es volgués amb la ponderació, desfer-la. De la manera següent: Datos  Ponderar casos  No ponderar los casos.
Si treballem amb partits polítics i els volem posar en funció al nombre de vots. Els ponderarem segons la variable vots, pes, freqüència... com li vulguem dir.
Per fer una piràmide de població, un cop tenim les dades premem: Gráficos  Cuadro de diálogos antiguos  Pirámide de población.
Obtener los recuentos de una variable (en l’exemple): variable (recompte), distribución por edat (apareixerà als costats) i segmentar por sex (dividirà la piràmide en dos segons el sexe).
Per treure la població i la resta de dades de l’Idescat fem: Idescat  Censos i padrons (dins de informació territorial)  Població segons sexe i edat (any a any).
Podem relacionar una variable numèrica (com esperança de vida) i una categòrica (com per exemple la regió econòmica) tenint en compte que l’esperança de vida és un numero i la regió classifica segons el tipus de regió els diferents països, de la següent manera: Depenents (la numèrica).
Factors (la categòrica).
Niveles de factores juntos (activat).
De tallo y hojas (desactivat).
També es poden fer gràfics de caixes sense factors, és a dir, sense variable categòrica, per exemple comparant la esperança de vida femenina i la masculina.
Activem dependientes juntas, dins de explorar i posem les dues variables.
També podem posar les dos variables (les dues esperances de vida i fer un gràfic de caixa d’aquestes segons una categòrica com regió.
Es pot crear també una variable que et resti automàticament una variable menys una altra. Ex: una que et resti l’esperança de vida femenina menys la masculina per veure la diferència d’anys.
Transformar  Calcular  Variable de destino (la nova), Expresión numérica: espfidaf – espvidam.
Per fer un gràfic de línies procedim de la següent manera: Gráficos  Cuadro de diálogos antiguos  Líneas. (simple, grupos de casos) Per fer una variable que sigui la superfície, ens haurem de remetre a la seva fòrmula tal que hem de: Tranformar  Calcular variable  Variable de destino (superf), expresión numérica (poblac/densidad).
Per seleccionar només uns casos en concrets i descartar els altres, per exemple, només seleccionant la població femenina o masculina, procedim de la següent forma: Datos  Seleccionar casos  Si se satisface la condición  Si la op...
Escriviu la fòrmula ex. Sex = 2. Edat <19. Però si feu varies coses utilitzeu la tecla &.
Només treballem, amb tot, amb l’opció descartar casos no seleccionados.
Si fem ara una taula de freqüències, ens sortirà només la mostra seleccionada.
Per desfer-ho: Datos  Seleccionar casos  Todos los casos.
Amb ~= aquest símbol ens referim a quan pren un valor diferent de... Si no volem els valors 1 i 9 a la expressió numèrica utilitzarem aquest símbol.
Símbols principals.
= ~= <<= >>= &(AND) |(OR) A l’hora de segmentar un arxiu hem de tenir en compte diverses opcions: Si premem comparar els grups, les taules dels descriptius apareixeran juntes; si premem organitzar els resultats per grups ens sortiran per separat.
Datos  Segmentar archivo  Comparar los grupos (en l’exemple).
Si després fas Analitzar  Estadístics descriptius, els veus separats per les variables que has dit.
Per des-fer la segmentació: Datos  Segmentar archivo  Analizar todos los casos.
La normal o corba de gauss...
Simètrica a la mitjana.
Per fer-la cal activar l’opció mostrar curba normal on l’histograma.
La normal ve donada per la seva mitjana i desviació típica.
Per saber quin % de llars té una despesa inferior a... entre... o superior a... farem ús de la normal.
Ens donaran el valor de la mitjana i la desviació i nosaltres haurem de: Transformar  Calcular  Variable de destino (nom de la nova variable) i d’expressió numèrica posem CDF.Normal (variable, mitjana, desviació) ex: CDF.Normal(X, 6000.200).
Se’ns crea una nova variable, recordem posar tants decimals com vulguem.
Amb aquesta funció ens dóna l’acumulat fins a... de tal manera que... si ens surt al costat del valor 8000 un ,735 vol dir que el 73,5% té una despesa inferior a 8000€. Per fer la superior restem 100-73,5 i ens sortirà. Per fer el entre tal i tal restem el nombre del més gran menys el del més petit.
Per fer intervals de confiança hem de tenir en compte: Aquesta tercera formula respon a l’interval de confiança que és la p més l’error, per saber l’error: La z és un valor tipificat tal que z= 1.96 per un nivell de confiança del 95%, z=2 per NC 95.5% i z=2.58 per NC 99%.
La n és la mostra (població). També podem fer aquesta altra formula: Aquest és el mètode de màxima incertesa. L’anterior era el d’estimació de l’error.
Per fer l’interval de confiança se li ha de restar i sumar l’error. Ex. 0,80-0,86.
Si la desviació poblacional és desconeguda, els intervals de confiança no es fan amb la normal sinó amb la T Student.
Analizar  Estadísticos descriptivos  Explorar.
Per defecte es calcula amb un 95% de nivell de confiança, però es pot canviar.
L’interval de confiança serà (límit inferior, límit superior –de l’interval de confiança-) amb aquesta opció ja ens surt. Per tant, l’error serà la meitat de l’amplitud. Superiorinferior/2 i el resultat / 2.
Per altra banda, si tenim la n, podem fer la formula següent: (n 1222) Ens dóna l’error.
Per inferència, amb el procediment explorar et dóna les dades necessàries per tenir la mitjana i els intervals de confiança, marge d’error... Estimació puntual de la mitjana fa referència a la mitjana.
Per comparar dues variables per una altra. Exemple. Comparar escriptura i ciències per sexes. Procedirem de la següent manera: Gráficos  Diagrama de caixa  Agrupados  Resumenes de distintas variables  Definir  Las cajas representan escript i ciencies . Eje de categorías sex.
Per comparar les mitjanes: Analitzar  Comparar medias  Test T para muestras independientes  Contrastar variables escript ciencia  Variable de agrupación sexe  Definir grupo 1 – 1 ; 2 – 2.
Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas F ESCRIPT CIENCIA Se han asumido varianzas iguales No se han asumido varianzas iguales Se han asumido varianzas iguales No se han asumido varianzas iguales Sig.
11,133 3,609 ,001 ,059 Prueba T para la igualdad de medias t gl Sig. (bilateral) Diferencia de medias Error típ. de la diferencia 95% Intervalo de confianza para la diferencia Inferior Superior -3,734 198 ,000 -4,87 1,304 -7,442 -2,298 -3,656 169,707 ,000 -4,87 1,332 -7,499 -2,241 1,812 198 ,071 2,53 1,398 -,223 5,290 1,785 176,555 ,076 2,53 1,420 -,268 5,335 Si es < o = a 0,05 el sig bilateral, existeixen diferències significatives entre homes i dones, en aquest cas, i amb un 5% de risc.
Si és > a 0,05 no existeixen diferències significatives.
Aquesta formula ens diu quina hauria de ser la mida (n) de la mostra per un error x: 𝑧2 6.6564 𝑛= = = 4160.25 4 · 𝑒 2 0.0016 En aquest cas és 4161, perquè sempre s’arrodoneix a l’alça.
...