PRÁCTICA 3.1 (2015)

Apunte Español
Universidad Universidad Pompeu Fabra (UPF)
Grado Medicina - 2º curso
Asignatura Bioestadística
Año del apunte 2015
Páginas 6
Fecha de subida 20/04/2016
Descargas 5
Subido por

Vista previa del texto

BIOESTADÍSTICA PRÁCTICA 3: Estadística descriptiva con SPSS y R Datos de partida: Tabla ! recoge datos relativos a unos 6000 partos atendidos en el Hospital del Mar de Barcelona entre los años 1991 y 1999. Ha sido anonimizada para poder trabajar sobre ella sin infringir ninguna norma ética ni vulnerar los derechos de privacidad de los pacientes.
La tabla recoge las siguientes variables: - ANYPART: Año de parto, la tabla recoge datos entre 1991 y 1999 - MESPART: Mes del parto - DIAPART: Día del parto - TRIMESTR: Trimestre del año en el cual se produjo el parto - GESTACIO: Tipo de gestación (prematura o “a término”) - PESNADO: Peso del neonato - EDATMARE: Edad de la madre en el momento del parto Objetivos de la práctica: Obtención de estadísticos descriptivos a partir de la tabla completa de datos. En concreto, estamos interesados en conocer cuál es el peso de los niños y las edades de las madres.
Protocolo: 1. Descarga el fichero partos1.xls, que puedes encontrar en la carpeta practicas del Tema 3.
2. Abre el documento con Excel para inspeccionar los datos.
3. Anota el número objetos y de variables, así como el nombre y tipo de las variables.
" Nº objetos ! 6043 " Nº Variables !7 " Nombre y tipo de Variables ! - Año de parto - Variable cuantitativa discreta - Mes de parto - Variable cuantitativa discreta - Día de parto - Variable cuantitativa discreta - Trimestre – Variable cuantitativa discreta - Gestación – Variable cualitativa nominal - Peso del niño – Variable cuantitativa continua - Edad de la madre – Variable cuantitativa continua 4. Cierra Excel antes de continuar.
5. Importar la tabla en el programa SPSS. Usa la opción Archivo>>>Abrir y selecciona en el recuadro “Archivos de Tipo”, la opción “Excel”. En el cuadro de diálogo, asegúrate de marcar la opción “Leer los nombres de las variables”.
Programa SPSS 6. Analizar los pesos de los niños selecciona Analizar>>Estadísticos descriptivos>>Frecuencias. En el cuadro de diálogo selecciona la variables “PESNADO” y haz clic en la flecha para añadirla a la lista de variables a analizar. Deselecciona la opción de “Mostrar Tabla”. Pulsa el botón “Estadísticos” para seleccionar obtener estadísticos de tendencia central y de dispersión. Pulsa el botón “Gráficos” para seleccionar el mostrar un histograma. Pulsa “Aceptar”. Anota los resultados.
RESULTADOS- Pes Nado Estadísticos PESNADO N Válidos 6042 Perdidos 0 Media 3169,59 Error típ. de la media 7,112 Mediana 3190,00 Moda 3200 Desv. típ.
552,815 Varianza 305604,205 Rango 6530 Mínimo 0 Máximo 6530 Suma 19150657 PESNADO Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado 0 gr 24 ,4 ,4 ,4 33 1 ,0 ,0 ,4 49 1 ,0 ,0 ,4 615 1 ,0 ,0 ,4 680 1 ,0 ,0 ,5 740 1 ,0 ,0 ,5 750 1 ,0 ,0 ,5 800 1 ,0 ,0 ,5 810 1 ,0 ,0 ,5 … … … … … 6530 1 ,0 ,0 Total 6042 100,0 100,0 100,0 7. Se observa en el histograma que algunos individuos tienen peso 0. Elimina estos casos usando el comando Datos>>>Seleccionar Casos… y repite el análisis descriptivo. Anota los resultados.
# Se han eliminado de los tres primeros casos en orden de un peso mínimo razonable para que el bebé sobreviva cuando nazca. Son casos imposibles (0, 33, 49 gr) RESULTADOS- Pes Nado después del paso 7 Estadísticos PESNADO N Válidos 6016 Perdidos 0 Media 3183,27 Error típ. de la media 6,617 Mediana 3200,00 Moda 3200 Desv. típ.
513,223 Varianza 263398,343 Rango 5915 Mínimo 615 Máximo 6530 Suma 19150575 PESNADO Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado 615 1 ,0 ,0 ,0 680 1 ,0 ,0 ,0 1 ,0 ,0 ,0 750 1 ,0 ,0 ,1 800 1 ,0 ,0 ,1 810 1 ,0 ,0 ,1 … … … … … 740 8. Analiza ahora la edad de las madres obteniendo los mismos estadísticos de tendencia central y dispersión. Anota los resultados.
RESULTADOS- Edat Mare Estadísticos EDATMARE N Válidos 6016 Perdidos 0 Media 27,87 Error típ. de la media ,074 Mediana 28,00 Moda 28 Desv. típ.
5,753 Varianza 33,093 Rango 41 Mínimo 12 Máximo 53 Suma 167644 EDATMARE Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado 12 1 ,0 ,0 ,0 13 1 ,0 ,0 ,0 14 6 ,1 ,1 ,1 … … … … … 1 ,0 ,0 100,0 6016 100,0 100,0 53 Total 9. Construir unos diagramas de caja que representen las edades de las madres que han dado a luz en los diferentes trimestres del año. Usa el comando Gráficos>>Diagramas de caja para generar el grafico.
10. En el cuadro de diálogo selecciona la edad de la madre como variable a estudiar y “trimestr” como eje de categorías. Observa los gráficos y toma nota de todo lo que te parezca interesante.
Resumen del procesamiento de los casos Casos Válidos TRIMESTR EDATMARE N Perdidos Porcentaje N Total Porcentaje N Porcentaje 1 1445 100,0% 0 ,0% 1445 100,0% 2 1397 100,0% 0 ,0% 1397 100,0% 3 1589 100,0% 0 ,0% 1589 100,0% 4 1585 100,0% 0 ,0% 1585 100,0% COMENTARIO: 11. Repetiremos ahora el análisis utilizando el programa R. Comienza por abrir el fichero con Excel y exportarlo en formato CSV a una carpeta que tenga una dirección sencilla (por ejemplo "C:\temp").
12. Sigue el procedimiento que se describe en la “Breve introducción a R” para importarlo y obtener un objeto llamado “partos” de tipo data.frame.
El comando final tendrá un formato similar a: > partos <- read.csv("c:/temp/partos1.csv",sep=";",header=TRUE) ...