Práctica R 3 (2017)

Ejercicio Español
Universidad Universidad Internacional de Cataluña (UIC)
Grado Medicina - 2º curso
Asignatura Bioestadística
Año del apunte 2017
Páginas 8
Fecha de subida 01/11/2017
Descargas 0
Subido por

Vista previa del texto

PRÁCTICA 3: Estadística descriptiva univariante 1. Abre R, una vez dentro abre el script practica3.r. En la parte inicial del script hay un resumen del código utilizado en las sesiones anteriores. Abre los datos de esta práctica (pr3.txt).
2. Empezaremos por hacer la descriptiva numérica de una variable cualitativa. Para ello se necesitan dos cosas: la frecuencia absoluta y la frecuencia relativa (o porcentaje) de cada categoría de la variable.
a. Ejecuta el código de ejemplo de este apartado, donde se obtiene la frecuencia absoluta y relativa para la variable sexo.
1 b. Al hacer una tabla de frecuencias, se pueden establecer dos ordenaciones. Si la variable es ordinal (por ejemplo, nivel de inglés), las categorías se colocan por filas en su orden natural de menor a mayor (sin nivel, first certificate, advanced,…). Si la variable es nominal (carrera que estudias), las categorías no tienen un orden natural y se ordenan por filas de mayor a menor frecuencia. Construye la tabla de frecuencias de las variables Sexo y Nivel educativo.
Nivel educativo F.Absoluta Sin estudios Primarios Secundarios Superiores Universitarios 122 212 467 49 150 F.Absoluta acumulada 122 334 801 850 1000 F. relativa F. Relativa Acumulada 0,122 0,212 0,467 0,049 0’150 0,122 0’334 0’801 0’850 1 c. Añade las frecuencias absolutas acumuladas y relativas acumuladas en el Nivel educativo y responde a las siguientes preguntas: ¿Cuál es la moda de la variable? ¿Cuántos individuos no tienen estudios? ¿Qué porcentaje de individuos tienen estudios universitarios? ¿Y qué porcentaje tiene estudios secundarios o inferiores? Moda= Estudios secundarios 122 individuos no tienen estudios El 15% tiene estudios universitarios 80,1% de los individuos tiene estudios secundarios o inferiores.
2 3. A continuación veremos la descriptiva numérica de una variable cuantitativa. Si la variable toma pocos valores que se repiten a menudo, puede tener sentido hacer una tabla de frecuencias como en el ejercicio anterior. Si no es así, se prescinde de la tabla y se calculan estadísticos descriptivos.
a. Ejecuta el código de ejemplo. ¿Qué hace la función la quantile? Calcula el primer y el tercer cuartil de la variable edad.
b. Es posible pedir a R todos los estadísticos, a la vez. Se necesita instalar (si no se ha instalado antes) y cargar (siempre) el paquete EnvStats. Ejecuta el código de ejemplo, donde se instala y carga el paquete vía código y se prueba la instrucción correspondiente.
3 c. Crea el código para describir numéricamente las variables IMC y peso.
d. A partir del resultado del apartado anterior, responde a estas preguntas: ¿Por encima de qué valor está la mitad de los individuos en la variable peso? ¿Cuál es el promedio de IMC? ¿En qué distancia están el 50% central de los individuos en la variable peso? ¿Cuánto vale, como mínimo, la variable peso en el 5% de los casos de valores más altos? ¿Cuál de las dos variables es más dispersa? Por encima del valor “mediana= cuartil 50” que sería 68Kg estará el cincuenta por ciento de los datos El promedio del IMC es de 28,11% La distancia que hay en la variable peso es de 14,5 Kg.
La variable peso como mínimo vale 89,525 SD peso= 11,64 4 SDIMC= 4’728 Por lo tanto es más disperso el peso 4. Para representar gráficamente una variable cualitativa, las opciones son el diagrama de sectores (menos adecuado y solo válido para nominales) y el diagrama de barras (más adecuado en general y especialmente para ordinales).
a. Ejecuta el código de ejemplo donde se realizan los dos gráficos para la variable sexo y nivel educativo. ¿Es correcto el orden de las barras? ¿Por qué? No, porque no está en un orden de menos estudio a más.
b. Ejecuta el código donde, antes de realizar el gráfico, se reordenan las categorías.
5 c. Realiza ahora el gráfico adecuado para la variable peso_cat.
5. Para representar gráficamente una variable cuantitativa, las opciones son el histograma y el diagrama de caja (o box-plot).
a. Ejecuta el código de ejemplo donde se realizan ambos gráficos para la variable peso.
Observa que en el histograma se le indican los límites de los intervalos con los que se hace el gráfico.
6 b. Crea el código para hacer ambos gráficos con la variable IMC.
c. ¿Muestran las variables IMC y peso una distribución simétrica y/o similar a la distribución normal (campana de Gauss)? Es más o menos simétrica aunque los datos están un poco desplazado a la derecha.
6. Completa esta tabla con los resultados que obtengas de tu base de datos. Para completar la tabla ten en cuenta que, para las variables cuantitativas se reporta media (dt) si son simétricas, y mediana (cuartiles 1 y 3) si no lo son. Para las variables cualitativas se reporta n(%).
Peso (kg) IMC (kg/m2) Todos (n = 1000) media (desviación típica) 69,12Kg Mediana (Q1-Q3) (24,80-30,82) 27,51 Actividad laboral (%) No Frec (%) 57,4% Sí Frec (%)42,6% Hombres (n = 499) media (desviación típica) 69,17Kg Mediana (Q1-Q3) (25-30,63)27,54 Mujeres (n = 501) media (desviación típica) 69,08Kg Mediana (Q1-Q3) (24,64- 31,21) 27,49 Frec (%) 56,11% Frec (%)43,88% Frec (%) 58,68% Frec (%) 41,31% 7 8 ...

Comprar Previsualizar