Práctica R 4 (2017)

Ejercicio Español
Universidad Universidad Internacional de Cataluña (UIC)
Grado Medicina - 2º curso
Asignatura Bioestadística
Año del apunte 2017
Páginas 9
Fecha de subida 01/11/2017
Descargas 0
Subido por

Vista previa del texto

PRÁCTICA 4: Estadística descriptiva Bivariada 1. Abre el script y los datos de la práctica de hoy. El script empieza con el resumen del código utilizado en las sesiones anteriores.
1 2. Para realizar la descriptiva bivariada entre dos variables categóricas se ha de realizar una tabla de contingencia.
2.a. Ejecuta el código de ejemplo de este apartado, donde se hace la tabla de contingencia entre las variables sexo y edad (menores y mayores de 55 años). Observa que primero se reordenan las categorías de las variables (según el orden adecuado); a continuación se crea la tabla (la primera variable que se indica corresponde a las filas y la segunda corresponde a las columnas), y se pide a R que calcule los valores marginales y los porcentajes conjuntos, por filas y por columnas.
2 Tabla 1. Tabla de contingencia de las variables Sexo y Edad.
Edad Menores de 55 Mayores de 55 Sexo Total años años Mujer 328 173 501 n 65,47% 34,53% 100% % fila 50,23% 49,86% 50,1% % columna 32,8% 17,3% 50,1% % totales Hombre 325 174 499 n 65,13% 34,87% 100% % fila 50,14% 49,77% 49,9% % columna 32,5% 17,4% 49,9% % totales Total 653 347 1000 n 65,3% 34,7% 100% % fila 100% 100% 100% % columna % de mayores de 55 años que son mujeres (34,53%) % de hombres mayores de 55 años (50,14%) 2.b. Crea una tabla de contingencia entre las variables sexo y actividad laboral y llámala T2.
Obtén también los porcentajes, por sexo y por actividad laboral, y completa la tabla: 3 Tabla 2. Tabla de contingencia de las variables sexo y actividad laboral.
Sexo Actividad Mujer Hombre Total laboral No 294 280 574 n 0.51221 0.4878 100 % fila 0.5868 0.5611 0.574 % columna 0.294 0.280 0.574 % totales Sí 207 219 426 n 0.4859 0.5140 100 % fila 0.4131 0.4388 0.426 % columna 0.207 0.219 0.426 % totales Total 501 499 1000 n 0.501 0.499 100 % fila 100 100 100 % columna 2.c. Según los datos que has obtenido, contesta a las siguientes preguntas: ¿Cuál es el porcentaje de mujeres con actividad laboral? ¿Y el de hombres? ¿Cuántas personas hay con actividad laboral? ¿Cuál es el número de mujeres sin actividad laboral? ¿Piensas que podría haber diferencias en la actividad laboral según el sexo? - El 41.31% de las mujeres trabaja.
El 43.88% de los hombres trabaja.
El 426 individuos tienen trabajo.
El 294 mujeres no trabajan.
A pesar de que los porcentajes son similares, el porcentaje de mujeres con actividad laboral(41.32%) es ligeramente inferior al porcentaje de hombres con actividad laboral(43.89%) 4 3. Para completar la descriptiva bivariada entre dos variables categóricas se puede realizar un gráfico de barras, que puede ser estándar (beside=T) o de barras apiladas (beside=F).
3.a. Ejecuta el código de ejemplo de este apartado, donde se realiza un gráfico de barras de las variables edad y sexo. En el código de R se le ha de indicar sobre qué tabla de contingencia lo ha de realizar (en este caso es la T). Observa que en la instrucción, indicamos los límites de la variable Y para que de esta forma la leyenda no se solape con la barra.
3.b. Realiza un gráfico de barras donde se muestre la actividad laboral según sexo.
3.c.
Según el gráfico, ¿observas diferencias en no tener actividad laboral según sexo? A pesar de ser mínimas, parece que las mujeres en mayor proporción no tienen actividad laboral en comparación a los hombres.
5 4. Para realizar la descriptiva bivariada entre una variable categórica y una variable numérica se han de obtener los descriptivos de la variable numérica según los niveles de la variable categórica.
4.a. Ejecuta el código de ejemplo de este apartado, donde se compara la altura según sexo.
Hemos de descargar el paquete “doBy” y en el comando indicar a) la variable cuantitativa en primer lugar y a continuación la cualitativa; b) FUN=summary si queremos un resumen de los estadísticos o, por ejemplo, FUN=c(mean,sd) o FUN=c(median, IQR) si queremos especificar los estadísticos y c) na.rm=TRUE, para indicar que la variable tiene missings.
4.b. Obtén los estadísticos necesarios para comparar peso según sexo y edad según sexo.
Asume que peso y edad siguen una distribución normal para completar la tabla: Altura (metros) Peso (kg) Edad (años) Tabla 3. Peso y edad según sexo Hombre 1,73 (0,066) 86.46 (14.0077) 53.4589 (6.685) Mujer 1,57 (0,06) 69.07 (12.075) 64.06 (8.2854) 6 4.c. Según los datos que has obtenido, ¿piensas que podría haber diferencias en el peso según sexo? ¿y en el caso de la edad?.
Si, la media es mayor en el caso de los hombres con respecto a las mujeres. Y respecto a la edad las mujeres la media de edad de estas es superior a la de los hombres.
5. Para completar la descriptiva bivariada entre 1 variable categórica y 1 variable numérica se pueden realizar un diagrama de cajas.
5.a. Ejecuta el código de ejemplo donde se realiza un diagrama de cajas de la variable altura según sexo.
5.b. Realiza dos diagrama de cajas de las variables peso y edad según sexo.
7 5.c. Según los gráficos obtenidos, ¿piensas que podría haber diferencias en la edad y el peso según sexo? Si, las mujeres pesan menos y son más mayores.
6. Para realizar la descriptiva bivariada entre 2 variables cuantitativas, se puede obtener la correlación de Pearson y también realizar un gráfico de dispersión.
6.a. Ejecuta el código de ejemplo donde se obtiene la correlación de Pearson de las variables altura y peso.
Correlación de Pearson: 0.5536 6.b. Describe si hay correlación entre las variables peso e IMC.
Correlación de Pearson: 0.78001 6.c. Ejecuta el código de ejemplo donde se obtiene el gráfico de dispersión de las variables altura y peso.
8 6.d. Realiza un gráfico de dispersión entre las variables peso e IMC. Di qué tipo de relación existe entre ambas variables (relación lineal positiva o negativa, relación no lineal) o si hay falta de relación.
Tal y como nos indicaba el coeficiente de correlación obtenido, en el gráfico de dispersión se observa que hay relación lineal positiva entre las variables peso e IMC.
Relación lineal positiva y hay mucha relación porque el coeficiente de perason es mayor de 0.7.
9 ...

Comprar Previsualizar