Tema 4. Variables aleatorias continuas-normal (2016)

Apunte Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Ciencias Biomédicas - 1º curso
Asignatura Bioestadística y Análisis de datos
Año del apunte 2016
Páginas 3
Fecha de subida 06/04/2016
Descargas 1
Subido por

Vista previa del texto

Bioestadística Milena Abreu TEMA 4. VARIABLES ALEATORIAS CONTINUAS DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS El número de probabilidades es finito (x siempre es finito). Se representa con líneas (altura=probabilidad). La suma de todas las alturas es 1. SUMO (símbolo de sumatorio) DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES ALEATORIAS CONTINUAS Infinitos posibles resultados (x es infinito)  agrupamos en clases para pasar de infinitos a finitos, para poder contar.
Representamos un rectángulo, porque, por ejemplo, tenemos una clase entre 200 y 250  HISTOGRAMA. No se puede representar con una línea. La frecuencia relativa variará dependiendo de la anchura del rectángulo  la frecuencia relativa no es la altura, sino el área. La suma de todas las áreas es 1. La altura no significa nada.
Al juntar con una línea la parte de arriba de cada rectángulo, obtenemos el polígono de frecuencias. Una vez definido, me olvido del histograma. El área debajo del polígono de frecuencias es 1. El hecho de que la variable sea continua (infinitos números) me permite tener polígonos de frecuencias y calcular probabilidades como áreas debajo de una curva o de una línea  concepto de integrar. El polígono de frecuencias es aproximado si N no tiende a infinito. Si N tiende a infinito, en lugar de un polígono de frecuencias, obtenemos una función con infinitas clases y muy estrechas.
La ecuación matemática del polígono de frecuencias se llama función densidad de probabilidad f(x). INTEGRO (símbolo de integral). La integral de la línea roja me va a dar la probabilidad.
Bioestadística Milena Abreu DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES ALEATORIAS CONTINUAS - Normal o de Gauss Chi cuadrado o de Pearson t de Student F de Fisher-Snedecor Distribución normal o de Gauss Campana de Gauss. Muchas variables continuas siguen esta distribución  una exponencial elevada a –x^2. No está demostrada, es empírica. Al restarle un número a, trasladamos el valor a la derecha y cambiamos el valor normal. Al dividirlo por un número b, se amplifica o se estrecha la función. Para que sea una función, el área tiene que ser 1. Si no da 1, se normaliza  función densidad de probabilidad:  La media (mu) o esperanza matemática es el parámetro a.
 La varianza (sigma^2) es el parámetro b^2.
 La desviación típica (sigma) es el parámetro b.
 X=N(mu,sigma)  X es una campana de Gauss y los dos parámetros que describen esta función son mu y sigma.
 El máximo de la función se calcula igualando la primera derivada a 0.
Coincide con mu (esperanza matemática o primer parámetro a). Al substituir mu en la función, sale que la altura del máximo es 1/sigma raíz de 2pi.
 Si sigma es muy grande, la altura del máximo será pequeña (función ancha). Si es pequeña, la altura será alta (función estrecha). Mu me dice dónde está el máximo, pero sigma hace que las curvas sean altas o bajas.
 Curva simétrica con respecto a mu. El área a cada lado de mu es 0,5.
 Puntos de inflexión: existen 2  x=mu más/menos sigma (media más/menos desviación típica).
 Sigma cambia la forma de la distribución normal, y la hace ancha, estrecha, alta o baja para que el área de debajo de la curva sea siempre 1. Si sigma no varía, las idénticas.
curvas son Bioestadística  Milena Abreu Función distribución de probabilidad. La integral entre menos infinito y a entre la función con mu y sigma de x.
Esta integral no tiene solución empírica. Para calcularla hay que hacer un cambio de coordenadas: cambio de variable. Convierto x en z (restándole mu y dividiéndola entre sigma). Así, traslado la curva y el máximo pasa a ser 0. Si sigma es muy grande, z queda pequeña. Luego la desviación típica resultante será más pequeña. Con el cambio de variable paso de la línea negra (mu,sigma) a la roja (0,1). a se convierte en a menos mu partido por sigma, la media sale 0, sigma sale 1 y obtengo la curva normal más sencilla que existe  N(0,1). Las dos áreas son iguales, por lo tanto, es lo mismo integrar o calcular probabilidad en ambas líneas.
Siempre haremos las integrales con la línea roja  N(0,1). Para hacerlo, hay que tipificar: pasar de x a z.
Hay una tabla con las integrales de la función normal (0,1). Tiene 4 columnas (a, b, c, d).
o o o o A me da el área desde el valor hacia la izquierda.
B me da el área desde el valor hacia la derecha.
C me da el área del máximo a X (de 0 a X).
D me da el área de un intervalo  los normales.
*si la variable es continua, x es infinito. El área debajo de un punto, como la base es 0, la probabilidad es 0. Solo los intervalos en la variable aleatoria continua tienen probabilidad diferente de 0.
Intervalo de probabilidad de X ...