4- Variables aleatorias (2017)

Apunte Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Ciencias Biomédicas - 1º curso
Asignatura Bioestadística
Año del apunte 2017
Páginas 10
Fecha de subida 01/08/2017
Descargas 0
Subido por

Vista previa del texto

TEMA 4: VARIABLES ALEATORIAS DISCRETAS Hasta ahora hemos visto todo hasta probabilidad, aplicándola además a las pruebas diagnósticas.
Ahora veremos variables aleatorias.
Estas nos dan los descriptores de la población o parámetros.
E(X): Esperanza matemática, nos indica qué media espero tener en la población.
Var(X): Variabilidad en la población.
Las variables aleatorias pueden ser discretas o continuas, en este tema trataremos las discretas. Esto viene bien explicado en los capítulos 4 y 5 (Milton 3ª edición) y en el capítulo 4 (Daniel 4ª edición).
 Variable aleatoria Una variable aleatoria es el resultado numérico de un experimento aleatorio.
Aplicación matemática, X:Ω → R (el suceso X en el espacio muestral total es un número Real), que da un valor numérico a cada suceso del espacio Ω.
Un experimento aleatorio puede ser, por ejemplo, lanzar 2 veces una moneda.
Así puedo obtener, las dos veces cara, una cara y una cruz, una cruz y una cara y dos cruces.
Así la variable aleatoria puede ser el número de caras, que tomará valores de 0, 1 o 2.
Así se puede cuantificar la probabilidad de que salga una cosa u otra.
Los datos se generan de forma aleatoria, y esto ocurre en una población que no sé cómo se comporta.
Puedo definir las variables aleatorias que yo quiera, por ejemplo podría generar otra avriable aleatoria que sea que coincidan o no, de modo que les asigno un 1 si los resultados coinciden y un 0 sino.
En ambos casos, se hace una transformación matemática del resultado del experimento a un número y se pueden encontrar funciones que describan el comportamiento.
Tipos de variables aleatorias:   V. A. Discretas: P.ej.: experimento aleatorio consistente en escoger familias y anotar su número de hijos (resultado de un recuento).
V. A. Continuas: P.ej.: experimento aleatorio consistente en escoger individuos y medir su estatura (resultado de una medida).
 Variables aleatorias discretas Las variables discretas se dividen en dos funciones:  Función densidad de probabilidad: Asigna a cada valor de la variable aleatoria discreta su probabilidad.
En el ejemplo de número de hijos varones en familias con tres hijos, los valores posibles que puede tomar la variable son: 0, 1, 2, 3.
A cada valor le hacemos corresponder su probabilidad, de este modo ya tenemos definida la variable aleatoria.
La representación gráfica son diagramas de barras, se asignan las alturas en función de los valores posibles de la frecuencia.
Cualquier número distinto a los representados tiene una probabilidad de 0 de ocurrir.
La suma de los valores posibles de esta variable debe ser 1, la función está normalizada.
 Función de distribución de probabilidad: Asigna a cada número real su probabilidad acumulada.
Es la probabilidad de que cualquier número real tome ese valor o uno inferior Antes de cero, que es en este caso el primer valor posible, la probabilidad es de 0, , cuando se llega al primer valor posible, se sube y me muevo en el mismo valor hasta llagar al siguiente valor. La probabilidad de los valores intermedios es la misma, se continúa así hasta llegar al último, en el que la probabilidad de ese valor o superior es 1. Es una función escalonada.
Si quiero saber cuál es la probabilidad acumulada de 1,5, miro el intervalo en el que se encuentra y veo que valor toma en la gráfica.
Estas dos funciones son necesarias para definir las variables aleatorias discretas.
 Caracterización de las poblaciones  Una población está completamente caracterizada si conocemos su función densidad de probabilidad.
 Una función densidad de probabilidad se especifica a través de sus parámetros.
 Los parámetros en la población son equivalentes a los estadísticos en la muestra.
   Esperanza matemática, media poblacional, valor esperado: E(X), μ.
Varianza poblacional: Var(X), σ2 Desviación típica poblacional: σ Los parámetros se designan con letras griegas, los estadísticos en latinas.
La esperanza matemática es la medida de las infinitas observaciones.
f1/N es la frecuencia relativa, cuando N tiende a infinito, se tiende a un valor concreto, que es la probabilidad, de modo que son asimilables. Así que si son infinitos valores, es X por su probabilidad Propiedades: 1. Si la variable aleatoria no es variable, sino constante, su esperanza matemática es la constante.
2. Si puedo calcular una variable a partir de la que conozco, la esperanza de la nueva es resultado de multiplicar la constante por la otra.
3. La esperanza de la suma de 2 variables es la suma de las esperanzas.
4. La esperanza del producto es igual al producto de las esperanzas, si son independientes (ya que son probabilidades).
Propiedades: 1.
2.
3.
4.
La varianza siempre es positiva, porque hacemos el cuadrado.
La varianza de una constante es 0.
La varianza de una variable aleatoria que se le suma la constante, es la varianza de X.
La varianza de la multiplicación por una constante es la varianza de X multiplicada por el cuadrado de la constante.
5. La varianza de la suma o la resta de las variables es la suma de la varianza, si son independientes.
Todas estas propiedades son para la varianza, no para la desviación típica.
 Distribución binomial (replicar Bernouilli) Consiste en repetir un experimento un determinado número de veces, la distribución de Bernouilli.
La distribución binomial debe cumplir una serie de premisas:     En cada prueba del experimento sólo son posibles dos resultados.
El resultado obtenido en cada prueba es independiente de los resultados obtenidos en otras.
La probabilidad de “éxito”, es decir la probabilidad de que salga lo que queremos, del suceso de interés “p” es un parámetro constante (no varía de una prueba a otra). La probabilidad de “fracaso” es “q”, que es 1-p. La suma total de las probabilidades debe ser 1, y solo tenemos 2 opciones.
El experimento costa de un número n de pruebas.
Los dos parámetros importantes son n y p.
Se estudian las características de la variable sin hacer las pruebas cada vez.
Veamos algunos ejemplos:    ¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? Se sabe que el 6% de los medicamentos que se almacenan en el hogar están caducados, ¿cuál es la probabilidad que hay de encontrar más de 5 medicamentos caducaos en un botiquín familiar que contiene 15 medicamentos? La probabilidad de éxito de una determinada vacuna en una enfermedad es de 0.72.
Calcula la probabilidad de que dos individuos padezcan la enfermedad sobre un conjunto de 15 pacientes a los que se les ha suministrado la vacuna.
En todos los casos se cuenta cuántas veces pasa algo que me interesa un número n de veces.
La variable aleatoria X, que expresa el número de éxitos obtenidos en las n pruebas de un experimento es:       Binomial.
Una variable aleatoria discreta.
Solo puede tomar valores 0, 1, 2, 3, 4, …, n. El número de valores posibles es n+1, debe añadirse la probabilidad de que no pase ninguno, es decir 0.
Se denomina variable aleatorias binomial.
Tiene por parámetros: n y p.
Se indica : b(x;n,p) Función de densidad de probabilidad Siempre es la misma: N sobre x es un número combinatorio, es para que esté normalizada, ya que por ejemplo si tenemos 5 sucesos y los éxitos son 2 y fracasos 3, tiene todas estas maneras de organizarse: Todas estas son combinaciones de 3 sucesos favorables y 2 no favorables, debemos contar con todas ellas.
El número combinatorio se obtiene a partir de una fórmula usando factoriales. Esto nos permite obtener probabilidades individuales.
  La primera parte de la ecuación nos da el número de formas en las que pueden combinarse N individuos en dos categorías tal que hayan x en una y en otra N-x.
La segunda parte nos da la probabilidad de que N sujetos independientes, x, sean de una categoría y N-x de otra.
Tendremos algunos problemas (solventables) de cálculo si n es grande y/o p cercano a 0 o 1.
Sabiendo la función, la esperanza matemática, es simplemente n·p, es lo mismo que decir ¿cuántos casos de gripe habrá en una clase de 100 alumnos, donde la probabilidad de tenerla es del 10%? Binomial: resolución mediante f(x) Puedo calcular la probabilidad de que tenga 9 éxitos, 8 … Para ello debo hacerlo en función de la fórmula en cada caso.
Vemos de nuevo que se calculan probabilidades individuales.
Como son tan comunes estos cálculos, existen tablas de distribución binomial, con las probabilidades ya calculadas.
En la fila de arriba del todo encontramos las diferentes probabilidades (p).
En la primera columna de la izquierda está el número de veces que hago la prueba (n).
En la segunda columna de la izquierda están las diferentes opciones en función de las veces que haya hecho la prueba (x).
P(X=x) : Probabilidad de que una variable aleatoria tenga un valor predeterminado.
Si la probabilidad es de 0,1, los valores bajos tienen probabilidades más altas.
Si la probabilidad es de 0,5, obtenemos una distribución simétrica.
Si la probabilidas es de 0,9, tenemos probabilidades más altas en los valores más altos.
 Distribución multinomial La distribución multinomial es una extensión de la binomial.
  Son fenómenos con más de 2 alternativas.
La distribución multinomial analiza la frecuencia de aparición y su probabilidad en cada una de las múltiples opciones.
La fórmula de la multinomial tiene un aspecto similar a la binomial, pero esta vez se multiplica por cada una de las diferentes probabilidades elevadas al número de casos que queremos que se den y en el denominadores el factorial de los casos que queremos que se den.
Veamos un ejemplo: De acuerdo con la teoría de la genética, un cierto cruce de conejillo de indias resultará en una descendencia roja, negra y blanca en la relación 8 : 4 : 4 ¿Cuál es la probabilidad de que de 8 descendientes, 5 sean rojos, 2 negros y un blanco?  Distribución de Poisson Cumple con las siguientes características:      En cada prueba del experimento solo son posibles dos resultados.
El resultado obtenido en cada prueba es independiente de los resultados obtenidos en las otras.
La probabilidad de “éxito” del suceso de interés “p” es una constante (no varía de una prueba a otra). La probabilidad de “fracaso” es “q”.
El experimento se realiza sobre unidades de tiempo, superficie, volumen, … La información conocida es el valor promedio.
Veamos algunos problemas tipo:    En un hospital entran, en promedio, 2 ambulancias cada 30 minutos, ¿cuál es la probabilidad de que entren más de 6? Una ciudad tiene por término medio 5 muertos por accidentes de tráfico al mes, ¿cuál es la probabilidad de que en 6 meses se produzcan más de 30 muertes? El número promedio de ratas por manzana en cierta área de una gran ciudad es de 4.
¿Cuál es la probabilidad de que en una manzana elegida al azar existan entre 5 y 7 ratas? Se quieren probabilidades pero no de una n total, el tope la marca una unidad de tiempo, superficie, volumen… La información conocida, por tanto, es el valor promedio.
La variable aleatoria, X, que espresa el número de éxitos obtenidos por unidad de tiempo, superficie, volumen… es:      Una variable discreta (cuenta cuántos casos).
Puede tomar los valores 0, 1, 2, 3, 4,… (∞), es decir cualquier valor.
Se denomina variable aleatoria de Poisson.
Tiene como único parámetro: λ Se indica: ℘(x; λ) Se asocia a sucesos raros, con una n grande, ℘ → 0 y λ = n·p La función densidad de probabilidad es siempre: Y los diferentes parámetros matemáticos pueden obtenerse de la siguiente forma: La esperanza es n·p en binomial, pues ahora ese producto es igual a λ. La varianza también es λ y la desviación típica la raíz de esta.
Si hago el cálculo de un experimento binomial y obtengo una n muy grande y una p muy pequeña y/o el producto n·p esmenor que 5, se puede resolver con Poisson, que es más fácil que con la binomial.
Con una λ 0,2, existe una probabilidad alta de un valor cercano a 0, luego cae para 1, y el resto es despreciable.
Para una λ de 1.0, se ve que los valores más altos son las más cercanos a 0, y ba descendiendo hasta hacerse casi nulo.
Con una λ de 3.0, empieza creciendo hasta que llega a un máximo y luego decae hasta valores despreciables, lo mismo pasa con 6.0.
Todas las distribuciones de Poisson tiene una simetría positiva, en todas a partir de un punto por la derecha las probabilidades son despreciables, pero aun así siguen existiendo.
Nuevamente encontramos tablas de esta distribución:   En la primera columna tenemos los posibles valores de x.
En la primera fila se encuentran las probabilidades, es decir, los valores promedio.
Vemos que faltan algunos números en la parte de debajo de las columnas, esto se debe a que son valores despreciables, no se ponen en la tabla, pero existen.
Observamos en la tabla, al igual que en las gráficas mostradas anteriormente, que hay valores que tienen un máximo y otros que tienen un mismo valor máximo compartido con 2 x.
Que sea de un modo u otro depende de si el valor promedio o λ es entero o no.
Los valores que no son enteros como 1.2 o 2.5 en la tabla o 0.2 en la gráfica tienen tan solo un máximo, que coincide con el valor entero menor más próximo a esta λ.
Los valores que son enteros como 2.0 o 4.0 en la tabla o 1.0, 3.0 y 6.0 en las gráficas tienen el mismo valor máximo en dos valores, que se corresponden con el valor de λ y con el número entero menor más próximo a este.
...

Comprar Previsualizar