TEMA 4 (2015)

Apunte Español
Universidad Universidad Pompeu Fabra (UPF)
Grado Medicina - 2º curso
Asignatura Bioestadística
Año del apunte 2015
Páginas 14
Fecha de subida 20/04/2016
Descargas 1
Subido por

Vista previa del texto

2n Medicina UPF- UAB BIOESTADÍSTICA TEMA 4: Probabilidad En muchas situaciones, no es posible predecir con exactitud qué va a ocurrir. No podemos eliminar la incerteza pero podemos estudiarla y modelarla. La comprensión de la incerteza es útil en estadística inferencial.
1. Terminología: - Fenómeno o experimento aleatorio ! Cualquier situación, cuyo resultado no es posible predecir. Ej.: será niño o niña? - Suceso elemental ! Cada uno de los posibles resultados de un experimento aleatorio. Ej.: niño - Espacio muestral ! Al conjunto de todos los posibles resultados. Ej.: niño o niña Los experimentos aleatorios pueden ser más complejos. Ej.: en un parto triple, el espacio muestral estará formado por cuatro sucesos elementales. Ej.: 3 niños, 3 niñas, 2 niños y 1 niña, 2 niñas y 1 niño.
Cualquier subconjunto de este espacio muestral se denomina suceso. Un suceso pueden contener varios sucesos elementales.
                                  2n Medicina UPF- UAB   RESUMEN: Espacio muestral (S) Suceso elemental (a) Conjunto de todos los resultados posibles Cada uno de los posibles resultados del experimento aleatorio Suceso (A) Cualquier subconjunto del espacio muestral. Puede incluir uno o varios sucesos elementales a Suceso seguro El suceso que incluye todos los sucesos elementales Suceso imposible El que no incluye ningún suceso elemental En los ejemplos anteriores no sabemos si será niño o niña pero si sabemos que las probabilidades de que engendrar un niño o una niña son aproximadamente iguales (50%).
NOTA: La probabilidad expresa expectativas de obtener un determinado resultado en un experimento aleatorio.
En matemáticas, la probabilidad se expresa con un número de 0 a 1 que indica las expectativas de que ocurra un cierto suceso A: v P(A) = 0 à suceso A imposible v P(A) = 1 à suceso A seguro v P(A) = P(B) à sucesos A y B equiprobables 2. Estimación o Cálculo de la probabilidad: El valor de la probabilidad de un suceso P(A) se calcula mediante: 1. Frecuencia relativa ! cuando un experimento se puede repetir muchas veces, la probabilidad del suceso A es aproximadamente igual a su frecuencia relativa.
P( A ) ≈ número de veces que ocurre A número de veces que se repite el experimento Ej1.: sexo de los recién nacidos ! P(varón) =0,49 / P(mujer) = 0,51 Ej2.: aparición de espina bífida ! P(malformación) = 0,0012 Tiene un inconveniente y es que depende del número de experimentos, es decir, el valor de P(A) es una estimación que se aproxima asintóticamente al valor real a medida que se llevan a cabo más pruebas. Ej.: 2n Medicina UPF- UAB tenemos 100 partos y no aparece la malformación espina bífida por tanto P(malformación) =0/100? Seria una mala estimación ya que se estudian pocos casos. Únicamente cuando hemos estudiado infinidad de partos conseguiremos un valor de probabilidad aproximado al real.
2. Probabilidad clásica ! cuando trabajamos con sucesos elementales exactamente equiprobables, la probabilidad de un suceso A se puede obtener como: P(A) = A S donde X es el nº de elementos ( cardinalidad ) del conjunto X Ej1.: probabilidad de obtener un nº par al tirar un dado de seis caras Ej2.: genética mendeliana El inconveniente es que solo es aplicable cuando los sucesos son realmente equiprobables y su aparición depende únicamente del azar.
Ej1.: Un cierto rasgo hereditario viene definido por un gen, que puede tener dos alelos (t o T), supongamos que T está asociado con una enfermedad genética recesiva.
Cuando la característica es recesiva, solo una de las tres posibles composiciones génicas (genotipo) manifiesta la enfermedad (fenotipo) ! P(enfermo)= ¼ = 0,25 Ej2.: Probabilidad de obtener 6 tirando un dado de 6 caras.
! P (6)= 1/6 = 0,16 NOTA: se divide por el nº de sucesos elementales posibles.
Ej1.: 4 posibles sucesos elementales en la 1era generación; TT,Tt,Tt,TT Ej2.: 6 posibles sucesos elementales en una tirada; 1,2,3,4,5,6 2n Medicina UPF- UAB 3. Estimación subjetiva ! utilización de los conocimientos de un experto. Este valor no expresa frecuencias de aparición, sino nuestro convencimiento inicial en la certeza de una hipótesis. En sí misma, no tiene más valor que ser un punto de partida.
Posteriormente, el análisis de los datos experimentales servirá para actualizar este valor subjetivo inicial Base la estadística bayesiana à método de inferencia estadística Ej.: “El uso de toxina antitetánica en casos clínicos de tétanos reduce la mortalidad en un 20%” 3. Algebra de probabilidad: Reglas para calcular probabilidades: REGLA 1 - - REGLA 2 (de la suma) REGLA 3 (del producto) Las probabilidades de dos sucesos - La probabilidad de que ocurra complementarios suman 1 suceso A o suceso B, cuando suceso A y suceso B, cuando Sucesos complementarios ! ambos son sucesos excluyentes, son sucesos independientes, es aparición de uno excluye es igual a la suma de sus igual al producto de sus forzosamente el otro y viceversa probabilidades probabilidades.
- Sucesos excluyentes !cuando no - - La probabilidad de que ocurra Sucesos independientes ! comparten ningún suceso cuando la P(A) no depende de elemental que se cumpla o no el suceso B Ej.: el suceso “nace varón” es complementario al de “mujer” porque cuando no se cumple uno se cumple forzosamente el otro.
Si la probabilidad P(mujer)=0.51, entonces la probabilidad P(varón) se calcula: Ej.: Si tiramos un dado de seis caras, la probabilidad de que salga un 1 o bien un 2 se calcula… P(1 o 2) = P(1) + P(2) = 1/6 + 1/6 = 2/6 = 0,33 Ej.: Si tiramos dos veces un dado de seis caras, la probabilidad de que salga un 1 dos veces seguidas se calcula… P(1 y 1) = P(1) · P(1)= 1/6 ·1/6= 1/36= 0,027 P(varón) = 1 - 0.51 = 0.49 ! La probabilidad de que ocurra el suceso (A ó B) es mayor que la probabilidad de que ocurra cada uno de los sucesos por separados.
! La probabilidad de que ocurra el suceso (A y B) es menor que la probabilidad de que ocurra cada uno de los sucesos por separado. (la probabilidad de que salgan dos cosas a la vez es menor que si sale una o la otra).
2n Medicina UPF- UAB Ej1.: La probabilidad de que te toque la loto o las quinielas es más alta de que te toque una sola de las apuestas La probabilidad de que te toque la loto y además las quinielas es más baja de que te toque una sola de las apuestas Ej2.: Si el 30% de la población en EEUU es obesa y que el 3% sufre diabetes. ¿Qué probabilidad hay de que una persona sea obesa o sufra diabetes? P(obesa)=0.3 ! (30/100) P(diabética)=0.03 ! (3/100) P(obesa o diabética) = P(obesa) + P(diabetes) = 0.3 + 0.03 = 0.33 ¡ERROR! Ambos sucesos no son excluyentes. Algunas personas son obesas y además diabéticas y esto hace que las contemos dos veces Cuando los sucesos no son excluyentes hay que restar la probabilidad de los sucesos comunes: P(A o B) = P(A) + P(B) - P(A y B) por lo tanto: P(obesa o diabetes) = P(obesa) + P(diabetes) - P(diabetes y obesa) = 0,3 +0,03 – (0,3 · 0,03)= 0,321 Ej3.: Puntos negros son personas enfermas. La probabilidad de ser anciano es del 50%, la mitad de los puntos son ancianos.
P(enfermo) = 10/100 = 0.1 P(anciano) = 50/100 = 0.5 P(anciano y enfermo) = 0.5 x 0.1 = 0.05 (es decir, 5 de los 100) ¡ERROR! Ambos sucesos no son independientes. La proporción de enfermos es mucho mayor en los ancianos. Por lo tanto P(enfermos) no es igual en ancianos y jóvenes.
2n Medicina UPF- UAB Cuando A y B no son sucesos independientes, la regla del producto toma la siguiente forma: P(A y B) = P(A) . P(B|A) por lo tanto: P(anciano y enfermo) = P(anciano) . P(enfermo|anciano)= 0,5 ·(0,1/0,5)= 0,1 NOTA: P(B|A) es la probabilidad de que ocurra B cuando A es cierta. Se lee “probabilidad (condicionada) de A dado B” Ej4.: P(enfermo) = 10/100 = 0.1 P(mujer) = 50/100 = 0.5 P(mujer y enfermo) = 0.1 x 0.5 = 0.05 (osea 5 de los 100) ¡CORRECTO! Ambos sucesos son independientes. La proporción de enfermos es igual en hombres que en mujeres.
4. Probabilidad condicionada Por tanto, un suceso A puede definir un subconjunto dentro el espacio muestral dentro del cual la probabilidad de otro suceso B puede ser distinta con respecto a fuera ! Si A y B son sucesos independientes: P(A y B) = P(A) . P(B) ! Si A y B no son sucesos independientes P(A y B) = P(A) . P(B|A) = P(B) . P(A|B) 5. Conclusiones Usando un lenguaje más correcto P(A o B) se representa P(A ∪ B) y P(A y B) se representa como P (A ∩ B) P(A ∪ B) = P(A) + P(B) – P(A ∩ B)! regla suma P(A ∩ B) = P(A|B).P(B) = P(A).P(B|A) ! regla multiplicación cuando A y B son sucesos mutuamente excluyentes... P(A ∩ B) = 0 cuando A y B son sucesos independientes P(A|B) = P(A) y P(B|A) = P(B) P(A ∪ B)= P(A) + P(B) P(A ∩ B) = P(A).P(B) 2n Medicina UPF- UAB 6. Probabilidad a priori y a posteriori ¿Cuál es la probabilidad de que un cierto paciente sufra un tumor cerebral (T)? - Probabilidad “a priori” o previa !   en este caso,   en ausencia de datos clínicos, es la probabilidad P(T) estimada a partir de observaciones retrospectivas (tiempo pasado), de la incidencia de la enfermedad en la población (digamos 1 de cada 10000, es decir, 0.0001) - Probabilidad “a posteriori” o posterior P(T|D) ! probabilidad condicional que consiste en una reconsideración de la probabilidad previa debido a la obtención de nuevos datos. En este caso el médico averigua que los pacientes con tumor cerebral sufren frecuentemente dolores de cabeza (D).
Es una probabilidad condicionada ya que la P(T) no es igual entre las personas con D y las que no, podemos suponer que es mayor en las personas con D.
NOTA: P(T)= probabilidad de tener un tumor P(t)= probabilidad de no tener tumor D= dolor de cabeza P(T|D)= probabilidad de tumor dado dolor de cabeza Por la definición de probabilidad condicional sabemos… P(D ∩ T) = P( T | D).P(D) Aislando probabilidad “a posteriori” P( T | D) = P(D ∩ T ) P(D) Con respecto al numerador, sabemos que P(D ∩ T) = P(D|T).P(T), luego… P(T | D) = P(D | T ).P(T ) P(D) El denominador es un “factor de escala” . Lo importante es que: P( T | D) ∝ P(D | T).P( T) La probabilidad posterior P(T|D) es proporcional a la 1 probabilidad previa P(T) por la verosimilitud P(D|T)* NOTA: P(D|T) es la probabilidad de que un paciente con tumor sufra dolor de cabeza. En este contexto se denomina verosimilitud (“likelihood”)= frecuencia con la que ocurre el evento observable (dolor de cabeza) entre las personas que tienen tumor cerebral.
2n Medicina UPF- UAB ¿Qué hemos conseguido con esta formula? relacionar dos conceptos parecidos pero que no tienen nada que ver: - Probabilidad de tener un tumor - Probabilidad de tener dolor de cabeza cuando se tiene un tumor= verosimilitud 1 NOTA: * Cuanto mayor es la verosimilitud, mayor probabilidad de que tengamos enfermedad TEOREMA DE BAYES: " Concepto: Teníamos… P( T | D) =       P(D | T ).P( T ) P(D) P(D) à probabilidad de tener dolor de cabeza. Engloba a todos los pacientes: - Dolor de cabeza por tumor (T) - Dolor de cabeza por no tumor (t) NOTA: P(D) se puede descomponer como: 1- La probabilidad de tener dolor de cabeza y al mismo tiempo tener tumor 2- La probabilidad de tener dolor de cabeza y al mismo tiempo no tener tumor.
Substituyendo todo… P( T | D) = P(D | T ).P( T ) P(D | T ).P( T ) + P(D | t).(P(t)) TEOREMA DE BAYES El Teorema de Bayes, en su formulación general, si tenemos un suceso (observable) A y un conjunto de n sucesos Bi que cubren todo el espacio experimental (E = B1 ∪ B2 ∪ … ∪ Bn) La probabilidad de tener un suceso B dado A es igual a ….
P(Bi | A) = P(A | Bi ).P(Bi ) n ∑ j=1 P(A | B j ).P(B j ) 2n Medicina UPF- UAB Esta fórmula puede usarse siempre que tengamos: # Un conjunto de sucesos exhaustivos, no directamente observables Bi. .Ej.: exhaustivo! tiene dolor de cabeza o no, tiene tumor o no.
# Sus probabilidad “a priori” P(Bi). Ej.: podemos calcular la probabilidad de tener tumor o no # Sus verosimilitudes P(A|Bi). Ej.: probabilidad de tener tumor cuando se tiene dolor de cabeza o bien probabilidad de tener dolor de cabeza y no tener tumor.
Con el fin de estimar la probabilidad “a posteriori”, tras observar un suceso A NOTA: en nuestro ejemplo: - Suceso observable (A)= dolor de cabeza (D) - Sucesos no observables (B)= tener un tumor (T) o no tenerlo (t) Asignación de valores numéricos (inventados) al ejemplo… Ej.: ¿Cual es la probabilidad de tener tumor cerebral dado dolor de cabeza? P(T) = 0.0001 ! incidencia de tumor es de 1 por 10.000 habitantes P(D|T) = 0.9 ! 90% de pacientes con tumor sufren cefaleas (hay una probabilidad del 90% de tener dolor de cabeza dado tumor)= verosimilitud P(D|t) = 0.1 ! 10% de pacientes sin tumor sufren cefaleas P(t)= 1- 0,0001 P( T | D) = 0.9x 0.0001 = 0.0009 0.9x 0.0001 + 0.1x (1 − 0.0001) Tras observar la cefalea, la probabilidad posterior es 9 veces más alta que la probabilidad previa (pasa de 0.0001 a 0.0009).
Sin embargo, la probabilidad sigue siendo muy baja (<0.09%) y no tenemos motivos de preocupación. ¿Por qué? Ej.: La probabilidad de que tenga un tumor un paciente al azar, era de 1/10.000= 0,0001. Una vez hemos observado que tiene dolor de cabeza, la probabilidad de padecer tumor ha aumentado hasta 0,0009. Ha aumentado mucho la probabilidad? La variación entre la probabilidad posterior y previa es muy pequeña, no ha aumentado mucho, por lo tanto hay poca probabilidad de que el hecho de tener dolor de cabeza implique tumor cerebral.
2n Medicina UPF- UAB Representación de la población en referencia al ejemplo anterior: Personas con tumor que tienen dolor de cabeza con mucha frecuencia(90%) Personas sin tumor que tienen dolor de cabeza con menos frecuencia (10%) P(T|D) =       P( T | D) =   0.9x 0.0001 = 0.0009 0.9x 0.0001 + 0.1x (1 − 0.0001) * No es importante el dolor de cabeza porque puede ser un síntoma frecuente entre personas que tienen un tumor o puede ser un falso síntoma entre las personas sanas. Se observa que hay poca probabilidad de tener tumor i dolor de cabeza =0,01% (pocas personas con dolor de cabeza i con tumor cerebral). Por lo contrario se observa que hay muchas personas sin tumor i que tienen dolor de cabeza (hay mucha gente sana). Seria el 90% de muy pocas personas i el 10% de muchas.
IDEA: cuando observamos una asociación como en este caso, un síntoma y una enfermedad, para ver la importancia diagnostica hay que ver: 1- Con cuanta frecuencia aparece dicho síntoma en sanos 2- Cual es la proporción de sano y enfermos en la población ! Si la proporción de sanos y enfermos es muy pequeña lo más probable es que el síntoma observado no tenga valor ya que como hay muchos sanos la probabilidad de ser una persona sana es alta.
" Resumen conceptos: # A veces estamos delante de varias opciones (sano/enfermo, infección por agente J/K/I, etc.) sobre las cuales podemos estimar probabilidades previas. (sano, enfermos) # Ante una observación experimental o clínica, estas probabilidades previas cambian y podemos calcular probabilidades a posteriori.
# La verosimilitud es el peso que de esa observación asigna a cada una de las opciones. Ej.: El peso de tener dolor de cabeza le asignas a tener tumor o no.
" Utilidad: Las situaciones representadas en el teorema de Bayes son muy frecuentes en Ciencias Biomédicas en general y en Medicina en particular.
Existe una relación natural entre la estadística Bayesiana y la medicina basada en la (mejor) evidencia.
Es un modo de trasladar la evidencia científica a decisiones clínicas.
2n Medicina UPF- UAB Hay multitud de aplicaciones en áreas como: # Pruebas diagnósticas # Aplicaciones a la toma de decisiones # Ensayos clínicos # Aplicaciones epidemiológicas # Revisiones sistemáticas y meta-análisis NOTA: Completaremos el tema con ejemplo de aplicación en pruebas diagnósticas APLICACIÓN DE LOS CONCEPTOS A PRUEBAS DIAGNOSTICAS: En una prueba diagnóstica, como por ejemplo un test antituberculoso, es importante determinar: P(T|+) = probabilidad de que ante un positivo, realmente exista tuberculosis Desde el punto de vista de la estadística Bayesiana el resultado de la prueba (+ ó - ) es el suceso observable.
El que el paciente tenga tuberculosis (T) o no (t), es un conjunto de sucesos exhaustivos de los cuales podemos conocer probabilidades previas y verosimilitudes .
NOTA: - Suceso observable= resultado de la prueba - Suceso no observable= no sabemos si estamos enfermos o no.
La distribución de los individuos dependiendo de ambos sucesos puede representarse en un diagrama de árbol: NOTA: P(+|T) = probabilidad de dar positivo si tienes tuberculosis. Es del 95% à prueba fiable P(+|t) = probabilidad de dar positivo si no tienes tuberculosis à falso positivo 2n Medicina UPF- UAB Las probabilidades pueden obtenerse multiplicando las “ramas del árbol”: P (T|+) ! Probabilidad de ser tuberculoso y dar positivo / todos los positivos (incluidos los no - tuberculosos) Población gris en la cual tenemos: 1- Personas con tuberculosis * 2- Personas sin tuberculosis * * Les hacemos prueba: - Positivo = verosimilitud - Falso Negativo (1- verosimilitud) * Les hacemos prueba: - Falso positivo - Negativo En pruebas diagnósticas, las distintas probabilidades se denominan: P(+|enf) ! sensibilidad (S) = Probabilidad de que de + estando enfermo = verosimilitud en el caso de los enfermos. Con cuanta frecuencia da positivo entre los enfermos. Es importante ya que lo que esperamos en una prueba diagnóstica es fiabilidad. Lo ideal seria que fuera 100%. Para calcularla solo nos fijamos en los enfermos.
P(-|sano) ! especificidad (E) = Probabilidad de que de – y ser sano. Idealmente tendría que ser el 100%.
Para calcularla nos fijamos en los sanos, cuantos dan – estando sanos/ total de sanos.
P(enf|+) ! valor predictivo positivo (VP+) = calculado mediante el teorema de Bayes P(sano|-) ! valor predictivo negativo (VP-) La sensibilidad y especificidad las podemos determinar directamente sin necesidad de teorema de Bayes en un caso clínico. Pueden determinarse mediante ensayos: ! Tuberculosos +/ todos los enfermos ! Sanos - / todos los sanos 2n Medicina UPF- UAB Ej.: Ambos valores pueden combinarse en un valor de fiabilidad (F), que indica el % de los casos para los cuales el valor proporcionado es correcto.
Para calcular fiabilidad se necesita un valor de prevalencia P(enf): F = P (enf ∩ +) + P (sano ∩ -) F = P (+|enf) . P(enf) + P (-|sano) . [1-P(enf)] F = S . P(enf) + E . [1-P(enf)] En el ejemplo, suponiendo una prevalencia P(enf) de 0.01 F = S . P(enf) + E . [1-P(enf)] F = 0.9 x 0.01 + 0.8 x 0.99 = 0.801 Indica que la prueba determina el valor correcto en el 80% de los casos NOTA: Sin embargo, el valor de F no indica que, en el caso de ser +, el paciente tenga el 80% de probabilidades de estar enfermo. Esto solo lo indica el VP+ El valor predictivo positivo VP+ o P(enf|+), también puede calcularse cuando se dispone del valor de prevalencia P(enf) P(enf | +) = P(+ | enf ).P(enf ) P(+ | enf ).P(enf ) + P(+ | sano ).P(sano ) …substituyendo S y teniendo en cuenta que P(+|sano) = 1-P(-|sano) = 1-E P(enf | +) = S.P(enf ) S.P(enf ) + (1 − E).(1 − P(enf )) En el ejemplo, suponiendo una prevalencia P(enf) de 0.01 S.P(enf ) P(enf | +) = S.P(enf ) + (1 − E).(1 − P(enf )) P(enf | +) = 0.9 x 0.01 = 0.09 0.9 x 0.01 + 0.2 x 0.99 NOTA: es más fácil realizar los cálculos mediante la multiplicación de las ramas del árbol.
! Luego en esta prueba, pese a ser bastante fiable (F=80%), la probabilidad de que el paciente esté enfermo cuando se obtiene un + es solo de 0.09 = 9% 2n Medicina UPF- UAB IMPORTANCIA DEL TEOREMA DE BAYES: Trabajar con sensibilidad y especificidad es incomodo por eso se resume en un valor porcentaje de fiabilidad de los casos. Para ello necesitamos la prevalencia o probabilidad a priori, en el ejemplo es la probabilidad de estar enfermo y ser positivo y la probabilidad de estar sano y dar negativo. En el ejemplo, la fiabilidad es del 80% o 0,8, en el 80% de los casos nos da un resultado correcto. De entrada seria una prueba de la cual nos podríamos fiar. Pero lo que nos importan es el valor predictivo positivo, cuando te da positivo es que esta enfermo. Este valor se calcula con la formula de Bayes. En el ejemplo, la probabilidad del valor predictivo positivo= 0,09, solo hay una probabilidad de 9% de estar enfermo si da positivo. Con este resultado podemos deducir que no es una buena prueba.
Porque son tan diferentes 80% y 9%?? El problema es de la especificidad la cual tiene en cuenta a los falsos positivos respecto todo los sanos. Ante una alta prevalencia de falsos positivos, cuando salga un positivo que será más probable que sea positivo o que sea falso positivo? Que sea falso positivo ya que la proporción de sanos es mayor. Depende de la proporción de sano/ enfermos, frecuencia que aparezca en los sanos y proporción que aparezca en enfermos (+).
...