TEMA 13 (2015)

Apunte Español
Universidad Universidad Pompeu Fabra (UPF)
Grado Medicina - 2º curso
Asignatura Bioestadística
Año del apunte 2015
Páginas 13
Fecha de subida 20/04/2016
Descargas 1
Subido por

Vista previa del texto

2n Medicina UPF- UAB BIOESTADÍSTICA TEMA 13: Diseño de planes de experimentos Tema 2- Estudios experimentales Tenemos dos tipos de estudios: - Observacional - Experimental !   partimos de una población de la cual extraemos los individuos de la muestra asignándolos al azar al grupo tratado o placebo, se aplica la intervención y se valora el resultado observando la diferencia entre ambos grupos.
Cualquier diferencia no atribuible al azar será consecuencia del tratamiento.
ESTUDIOS EXPERIMENTALES: En los estudios experimentales se suele investigar el efecto de uno o varios factores en un fenómeno.
Ej.: en el caso anterior el factor que afecta a la variable de salida puede ser dar o no dar un medicamento Ej.: estudio del efecto de la presión y la temperatura en el rendimiento de una reacción química. Aplicamos una intervención como hacer una RQ en distintas condiciones de presión y temperatura para observar como cambia el rendimiento de la reacción. Esto siempre se realiza mediante métodos comparativos.
" Diseño de experimentos ! La experimentación se planifica fijando los valores de los factores controlados y esperando que el efecto de los factores nocontrolados se reparta al azar.
2n Medicina UPF- UAB En nuestro estudio: Factores controlados ! temperatura y presión. Realizamos varios experimentos calculando el - rendimiento de la RQ resultado de fijar diferentes valores de estos factores. Ej.: Experimento 1= 15ºC i 1 atm, Experimento 2= 16ºC i 1 atm, etc.
Factores no controlados ! humedad del aire. Ej.: Experimento 1: aire húmedo, Experimento 2= - aire seco.
Los factores no controlados, tienen influencia en nuestros estudios experimentales generando un ruido de fondo. Por este motivo lo ideal es atribuirlos al azar para que se convierta en un elemento aleatorio permitiendo distinguirlos de los factores controlados. De esta manera, las diferencias observadas podrán ser atribuidas a la intervención.
Los experimentos deben planificarse de modo que se obtenga la máxima información con la mínima inversión de tiempo y recursos (mínimo nº de experimentos)= Experimentos eficientes Las metodologías utilizadas para planificar los experimentos se denominan métodos de diseño de experimentos (design of experiments, DOE).
o Eficiencia: Uno de los principales motivos de usar DOE es minimizar el número de experimentos.
Los experimentos pueden ser caros, pueden tardar mucho tiempo o pueden suponer muerte o sufrimiento en animales (que siempre debe minimizarse por motivos éticos). Los diseños de experimentos que permiten obtener mucha información con pocos experimentos se denominan diseños eficientes.
El número de experimentos dependerá del objetivo de la investigación: # Estimar los efectos de los factores en la muestra # Estimar los efectos de los factores y sus interacciones en la muestra Estudio más detallado # Estimar los efectos y comprobar su significancia estadística Cuanto más detallado sea el estudio cada vez vamos a tener que invertir más recursos y hacer más experimentos.
Todo diseño experimental es un compromiso entre los recursos que se aplican y la información que se obtiene TÉCNICAS DOE: Existen diversas técnicas para aplicar DOE. En este curso veremos: # Una variable a la vez (OVAT) # Planes de diseño factoriales # Planes de diseño factoriales fraccionales 2n Medicina UPF- UAB " Una variable a la vez- Diseño OVAT ! Cuando quieren explorarse varios efectos, una posibilidad es estudiarlos uno detrás de otro (One Variable At a Time, OVAT). Es la técnica más sencilla de todas.
Ej.: Efecto de la presión y la temperatura en el rendimiento de una reacción química Primeramente observamos los efectos de cada una de las variables por separado:   Presión: se realizan 3 experimentos a diferentes presiones (0, 50 y 100). Observamos que el rendimiento de la RQ aumenta cuanto mayor es dicha presión.
      Temperatura: se realizan 3 experimentos a diferentes temperaturas (20, 30 y 40). Observamos que el rendimiento de la RQ disminuye cuando mayor es dicha temperatura.
Hemos realizado 6 experimentos para aprender que el rendimiento aumenta con la presión y disminuye con la temperatura.
INCONVENIENTES   # No son eficientes en términos de número de experiencias necesarias ! por cada factor que queremos estudiar tenemos que hacer mínimo dos pruebas (una a nivel alto y otro bajo).
# Asumen que el efecto de un factor es constante para diversos valores del resto de los factores ! estamos asumiendo que a temperatura alta la presión también es alta.
# No permite detectar interacciones entre los factores ! no sabemos el efecto de la interacción temperatura- presión sobre el rendimiento. Únicamente sabemos el efecto de cada factor por separado.
                                    " Planes de diseño factorial ! Consisten en fijar un cierto número de niveles en cada factor (normalmente 2, uno “alto” y otro “bajo”) y llevar a cabo un experimento para cada combinación posibles de estos niveles. Eso en variables de tipo cuantitativo.
2n Medicina UPF- UAB NOTA: En el caso de tener variables dicotómicas (hombre-mujer ó tratado-no tratado) se asignan arbitrariamente los niveles bajos y altos.
Cuando se usan dos niveles se denominan planes factoriales 2n, donde n es el número de factores que se investigan. Con el valor de 2n obtendremos los experimentos necesarios para llevar a cabo el estudio.
En el ejemplo: Estudio del efecto de la temperatura y presión sobre el rendimiento de una RQ.
# # Se comienza por definir un nivel alto (+) y bajo (-) de ambos factores. En este caso se utiliza: - Temperatura: bajo (-) =20, alto (+)= 40 - Presión: bajo (-)= 0, alto (+)=100 Como tenemos 2 factores (presión y temperatura), se realizan 22=4 experimentos   Observamos el rendimiento obtenido en cada una de las condiciones. No obstante, mediante esta tabla, no podemos cuantificar el efecto (si lo aumenta o lo disminuye) de cada factor sobre nuestra variable rendimiento.
  Para cuantificar el efecto de un factor, basta restar la media de los rendimientos obtenidos con el nivel alto (+) a la media de los rendimientos obtenidos con el nivel bajo (-).
Para calcular el efecto del factor presión (Ep) se realiza de la siguiente manera: Media de los rendimientos obtenidos a nivel (+).
Media de los rendimientos obtenidos a nivel (-).
  Presión: el efecto es 20. Esto indica que el rendimiento de la RQ será 20 unidades mayor si la presión es de 100 respecto a si la presión es de 0.
Temperatura: el efecto es de -20.
Esto indica que el rendimiento de la RQ será 20 unidades menor si la temperatura es de 40 respecto a si es de 20.
2n Medicina UPF- UAB La interacción entre dos factores se calcula restando las medias de los rendimientos de las experiencias + + y - - a las de las experiencias + - y - + .
  Al calcular las interacciones, nos permite conocer el efecto sobre el rendimiento de un factor en función del otro.
  Observamos que el efecto de la interacción es 0. Esto indica que no hay interacción y por lo tanto el efecto de la presión es el mismo a temperaturas altas o bajas o bien el efecto de la temperatura es la misma a presión alta o baja..
NOTA: es denominador es 2 porque tenemos dos valores + y dos valores - #     VENTAJAS Bastante eficientes en términos de número de experiencias necesarias (2n) ! solo con 2n experimentos vamos a ser capaces de determinar todos los efectos de los factores y además todas sus interacciones entre ellos.
# El efecto de los factores se determina a distintos niveles del resto de los factores.
# Todas las experiencias contribuyen a calcular todos los factores siendo la estimación del factor mucho más precisa ya que se minimizan los posibles errores experimentales al promediar los efectos de los experimentos. ! utilización óptima de todo el trabajo experimental # Permite detectar y calcular interacciones entre los factores     Ej.: Se necesita mejorar la separación de fenoles utilizando HPLC. Se sabe que la adición de algunos compuestos a la fase móvil mejora los resultados: ácido acético (A), metanol (M) y ácido cítrico (C) El rendimiento puede medirse cuantitativamente.
¿Qué efecto tiene cada uno de estos aditivos? Se comienza por definir los niveles altos y bajos de cada aditivo: Se quiere medir como diferente concentraciones de estos aditivos puede mejorar la separación de los fenoles.
2n Medicina UPF- UAB Se han escogido estos niveles ya que son suficientemente distintos como para observar el efecto en nuestra variable, en este caso separación de fenoles. Los niveles no deben ser muy diferentes ya que podrían causar distorsiones.
Se construye un diseño factorial 23 ya que tenemos 3 factores (A, M y C). El 23 define las condiciones de 23=8 experimentos.
El diseño se construye teniendo en cuenta todas las combinaciones posibles de los niveles.
Estas condiciones se pueden representar gráficamente en 3 dimensiones.
NOTA: para construir estos diseños siempre se sigue la misma dinámica: Factor 1 (A): se coloca alternadamente + y – Factor 2 (M): se colocan dos – seguidos y dos + seguidos Factor 3 (C): se colocan cuatro – seguidos y cuatro + seguidos Se llevan a cabo los experimentos (8 HPLC), cuantificando la calidad de los resultados con la variable Y: Al cuantificar la calidad de la HPLC no podemos determinar el efecto de cada uno de los aditivos.
El orden en que se realizan los experimentos se elige al azar, para evitar que el tiempo o factores no controlados interfiera en la respuesta. Ej.: Primero se realiza el experimento 6, luego el 8 etc.
La aleatorización permite que cualquier factor no controlado que pueda estar operando no este produciendo un efecto sobre le resultado del análisis.
2n Medicina UPF- UAB Los efectos se calculan a partir de la diferencia entre las medias de la variable Y en los experimentos en el que el factor toma valor + y las medias de la variable Y en los experimentos en el que el factor toma valor -.
Media de las variables Y obtenidas a nivel (+).
  Media de las variables Y obtenidas a nivel (-).
  NOTA: EA= efecto del ácido acético Observamos que el efecto del ácido acético es de -0,357. Esto indica que el rendimiento de la prueba disminuye cuando pasamos del nivel bajo al nivel alto de ácido acético. Por lo tanto añadir dicho producto no es bueno para el rendimiento.
Los cálculos pueden repetirse para los tres factores, obteniendo como resultados: Para estimar cada uno de los efectos se han utilizado todas las experiencias (es decir, 4 réplicas) lo que mejora la precisión con respecto a un diseño OVAT. Cualquier error experimental esta minimizado.
Si el efecto de los aditivos fuera independiente, el efecto de M, sería igual para niveles altos y bajos de A.
¿Es así? Para saberlo debemos calcular el efecto de la interacción MA del mismo modo que se ha explicado anteriormente, restando las medias de las variables Y de las experiencias + + y - - a las de las experiencias + - y - + o bien se calcula mediante la media de los efectos: 𝐸!" = 10 + 10,7 + 9,3 + 11,7 9,5 + 11 + 11,9 + 8,8 −   = 𝟎, 𝟏𝟐𝟓 4 4 Media de los efectos: E AM = EMA + − EMA − 2.05 − 1.8 = = 0.125 2 2 Observamos que el efecto del metanol en función de niveles altos o bajos de A no es el mismo.
2n Medicina UPF- UAB De hecho, es sencillo calcular todas las interacciones, definiendo los efectos de interacción que toman como signo el producto de los efectos principales: Efectos principales Por lo tanto multiplicando los signos de los efectos principales podemos calcular las interacciones.
Ej.: E AM = Y1 − Y2 − Y3 + Y4 + Y5 − Y6 − Y7 + Y8 = 0,125 4 El efecto de la interacción AM seria el resultado de la suma de todos los valores de Y positivos (Exp1= 10.0, Exp4= 10,7, Exp5= 9,3, Exp8= 11,7)/ 4 menos la suma de todos los valores de Y negativos (Exp2= 9,5, Exp3= 11, Exp6= 8.8, Exp7= 11.9)/ 4. = 0,125 Calculando los efectos principales y todas las interacciones de los factores podríamos determinar el efecto en general de todos los aditivos en nuestro estudio: Observamos que el resultado de nuestro experimento mejora a niveles altos de M y bajos de A. Al mismo tiempo se aprecia que el efecto de C es muy pequeño, pero más intenso cuando se asocia con M.
Hasta ahora hemos hecho un estudio descriptivo, aplicable solo para esta muestra Hemos visto cómo pueden calcularse manualmente los efectos principales y de interacción Como podemos ver si estos efectos que hemos visto en la muestra pueden ser estadísticamente significativos y aplicarlos en la población? 2n Medicina UPF- UAB MÉTODOS DE ANÁLISIS DE RESULTADOS Existen modos más prácticos para analizar los resultados: - Algoritmo de Yates ! Permite calcular todos los efectos de modo muy sencillo.
- ANOVA ! Permite calcular todos los efectos y su significancia estadística.
o Algoritmo de Yates: Es un modo sencillo de calcular todos los efectos de diseños factoriales completos y fraccionales (que veremos más adelante).
Se comienza por construir una tabla con los experimentos ordenados de modo estandarizado: * Tenemos un factor A y añadimos un factor B duplicando las condiciones (+ o -) * * * Al añadir otro factor C debemos duplicar las columnas de A- B y colocar en C los cuatro primeros – y los cuatro últimos +.
Seguidamente obtenemos el rendimiento y para calcular los efectos: 1. Sumamos todas las parejas 2. Restamos todas las parejas 1 3. Volvemos a sumar y a restar las parejas 3 Volvemos a sumar y a restar las parejas… 2 2n Medicina UPF- UAB Si dividimos la primera de la fila por 8 (número de experimentos) y luego por 4 (mitad de experimentos) tendremos calculados los efectos y corresponden a las columnas con un más. El efecto de A es de -0,375 Los efectos calculados corresponden a los factores que toman valor + en la tabla de diseño El primer valor es la media de las respuestas.
o ANOVA El uso de diseños factoriales permite que algunos efectos puedan estimarse comparando más de una pareja de resultados.
Los efectos se cuantifican en forma de suma de cuadrados y se contrastan usando ANOVA frente a la suma de cuadrados residual.
! En el caso de un diseño factorial completo ANOVA puede usarse para estimar la significancia estadística de los efectos principales.
Basta introducir la matriz de diseño en un programa como SPSS: Seleccionamos el modelo de estudio de efectos principales.
2n Medicina UPF- UAB El análisis se realiza utilizando el Modelo Lineal General Calculando los efectos del cada factor (A, M y C) obtenemos directamente la significancia estadística.
Solo el efecto de M es estadísticamente significativo También puede usarse ANOVA para obtener los coeficientes y estimar la significancia estadística de efectos principales y de interacción.
Para estudiar la significancia es necesario que el diseño tenga más experiencias que efectos hay en el modelo.
En el ejemplo, sólo puede estimarse la significancia estadística de los efectos principales y los de interacción de dos factores .
Si quisiéramos evaluar todos los factores mediante ANOVA, lo que ocurre es que nos aparece un 0.
Hemos aplicado tantos factores que nos hemos quedado sin grados de libertad Hasta ahora hemos hablado de diseño factorial completo.
" Diseño factoriales fraccionales Cuando es necesario estudiar muchos factores, los diseños experimentales completos pueden requerir muchos experimentos: Tantos experimentos son necesarios únicamente en caso de que queramos calcular los efectos de todas las interacciones.
2n Medicina UPF- UAB Cada vez que queramos estudiar en nuestro estudio un factor más se va a multiplicar por dos el número de experimentos que tenemos que realizar. Son necesarios hacer tantos experimentos? Realmente no.
Lo más lógico es realizar un estudio simplificado llamados diseños factoriales fraccionales. Es el método más sencillo que estudia varios factores.
Habitualmente la mayoría de las interacciones de factores no tienen efectos estadísticamente significativos y sólo nos interesan los efectos principales o las interacciones de unos pocos factores.
NOTA: Fraccional= hace una fracción del diseño. Se basa en partir en dos un diseño. Ej.: si partimos de un diseño factorial de 23 nuestro diseño factorial fraccional será de 2 3-1 es decir tendrá un diseño de 22 Normalmente, las fracciones se construyen haciendo un diseño con menos factores y construyendo los restantes a base de “multiplicar los signos”     Si queremos estudiar otro factor (C) sin añadir otro experimento añadimos una columna que multiplique los efectos (A·B), es decir, multiplicamos el signo de cada columnas.
Una vez obtenida la columna C ya podemos estudiar 3 factores mediante un diseño de 22 experimentos.
En el ejemplo, hemos seleccionado los experimentos en los que C=AxM Este diseño se denomina factorial fraccional 23-1 y contiene 4 experimentos Si se hace la otra mitad (1, 4, 6 y 7), se obtiene otra fracción equivalente Cuando hemos decidido substituir un diseño factorial completo (23) por un fraccional (23-1), estamos quitándonos algunos experimentos (gris claro).
2n Medicina UPF- UAB En este diseño factorial, algunas columnas tienen los mismos signos (A=MC, M=AC y C=AM).
Estos efectos se dice que están “confundidos”, de manera que cuando determinamos el efecto de A también estamos determinando el efecto MC.
Esto no es un problema si únicamente nos interesan los efectos principales.
- Diseño factoriales con medidas repetidas En otras ocasiones, lo que nos interesa es determinar con precisión los efectos.
En estos casos pueden llevarse a cabo diseños factoriales completos, repitiendo n veces cada una de las experiencias del diseño.
En estos casos es imprescindible aleatorizar el orden en que se llevan a cabo las experiencias, para evitar que factores no controlados alteren los resultados. Ej.: si la humedad del ambiente tiene un papel debemos procurar que se distribuya de forma aleatoria.
OTROS DISEÑOS EXPERIMENTALES Existen otros métodos de diseño experimental, adaptados a necesidades específicas: - Si se necesita explorar con más detalle el espacio experimental !Diseños factoriales a 3 niveles (factoriales de 3^n) el precio a apagar es que tenemos que hacer muchos más experimentos.
- Si las experiencias son muy caras o difíciles ! Diseños económicos (Plackett-Burman, Matrices de Hadamard) permiten generar diseños saturados (tienen mucha información con muy poca experiencia).
- Si no se pueden fijar las condiciones ! Selección de condiciones de entre un conjunto de experimentos candidatos. Diseños D-óptimos (de un conjunto de experimentos candidatos cuales son el subconjunto que es factible) Ej.: Si queremos hacer un estudio con unos pacientes con una cierta característica de edad, masa corporal etc. no podemos diseñar a un paciente (Coger exactamente a un paciente de 1,80 ICM de 35 y edad de 35 años). En estas situaciones que tenemos candidatos podemos aplicar técnicas para determinar subconjuntos que tengan la máxima de información con el mínimo numero de individuos.
Sea como sea, siempre se deben planificar cuidadosamente los experimentos ...

Comprar Previsualizar