Conceptos Básicos (2014)

Apunte Español
Universidad Universidad Politécnica de Cataluña (UPC)
Grado Administración y Dirección de Empresas - 2º curso
Asignatura Estadística 2
Año del apunte 2014
Páginas 13
Fecha de subida 11/09/2014
Descargas 3
Subido por

Descripción

Apuntes explícitos y detallados

Vista previa del texto

21/02/2013 ¿Qué es la Econometría? En términos literales econometría significa “medición económica”. Sin embargo, aunque la medición es una parte importante de la econometría, el alcance de esta disciplina es más amplio (Gujarati & Porter, 2010): • La econometría, …, consiste en la aplicación de la estadística matemática a los datos económicos para dar soporte empírico a los modelos construidos por la economía matemática y obtener resultados numéricos Estadística II 1 – Estadística y Econometría:  Introducción y Conceptos básicos • . . . la econometría puede definirse como el análisis cuantitativo de fenómenos económicos reales, basados en el desarrollo simultáneo de la teoría y la observación, relacionados mediante métodos apropiados de inferencia 1 2 ¿Qué es la Econometría? ¿Qué es la Econometría? • La econometría se define como la ciencia social en la cual las herramientas de la teoría económica, las matemáticas y la inferencia estadística se aplican al análisis de los fenómenos económicos • Los econometristas… son una ayuda decisiva en el esfuerzo por disipar la mala imagen pública de la economía (cuantitativa o de otro tipo) considerada como una materia en la cual se abren cajas vacías, suponiendo la existencia de abrelatas, para revelar un contenido que diez economistas interpretarán de 11 maneras diferentes • La econometría tiene que ver con la determinación empírica d llas lleyes económicas.
de ó i • El método de la investigación econométrica busca en esencia una conjunción entre la teoría económica y la medición real, con la teoría y la técnica de la inferencia estadística como puente • El arte del econometrista consiste en encontrar un conjunto de supuestos lo bastante específicos y realistas para que le permitan aprovechar de la mejor manera los datos con que cuenta.
3 ¿Qué es la Econometría? 4 ¿Qué es la Estadística? En resumen La Econometría es el uso de la Estadística en datos económicos para • Construir Construir, validar y dar soporte empírico a los modelos de la Teoría Económica La estadística es una ciencia interdisciplinar, cuyo objetivo básico es el diseño de la recogida de datos y su transformación en información útil para la toma de decisiones en presencia de variabilidad en el entorno.
entorno • Proporcionar una estructura para efectuar predicciones racionales y consistentes.
5 6 1 21/02/2013 ¿Qué es la Estadística? ¿Qué es la Estadística? La estadística es el método fundamental del razonamiento cuantitativo, puesto que permite separar aquello que es esencial en el hecho bajo análisis, hacer generalizaciones a partir de observaciones y determinar pautas de comportamiento y tendencias futuras.
futuras Necesidad de información Preguntas Presentación Datos  (respuesta a la pregunta) (relevantes a las preguntas) Análisis 7 ¿Qué es la Estadística? La estadística es la tecnología del método científico Hipótesis, teorías, intuiciones, modelos, … Inducción Deducción Estadística La estadística es el método fundamental del razonamiento cuantitativo, puesto que permite separar aquello que es esencial en el hecho bajo análisis, hacer generalizaciones a partir de observaciones y determinar pautas de comportamiento y tendencias futuras.
futuras POBLACIÓN Probabilidad Datos, hechos, sucesos, ...
8 MUESTRA Se trata de generar continuamente nuevos  conocimientos mediante el contraste entre las  predicciones (deducidas científicamente de las  teorías) i los hechos (datos) 9 10 Conceptos Básicos: Muestra y Población Población: conjunto de todos los elementos que estamos estudiando, de los que intentamos extraer conclusiones. Levin & Rubin (1996) Muestra: subconjunto de la Población, Población recogido para la realización del estudio 1.2 Conceptos Básicos 11 12 2 21/02/2013 Conceptos Básicos: Muestra y Población POBLACIÓN Conceptos Básicos: Muestra y Población POBLACIÓN Ejemplos  Estimar la proporción de votos de los diferentes partidos, en base a una encuesta previa ?  Predecir series de datos económicos (p. ej. IPC, PIB)  Estudiar la incidencia del efecto de la tarifa eléctrica en el IPC Estadística Probabilidad  Predecir la demanda de energía eléctrica del Estado Español en el año 2015 mes a mes.
?  Optimizar el rendimiento de un proceso (p. ej. una central térmica) MUESTRA MUESTRA  Decidir si una vacuna es efectiva o no 13 Conceptos Básicos: Muestra Aleatoria Simple 14 Conceptos Básicos: Variable Aleatoria Concepto intuitivo de muestra aleatoria simple (m.a.s.) Variable aleatoria: es una variable estadística cuyos valores se obtienen de mediciones en algún tipo de experimento aleatorio.
Ejemplos Población Muestra • Es una variable cuyo valor desconocemos hasta que realizamos su medición • Su valor depende del azar m.a.s.: Todo elemento de la población tiene la misma probabilidad de ser escogido per formar parte de la muestra • Puede tomar cualquier valor? Y1, Y2, ..., Yn son INDEPENDIENTES 15 16 Conceptos Básicos: Variable Aleatoria Conceptos Básicos: Distribución de Probabilidades Cuantitativas Podemos dibujar un histograma con cada medida tomada • Continuas. Ejemplo: peso, edad, talla de la variable de interés Y.
• Discretas. Ejemplo: nº de hijos, nº de pacientes atendidos Cualitativas (atributos) • Ordinales. Ejemplo: grados de satisfacción, días de la semana El contenido és una  v.a.
Cada botella tiene un  valor de contenido diferente, pero no es  un valor cualquiera:  el contenido tiene un  patrón de  comportamiento!  • Nominales – Dicotómicas. Ejemplo: vivo/muerto, varón/mujer – Politómicas. Ejemplo: raza, grupo sanguíneo 17 18 3 21/02/2013 Conceptos Básicos: Distribución de Probabilidades MUESTRAS n=20 POBLACIÓN (modelos probabilísticos) n=200 n   hi  0 n=2000 Conceptos Básicos: Distribución de Probabilidades La distribución de probabilidad de una variable aleatoria (v.a.) es una función que asigna probabilidades a los valores de una v.a..
La distribución de probabilidad de una v.a. es un modelo matemático que aproxima el comportamiento real de la v.a.
PROCESO PROCESO PROCESO La distribución de probabilidad está completamente especificada por la función de distribución, cuyo valor en cada real x es la probabilidad de que la variable aleatoria sea menor o igual que x F(y0) = prob(Y≤ y0) PROCESO 19 Conceptos Básicos: Distribución de Probabilidades 20 Conceptos Básicos: Distribución de Probabilidades Distribuciones de v.a. continuas Distribuciones de v.a. discretas Densidad de  probabilidad Distribució de probabilitat 0.2 0.1 Función de  distribución 0 0 1 2 3 4 5 y 6 7 8 9 10 21 Conceptos Básicos: Distribución de Probabilidades 0.30 Longitud 2.48532 3.16130 3.17324 4.84210 3.45669 4.50397 3.00624 3.38951 3.92102 3.79965 2.67593 3.93345 2.81846 1.45088 3.65812 5.84571 2.52827 3.55290 3.54221 3.79386 3.44910 4.27420 4.04593 2.73481 4.47659 2.08714 5.44889 3.99656 4.09325 4.72705 3.34621 3.06496 3.68743 4.86279 3.33168 22 Distribuciones de Probabilidades: D. Normal 0.25 Qué modelo es el adecuado para estos datos? Densidad de probabilidades de la ley normal 0.20 0.15 0.10 f y  = 0.05 0.00 9 0 5 10 15 20 25 - 1  y - μ 2 σ2 1 e2 σ 2π Exponencial 8 amb : -  < μ <   σ > 0 0.4 7 6 Geometría de la ley normal 0.3 5 4 0.2 3 2 0.1 1 0 2 3 4 Longitud 5 6 0.0 0 1 2 3 4 5 6 7 Weibull 0.4 0.3 0.2 0.1 0.0 1 2 3 4 Normal 5 6 23 24 4 21/02/2013 Distribuciones de Probabilidades: D. Normal Distribuciones de Probabilidades: D. Normal Utilidad de la ley normal (I) Cuando existen muchas causas de variabilidad, cada una de ellas tiene un impacto parecido, la variabilidad total puede describirse mediante la ley normal Ejemplos: Significado estadístico de los parámetros  y   Tiempo para ir de casa a EAE y ~ N μ; σ  : Media Poblacional; Desviación típica Poblacional  Ventas semanales de una cadena de supermercados Para el cálculo de Probabilidades:   Contenido de líquido en botellas de 1l de … P(X≥a) = 1- P(X<a) [todas las distribuciones] P(X<-a)=P(X>a) [distribución Normal, simetría]  … 25 Distribuciones de Probabilidades: D. Normal 26 Distribuciones de Probabilidades: D. Normal Ejemplo distribución de las puntuaciones medias al lanzar 1, 2, 3, 5 y 10 dados.
27 Distribuciones de Probabilidades: D. Normal 28 Distribuciones de Probabilidades: D. Normal CÁLCULO DE PROBABILIDADES Utilidad de la ley normal (y II) X ~ N ( 100; 5 )  Probabilidad = área bajo la curva Muchos métodos estadísticos (entre ellos, los que vamos a estudiar) son robustos ante la hipótesis de normalidad La mayoría de los métodos que veremos durante el curso se deducen suponiendo normalidad en las observaciones.
Sin embargo, muchas veces aunque esta hipótesis no se cumpla, los métodos siguen siendo útiles.
P (X > 105)=  0.5 P (X < 90 ) = P (105 < X < 110 )= 90   f(x) dx 110   f(x) dx   f(x) dx - Como calculamos el área si la d.p. de la  105 -1  x -μ 2 1 normal no tiene primitiva?  f x  = e2 σ 2π 29 σ 2 30 5 21/02/2013 Distribuciones de Probabilidades: D. Normal Distribuciones de Probabilidades: D. Normal Cálculo de Probabilidades Cálculo de Probabilidades Es necesario TABULAR la función de distribución de la Ley Normal N(μ;σ) para cálculo numérico.
X ~ N(μ, σ) Z Y = X ‐ μ Centrar Sin embargo, hay infinitos valores posibles de los parámetros μ y σ !!! Y X    Reduir Z ~ N(0, 1), y el valor de Z nos dice a cuantas desv. típicas se encuentra el valor de la media poblacional Solución? La Ley Normal Estándard! 31 Distribuciones de Probabilidades: D. Normal X ~ N ( 100; 5) 1r decimal de z 32 Distribuciones de Probabilidades: D. Normal 2n decimal de z Prob ( X < 96,3 ) ? Prob(μ – σ < X < μ + σ) =  Canvi de variable: Z = 1 – Prob(X > μ + σ) – P(X < μ ‐ σ) = 1 – 2Prob(X > μ + σ) = X μ 96,3  100  σ 5   = 1 – 2Prob  Z  zz= – 0,74 Prob ( X < 96,3) = Prob (Z < ‐ 0,74) (μ  σ)  μ   σ  = 1 – 2Prob(Z > 1) = 1 – 0.317 =  Prob ( Z< – 0,74 ) = Prob ( Z > 0,74) = 0.683 (per simetria) Prob (Z > 0,74) = 0,2296 33 34 Distribución de la media muestral Distribución de la media muestral Si Ejemplo  X es v.a.
 X ~ N(μ, σ)  La media de n observaciones es x  n x i 1 n i  1 x1  x2  ...  xn  n entonces  x es v.a.
     x ~ N  , n   Muestra 1 183,7 178,5 160,0 171,9 176,6 160,0 174,3 160,0 170,1 170,1 160,3 165,5 172,3 176,5 175,5 173,8 181,1 166,7 166,3 174,0 173,4 171,6 174,0 173,2 162,2 Mitjana = 170,9 35 Muestra 2 171,9 188,5 168,3 176,4 173,0 171,0 161,8 169,2 169,0 177,6 165,5 171,7 181,9 173,7 185,5 169,1 184,0 163,0 153,8 186,5 167,9 176,0 171,0 177,5 165,7 ...
Medias muestrales 170,9 172,8 169,5 168,8 171,1 171,1 172,5 170,4 170,5 170,7 172,4 169,6 169,7 166,7 170,6 169,8 171,2 169,4 170,4 168,7 170,7 173,6 168,2 171,5 170,7 Mitjana = 172,8 36 6 21/02/2013 Distribución de la media muestral Distribución de la media muestral Distribución de la altura media de muestras de tamaño 25 Las medias de muestres de 25 individuos Y25 ~ N(170; 1,6) 25 20 160 170 180 Distribución de alturas individuales Y ~ N(170; 8) 15 Los 25 valores de una de las muestras 10 5 Hay más dispersión en los valores individuales que en 0 las medias muestrales 1.4 1.5 1.6 1.7 1.8 1.9 2.0 Altura 37 Distribuciones de Probabilidades: D. muestrales 38 Distribuciones de Probabilidades: t-Student Ley Normal y t-Student • t-Student: para trabajar con la media muestral • Χ2-cuadrado (Chi-cuadrado): para la variancia X ~ Nμ ; σ   Z = • F: para la comparación de variancias (y más …) t= Cuantos mas grados de libertad, más se parece una t-Student a una Normal X-μ ~ N0 ;1 σ X-μ ~ t - Student con  n - 1 grados de libertad s Usaremos la Ley Normal cuando conozcamos σ Usaremos la t-Student cuando NO conozcamos σ y tengamos que usar s (desv. típica muestral) 39 Distribuciones de Probabilidades: t-Student 40 Distribuciones de Probabilidades: t-Student Ley Normal y t-Student: medias muestrales Cálculo de probabilidades Para observaciones individuales X ~ Nμ ; σ   Z = Usaremos tablas (o R) t= X-μ ~ N0 ;1 σ X-μ ~ t - Student S d con  n - 1 grados d de d libertad lib d s Para medias muestrales x ~ N ( ;  n )z x   ~ N0,1 n t= 41 x -μ ~ t - Student con   n - 1 grados de libertad s n 42 7 21/02/2013 Distribuciones de Probabilidades: Chi-cuadrado Distribuciones de Probabilidades: Chi-cuadrado f 2  Χ2: distr. Chi-cuadrado Χ2: distr. Chi-cuadrado Zi ~ N0;1 f 2  =20 0,95  2 =  Zi2 10,85  2 i =1 2 La forma de la distribución de probabilidades χ2 depende  de ν Valores que dejan el área  de cola indicada en función  de los grados de libertad.
43 44 Distribuciones de Probabilidades: F de Snedecor Sean U ~ 21 V ~ 22 entonces: F= independeentse U 1 V 2 1 1 1 1 1 se distribuye según una ~ F - Snedecor  1;  2  distribución F-Snedecor con 1 y 2 grados de libertad  1;  2  1  2;  2  1  5;  2  2  100 ;  2  1  100 ;  2  100 ‐ La F‐Snedecor no es en general simétrica ‐ Depende de 2 parámetros:  Los g.ll. del numerador Los g.ll. del denominador 1.3 Estimación y Contraste de  Hipoótesis donde F corresponde α F( 1 , 2 )  F( 2 , 1 ) al percentil (1- α) 45 Problema básico 1: Estimación 46 Problema básico 1: Estimación Estimación Ejemplos Dada una población, sus parámetros suelen ser desconocidos (µ, δ, ...), pero de interés • Cuánto gastan mensualmente los universitarios en ocio? (o en libros, o en teléfono, o en transporte, …) • Qué proporción de jóvenes/adultos consume cocaína? A partir de los datos de una muestra, muestra calculamos estadísticos (que no son de interés por ellos mismos) que nos permitan estimar el verdadero valor del parámetro de interés • Cuántos votos sacará cada partido en las elecciones • Cuántos parados hay (EPA)? • Mejoran mis ventas tras una promoción? • ...
47 48 8 21/02/2013 Problema básico 1: Estimación Problema básico 1: Estimación Estimación: 2 métodos Estimación: 2 métodos 1 - Estimación puntual • E(Y)= µ 2- Estimación por intervalo de confianza La estimación puntual presenta un problema: el estimador no coincide con la cantidad que quiere estimar (p (parámetro) ) E(Y) es el valor esperado d Y de Los podemos substituir por unos intervalos (Intervalos de confianza) de los cuales podemos esperar que, con un grado razonable de certeza (la confianza), contengan el verdadero valor del parámetro  E Y =μ No sesgado.
  lim V Y = lim Es consistente n n σ2 =0 n V(Y) es la variancia de Y 49 Problema básico 1: Estimación 50 Problema básico 1: Estimación 1 ‐  distribución de las medias.  Sumamos y restamos este  / 2 zα/2 μ segmento σ n / 2 a cada punto.  y 1- μ α 2 yα 2 yα/2 yα/2 Yα/2 - μ σ  Yα/2 - μ = zα/2 σ n n σ σ   Y  μ + zα/2 Prob μ - zα/2  = 1- α n n  σ σ   - μ  -Y + zα/2 Prob - Y - zα/2  = 1- α n n  σ σ   μ  Y - zα/2 Prob Y + zα/2  = 1- α n n  zα/2 = Tomamos valores de la  IC 1-α per µ es el valor de     que deja  Y un área de cola a la  derecha de /2 σ σ  cuando conocemos   Y - zα/2 n ; Y + z α/2 n  s s   cuando  es desconocida,   Y - tn-1; α/2 n ; Y + tn-1; α/2 n  y la estimamos con s Y -μ σ z α/2 = α/2  Yα/2 - μ = z α/2 σ n n 51 Problema básico 1: Estimación 52 Problema básico 1: Estimación Qué pasa si queremos más confianza, y en lugar de un Estimación de la variancia  IC del 95% hallamos el IC del 97%, o del 99%? Estimación puntual Cuanta más confianza, más ancho es el intervalo, y menos nos  • E(s2)=  informa de donde está el verdadero valor de  Y Estimación por intervalo de confianza s2 • Como que (n  1) 2 ~  n2 1  IC 95% IC 97% IC 99% 53 54 9 21/02/2013 Problema básico 1: Estimación Problema básico 1: Estimación s2 (n  1) 2 ~  n21   Tenemos una muestra de 8 potes de café con pesos (g): 2 n 1 206 203 201 212 194 176 208 201 / 2 / 2 2 n-1;1- α 2 2 n- 1; α 2 IC 1‐α per 2   2 2 (n - 1) s ;(n - 1) s   2 α 2 α  n-1; n-1;1-   2 2   Prob 2 α  n2-1  2 α  = 1- α n-1;  n-1;1- 2 2   s2 Prob 2 α  n - 1 2  2 α  = 1- α 1 1n-1; 1 σ  n-1;1 2 2  2 α 2 α  n-1;  n-1;1- 2  1 2  2 Prob  = 1- α 2 σ (n - 1)s2   (n - 1)s      (n - 1)s2 (n - 1)s2  2 Prob 2 σ   = 1- α 2 α   n-1;1- α n-1;   2 2 55 Problema básico 1: Estimación. Resumen 56 Problema básico 2: Inferencia Estimación puntual de µ Inferencia : contraste de hipótesis Método que nos permite tomar decisiones sobre el conjunto de la población a partir de los datos de una muestra.
Algunas preguntas que podemos responder: conocida IC 1-α para µ desconocida  µ > a? (donde a es un valor) Estimación puntual de σ2  µA > µB? Dado el modelo Yi = β0 + β1·Xi + ε  β1 ≠ 0? IC 1-α para σ2  β1 > 0?; β1 < 0?; β1 > 1? … 57 Problema básico 2: Inferencia Problema básico 2: Inferencia 2. Tomamos datos y calculamos el estadístico de prueba.
Se esconde un ser humano detrás del telón?  ? 58 Estadístico de prueba: número que podemos calcular a partir de nuestros datos, y que sabemos como se distribuye cuando Ho es cierta.
(tenemos la sospecha de que podría tratarse  de un marciano) En nuestro caso: la altura de la criatura detrás del telón 1. Planteamos la hipótesis nula frente la hipótesis alternativa 240 240 cm Al medirlo, se obtiene una altura de 2,40m H0: Es un ser humano H1: No es un ser humano Si hay evidencias suficientemente claras,  rechazaremos la hipótesis nula y nos  quedaremos con la alternativa.  La que suponemos verdadera  hasta que se demuestre lo  contrario. Por defecto nos  quedamos con esta.  59 3. Comparamos el estadístico de prueba con su distribución de referencia Distribución de referencia: La que sigue el estadístico de prueba si la hipótesis nula es cierta.
60 10 21/02/2013 Problema básico 2: Inferencia Problema básico 2: Inferencia Tenemos que comparar Si la hipótesis nula es cierta (la criatura es un ser humano), sabemos como se distribuye el estadístico de prueba (la altura) H0: Es un ser humano nuestro estadístico de H1: No es un ser humano prueba (en este caso, la altura de la criatura, 240 cm) con la distribución de H0: Es un ser humano referencia H1: No es un ser humano 100 120 140 160 180 200 220 240 Altura Es razonable pensar que un valor como este viene de la distribución de 100 120 140 160 180 200 220 referencia? No. Entonces seguramente Ho no es cierta. Nos quedamos con H1 240 Altura 61 Problema básico 2: Inferencia H0: Es un ser humano 62 Problema básico 2: Inferencia Si el estadístico de prueba (la H1: No es un ser humano altura de la criatura) hubiera sido 180 cm, no podríamos rechazar H0. Es perfectamente posible que este valor venga Como cuantificamos hasta qué punto nos creemos o no que el estadístico de prueba viene de la distribución de referencia? Con el p-valor p-valor: el p-valor indica la probabilidad de tener valores como el estadístico de prueba o mayores (en valor absoluto) siendo H0 cierta.
de la distribución de referencia.
100 120 140 160 180 200 220 p-valor pequeño: rechazamos H0 (aunque en un cierto número – pequeño – de casos, obtenemos este valor siendo H0 cierta) 240 Altura Cuando no tenemos suficiente evidencia para rechazar la H0, nos p-valor gran: no rechazamos H0 quedamos con ella.
En este caso, no podemos decir que no sea un ser humano.
100 120 140 160 180 200 220 240 100 120 140 Altura 160 180 200 63 Problema básico 2: Inferencia Problema básico 2: Inferencia Planteamos H0 i H1 equivocarse! Esquema del razonamiento del Contraste de hipótesis NUNCA demostramos que H0 sea cierta, simplemente no hallamos suficiente evidencia para rechazarla Obtenemos datos Calculamos el estadístico de prueba Lo comparamos con la distribución de referencia En nuestro ejemplo, con 180 cm de altura no rechazamos H0 y nos quedamos con 240 64 Como norma general, rechazamos H0 si el p-valor < 5 % Pero atención, esto dependerá de les consecuencias que tinga que es un ser humano.
220 Altura 180 cm Pero al abrir el telón podríamos tener esto: Rechazamos H0 65 NO Nos creemos que viene de esta distribución? SÍ Nos quedamos con H0 66 11 21/02/2013 Problema básico 2: Inferencia Problema básico 2: Inferencia Error tipo I: Pr(rechazar H0 | H0 cierta)  falso positivo El razonamiento del contraste de hipótesis es parecido al de un juicio • Declarar el acusado culpable cuando en realidad es inocente.
H0: Declaramos al acusado no culpable.
H1: Declaramos al acusado culpable.
• Que te diagnostiquen una enfermedad, cuando en realidad estás sano.
Lo que decidimos: • Concluir que la temperatura afecta al rendimiento de una reacción, Tribunal declara al acusado H0: NO CULPABLE INOCENTE Acertamos! cuando realmente no afecta.
H1:CULPABLE Error tipo II: Pr(aceptar H0 | H0 falsa)  falso negativo Error tipo I • Declarar el acusado inocente cuando en realidad es culpable.
La realidad: El • Que et digan que estás sano, cuando en realidad estás enfermo.
acusado es • Concluir que la temperatura no afecta al rendimiento de una CULPABLE Error tipo II Acertamos! reacción, cuando realmente sí que afecta.
67 Problema básico 2: Inferencia Problema básico 2: Inferencia Ejemplo: Ejemplo: Un proceso llena botellas con un contenido que sigue una N(; ).
(No sabemos cuanto valen ni  ni ) 3. Hacemos un análisis exploratorio de datos. En este caso, un diagrama de puntos.
El ingeniero de la planta productora quiere saber si el proceso está centrado en  = 200 o si está centrado en un valor menor.
1 Planteamos H0 i H1 1.
H0  = 200 H1  < 200 68 Otras posibilidades para H1 serian: H1:  > 200 H1:   200 190 195 200 205 210 4. Comprobamos las hipótesis en las que se basa la metodología.
En este cas, la muestra tienen que ser realmente una m.a.s.
Del gráfico vemos que y es aproximadamente normal.
2. Tomamos una m.a.s. de las botellas producidas en el proceso, y medimos su contenido: 69 Problema básico 2: Inferencia Ejemplo: Ejemplo: 5. Calculamos el estadístico de prueba El estadístico de prueba es un número que podemos calcular a partir de nuestra muestra y que: - Tiene que ser relevante para verificar la validez de H0 - Tiene que tener una densidad de probabilidad (distribución de referencia), conocida en el cas de que H0 sea cierta En este caso, el estadístico de prueba es: t= Problema básico 2: Inferencia Y - μ0 ~ t - Student n-1 s n µ0: La µ si la H0 es cierta Con los datos de las botellas...
t= Y - 200 199 - 200 = = - 1,014 s 4,41 n 20 H0  = 200 H1  < 200 6. Comparamos el estadístico de prueba con la distribución de referencia, y calculamos el p-valor.
a es el valor del estadístico (en este caso, -1,014).
La distribución de referencia es una t-Student con n-1 g.l. (n–1 = 20–1=19) a p-valor = a = 0,1562 -1.014 Si H1 hubiera sido   200 el p-valor seria 2a 12 21/02/2013 Problema básico 2: Inferencia Ejemplo: Problema básico 2: Inferencia Relación entre p-valor e Intervalo de Confianza El p-valor es la probabilidad de observar un valor del estadístico del experimento tan extremo (o incluso más) que el obtenido si fuera cierta la H0.
p-valor = 0,1562 Como el p-valor es bastante grande no se rechaza la grande, hipótesis nula: no podemos decir que µ< 200 Al final, la decisión de si rechazamos o no la hipótesis nula no es un problema estadístico: depende del riesgo que estamos dispuestos a asumir.
Si tenemos la situación: H0: µ = µ0 H1: µ ≠ µ0 Otro planteamiento es: en lugar de calcular el p-valor, hallar un IC per la µ y ver si este IC incluir o no el valor µ0.
Por qué? Recordemos: IC 1 1-α α per µ Hay una relación entre p-valor y IC: s s  Y - tn-1; α/2 n ; Y + tn-1; α/2 n  Ejemplo: ConH0: µ = 50; H1: µ ≠ 50 IC del 95% para µ [48; 52]. Incluye el 50, p-valor > 5% IC del 97% para µ [50; 53]. El 50 está en un extremo, p-valor = 3% IC del 98% para µ [51; 53]. No incluye el 50, p-valor < 2% 13 ...