TEMA1_ESTADISTICA DESCRIPTIVA (2017)

Apunte Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Fisioterapia - 1º curso
Asignatura Bioestadística
Año del apunte 2017
Páginas 6
Fecha de subida 03/09/2017
Descargas 0
Subido por

Vista previa del texto

Paula Espinàs Gómez ESTADÍSTICA Francesc Boixader TEMA 1: Estadística descriptiva 1.1 Definiciones Estadística: Ciencia que estudia los métodos y los procedimientos para recoger, ordenar, analizar, presentar, sintetizar e interpretar los datos referentes a un fenómeno que presenta variabilidad con el objetivo de deducir las leyes que describen estos fenómenos y poder realizar previsiones sobre los mismos, tomar decisiones u obtener conclusiones.  “Intenta obtener información a partir de unos datos. A partir de la información podemos tomar decisiones.” En general la estadística aplica el método científico. Se diseña un experimento a partir del cual podamos encontrar datos con los que trabajar para obtener información que nos permita resolver el problema.
La estadística está formada por dos sub-bloques: la estadística descriptiva (intenta describir la realidad a través de datos) y la estadística inferencial (como sacar conclusiones generales a partir de una “pequeña” muestra).
Estadística descriptiva: Nos ayuda a describir el mundo real con mucha precisión a partir de unos datos recogidos. Tenemos que escoger muy bien la muestra a la que analizaremos para que los datos obtenidos puedan describir bien el mundo real. La importancia de escoger bien la muestra nos dará la posibilidad a hacer una inferencia. La estadística descriptiva que trabaja sobre una muestra bien escogida i que intenta sacar un modelo matemático que nos permita predecir que le pasará a un individuo (extrapola los resultados a partir de una muestra al total de la población).
Inferencia: Conjunto de métodos y técnicas que permiten inducir, a partir de la información empírica proporcionada por una muestra, cual es el comportamiento de una determinada población con un riesgo de error medible en términos de probabilidad.
IMPORTANTE PARA EXAMEN 1.2 Etapas de un estudio estadístico 1. Planteamiento del problema: -Ámbito de aplicación (población) - ¿Qué queremos observar? (variables) 2. Formulación de hipótesis -¿Cuál es la solución que parece más probable al problema planteado? -Objetivo: contrastar la veracidad o falsedad de esta hipótesis 3. Diseño y recogida de datos -¿Qué individuos serán objeto de estudio?¿Cuantos? (muestra) -¿Qué datos es necesario recoger? (variables) -¿Qué método de muestreo es más adecuado? 4. Análisis de los datos (estadística descriptiva) 1 Paula Espinàs Gómez ESTADÍSTICA Francesc Boixader -Ordenación agrupación, comparación de datos… -Cálculo y estudio del comportamiento de ESTADISTICOS MUESTRAES 5. Inferencia y conclusiones (Estadística inferencial) -Obtener conclusiones sobre la población (paramentos) bajo estudio a través de la información obtenida en el estudio de la muestra.
*Leer “uso de los gráficos en medicina” Moodle* 1.3 Conceptos -Población: Conjunto de elementos o individuos que son objeto de nuestro estudio. Puede ser: • • Finita/infinita (si son personas siempre son finitas, una población infinita podrían ser las estrellas) Reales/hipotéticas Habitualmente no es posible el estudio de toda la población. Esta es la razón por la que no trabajaremos con la población sino con una muestra. La muestra tiene que ser representativa.
-Muestra: Subconjunto representativo de la población.
-Tamaño de la muestra: El número de elementos de la muestra. Suelen ser muestras grandes.
-Variable: Es una propiedad, algo que tienen en común todos los elementos de la población y que varía entre ellos. (Ej. Todos tienen hermanos pero no todos tienen el mismo número de hermanos).
CLASSIFICACIÓN DE LAS VARIABLES (se clasifican según dos criterios) 1ª Clasificación: • • Cualitativas: No se pueden expresar (o no se quieren) numéricamente.
Cuantitativas: Se pueden expresar numéricamente. Se pueden contar. Hay 2 subtipos: ▪ Discretas: Toman valores dentro de un conjunto discreto (1,2,3,4…). Son los valores naturales. Se podría decir que no admite valores decimales.
▪ Continuas: Puede tomar cualquier valor real en un intervalo. Son los números reales.
Se podría decir que admite valores decimales *Normalmente las constantes vitales son continuas. No tenemos que confundir las limitaciones del instrumento de medida con que la variable sea discreta (ej. Los gramos son una variable continua, pero en algunas balanzas no miden decimales).
2ª Clasificación: • • Unidimensional: Solo necesitas un valor para representarlo (altura).
Multidimensional: Se necesita más de un valor para representar cada observación de un elemento de la población. Para dar el valor necesitamos como dos o más valores.
Por ejemplo, para la presiona arterial necesitamos saber la sistólica i diastólica.
2 Paula Espinàs Gómez ESTADÍSTICA Francesc Boixader 1.4 Distribuciones unidimensionales NO HAY QUE SABERSE LAS FÓRMULAS, PERO SÍ IDENTIFICARLO EN UNA TABLA I SABER HACER UNA. LAS FÓRMULAS ESTÁN EN EL PP DE TEMA1 n: Número total de observaciones (muestra).
-Frecuencia absoluta (ni): Número de veces en que aparece un determinado valor de la variable. (Ej. Si miramos cuantos hermanos tiene la muestra, si 25 personas tienen 1 hermano y 5 personas tienen 3 hermanos, el 25 y el 4 son la frecuencia Ejemplo tabla 1) -Frecuencia acumulada: Va sumando, en plan…. Cada vez se suma la frecuencia absoluta (ver el ejemplo de la tabla uno).
-Frecuencia relativa: Se divide la frecuencia absoluta con la suma de todas las frecuencias (=muestra).
-Frecuencia relativa acumulada: Va acumulando todas las frecuencias relativas.
-Distribución de frecuencia: Conjunto formado por los distintos valores de la variable y la frecuencia de cada valor.
1.5 Tabulación de los datos La tabulación de los datos SIEMPRE se hace una vez se hayan recogido. Según como es la variable, la manera en que se tabulan los datos es distintos.
TABLA 1: Si la variable es cualitativa (bajo, medio, alto) o si es cuantitativa discreta con pocos valores (tabla 1: núm. Hermanos). Los valores se ordenan de menor a mayor.
3 Paula Espinàs Gómez ESTADÍSTICA Francesc Boixader TABLA 2: Si la variable es continua o discreta con muchos valores, la tabla será más compleja que la 1. Entre los dos valores contiguos habrá poca diferencia numérica. En este tipo de tablas se pierde información.
Rango: Medida que cuantifica la distancia entre los valores máximo y mínimo observados de la variable.
Intervalo de clase: Cada subdivisión del rango de valores de la variable.
Frecuencia de clase: Número de observaciones de la variable que entra dentro del intervalo de clase.
Marca de clase: Identificador del intervalo. Suele adoptarse el valor medio del intervalo.
1.6 Estadística descriptiva Descriptores de un conjunto de observaciones: Son los datos que reflejan la muestra que analizamos. Hay distintos tipos de descriptores: -De tendencia central: Aportan información sobre el centro de la distribución de datos (el centro de la gráfica).
Media aritmética: Se hace de diferente forma para datos agrupados i para datos no agrupados. Los datos agrupados son los de la tabla 1. Se suman todos los números y se dividen por el total de números (no agrupados). Cuando los valores están agrupados se hace de la misma manera, pero con las agrupaciones hechas.
Mediana: Es el valor central una vez ordenados de menor a mayor. Nos colocamos en un sitio que por un lado tengamos la misma cantidad de números que por el otro lado. Si en ese lugar hay un dato (coincide con un número), ese dato/número es la mediana y si no hay dato hacemos la media aritmética entre los dos datos adyacentes. Para la tabla tipo dos (de intervalos) es más difícil hacer la mediana (tendremos que poner la fórmula.) No siempre son valores reales, Ej: Aunque en la vida real no podamos tener 0’5 hermanos, por ejemplo, una mediana de 0’5 hablando de hermanos sería correcto.
Cuando n es par simplemente dividiremos entre dos, pero cuando n es impar haremos n+1. En la fórmula, X no es ningún valor, no significa nada.
4 Paula Espinàs Gómez ESTADÍSTICA Francesc Boixader Moda: Es el valor que se presenta con más frecuencia. No hay formula, se observa en los datos. En un diagrama de barras se correspondería con el rectángulo más alto. Puede que no haya moda, puede que haya una o puede que haya más de una moda. No hay que confundir la moda con la frecuencia absoluta, hay que leer bien la pregunta para no confundirse.
-De posición: Aportan información sobre la variabilidad de los datos, indican como están distribuidos los datos. Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.
Percentiles: La mediana se corresponde con el percentil 50. Ordenados los datos de menor a mayor, son los valores que dejan por debajo el porcentaje indicado i. La fórmula general es: Hay 3 percentiles principales, y los más utilizados: 1. Percentil 25/cuartil inferior/LQ 2. Mediana/percentil 50/Me 3. Percentil75/Cuartil superior/UQ.
Entre el cuartil inferior i el superior siempre hay el 50% de los datos. El rango intercuartílico es la diferencia que hay entre el cuartil inferior y el superior (UQ-LQ). Si la posición de los cuartiles no es entera se calcula la media entre los valores adyacentes.
-De dispersión: Indican el grado de concentración (variabilidad) de los datos respecto de un valor central.
Rango: Diferencia entre los valores máximo y mínimo observados.
Desviación media (DM): Hay fórmula para los datos agrupados y para los no agrupados. Es la distancia entre cada uno de los valores de su media aritmética. Cuanto mayor sea el valor quiere decir que están más dispersos.
Varianza: En el examen sale la desviación típica, pero para calcular la desviación típica hay que calcular la varianza.
Desviación típica: La ventaja de la desviación típica con respecto a la varianza, como descriptor de dispersión, es que se expresa en las mismas unidades de físicas que las observaciones.
5 Paula Espinàs Gómez ESTADÍSTICA Francesc Boixader Coeficiente de Pearson: Razón en valor absoluto entre la desviación típica y la mediana.
Siempre estará entre el 0 y el 1. Es adimensional (no tiene dimensiones). Al ser adimensional va bien para comparar datos que no son de la misma unidad física (Ej. Kg, m, Km). Si los datos están muy cerca del 0 no podríamos utilizar esta fórmula porque darían valores muy grandes que no necesariamente significa que los datos estén muy dispersos.
-De forma (nos indican como es la forma de la gráfica): Asimetría: Una distribución es simétrica si presenta simetría con respecto al valor central. La asimetría se mide con el coeficiente de Fisher.
Apuntamiento/curtosis: Es la manera de medir el grado de “achatamiento” o cuan “puntiaguda” es una gráfica en la que se ven representados unos datos. Se mide a través del coeficiente de curtosis. A diferencia del coeficiente de Fisher, el valor que marca si una curva es más plana o menos es 3. Si el valor es 3 es normal, si el valor es más pequeño a 3 es plana y si es mayor es más alta.
6 ...

Comprar Previsualizar