Resum de la teoria de bioestadísitica (2014)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Fisioterapia - 1º curso
Asignatura Metodologia científica i bioestadística
Año del apunte 2014
Páginas 10
Fecha de subida 19/09/2014
Descargas 35

Vista previa del texto

Utilitats:   Recopilar, organitzar i resumir dades.
Fer interferències (extraure conclusions i prendre decisions ) Tipus d’estadística: 1. DESCRIPTIVA: Descripció de la mostra mitjançant uns valors descriptius característics anomenats estadístics.
Segons les variables estudiades:  Qualitatives: No són mesurables, tot i que es poden registrar mitjançant valors (aquests valors seran discrets) : o Nominals: La variable té un nombre limitat de opcions. Per poder treballar amb aquestes molts cop s’assigna un número a cada una. Ex.
Sexe (Home o dona/1 y 2), Grup sanguini (0,A,B, AB/1 a 4), Estat Civil...
o Ordinals: Es poden ordenar perquè tenen una progressió. Per poder treballar amb aquestes molts cops s’assigna una escala graduada. Ex.
Grau de dolor (res, poc, moderat, molt/ 1 a 4), nivell de preocupació...
- S’estudien mitjançant:  Quantitatives: Són mesurables. Segons el tipus de mesura, seran: o Discretes: Valors aïllats. Ex. Número de fills, de pacients...
- S’estudien mitjançant: Freqüència absoluta, freqüència relativa i percentatge.
o Contínues: Existeixen valors infinits entre dues dades diferents S’estudien de forma individual mitjançant:  Qualitatives nominals, qualitatives ordinals i quantitatives discretes: o Freqüència absoluta: Nombre de vegades que es repeteix l’opció dins de la mostra recollida.
o Freqüència relativa: Freqüència absoluta entre el nombre de mostres recollides.
o Percentatge: Percentatge amb el qual apareix aquella opció de la variable. És a dir, la freqüència relativa multiplicat per 100.
- Aquests valors es poden unificar en TAULES DE FREQÜÈNCIES.
- La mitjana, la mediana, els percentils y la moda: També es podrien utilitzar per l’estudi de les variables, però no és tan habitual.
 Quantitatives contínues: o Estadístics de tendència central: Ens donen una idea de cap a on tendeix la nostra mostra.
-  Mitjana:  Valor mig de la variable en la mostra.
 Es troba entre la moda i la mediana ( Quan la campana és simètrica es troben els tres valors en el mateix punt de les x )  Mediana:  El valor que deixa el 50% de les observacions a dalt i l’altre 50% a baix.
 Coincideix amb el valor central una vegada ordenats en ordre creixent totes les dades. ( En cas de ser parells i no existir un valor central, la mediana és la mitjana dels dos valors centrals).
 Valor central de la gràfica en l’eix de les X.
 És més resistent que la mitjana als valors extrems.
 Percentils:  Valors que deixen a la seva esquerra el X% de la mostra col·locada de forma ordenada.
 Percentil 25 = 1er quartil // Percentil 50 = 2n quartil = mediana // Percentil 75 = 3r quartil.
 Moda:  Valor observat un major nombre de vegades.
 Coincideix amb el punt més alt de la campana.
Mitjana, mediana, percentils i moda tenen les unitats de la variable.
o Estadístics de dispersió: Donen una idea del grau de dispersió de les dades recollides.
 Rang:  Diferència entre el valor més alt i el més baix de les dades.
 Rang interquartílic:  Diferència entre el tercer i el primer quartil.
 Té major resistència que el rang als valors extrems.
 Variància:  Sx2  Serveix per calcular la desviació típica.
 Desviació estàndard o desviació típica S :  A major desviació típica major dispersió de les dades.
 Es poden comparar mostres amb una mateixa mitjana.
 Té les unitats de la variable.
 Coeficient de variació: o  Útil per comparar la dispersió de dues variables diferents (moltes vegades amb unitats de mesures diferents )  És igual a la desviació típica entre la mitjana (x 100) Estadístics morfològics: Ofereixen informació sobre la forma de distribució.
 Biaix (sesgo):  Detecta un nombre major de dades a un dels dos costats de la moda  Grau de simetria.
 g1 > 0  Asimetria positiva, sesgada a la dreta.
 g2 = 0  Simètrica.
 g3 < 0  Asimetria negativa, sesgada a l’esquerra.
 Coeficient de Pearson:  Dona una idea del punt més alt de la corba.
 -   Curtosi:  Detecta si la forma de l a distribució és més o menys aplanada  Grau de apuntament.
També es poden utilitzar taules de freqüència si es divideixen en classes.
Ex. Grups d’edat...
S’estudien les seves relacions mitjançant:  Descriptiva bivariant: o Analitzar la relació entre dues variables.
o Segons el tipus de variables:  Independents:  Qualitativa – qualitativa  Taula de contingència.
o Mostra el nombre de casos i els percentatges respecte el nombre de dades total.
o En canviar a files o a columnes els percentatges passaran a ser sobre el nombre de casos de la variant situada en files o en columnes.
 Qualitativa – quantitativa: o S’expressa la variable quantitativa en funció de cada variable qualitativa.
 Major dispersió  Les corbes es solapen  Són independents.
 Menor dispersió  Les corbes no es solapen  Són dependents  Quantitativa – quantitativa: o Continues:  Correlació lineal mitjançant el coeficient de Pearson.
o Discretes:  Diferència entre variables: tindre en compte el significat dels signes segons l’ordre amb el qual es faci la resta.
 Aparellades ( situació inicial vs. situació final )  Qualitativa: o Mostra el nombre de casos i els percentatges respecte el nombre de dades total.
o En canviar a files o a columnes els percentatges passaran a ser sobre el nombre de casos de la variant situada en files o en columnes.
o Generalment es contrasten els resultats situats en diagonal en la taula  Quantitativa: o Es fa la diferència de la situació inicial respecte a la final. I a partir d’aquesta es tracta la nova variable com a variable quantitativa contínua.
2. INTERFERENCIAL: Obtenir indirectament informació sobre la població mitjançant uns valors descriptius característics anomenats paràmetres, calculats a partir de la informació directa de la mostra.
*Població: Conjunt d’individus que es vol estudiar.
*Mostra: Subconjunt representatiu de la població.
*Variable aleatòria: Variable el valor numèric de la qual es determina a l’atzar. Per poder estudiar-la hem de poder predir el seu comportament amb un cert grau d’incertesa. Per tant seran tractades mitjançant conceptes de probabilitat.
*Espai mostral Ω : Valors que pot tenir la variable estudiada. Ex: nombre de fills de cada sexe en famílies de 3 fills: Ω {MMM,MMF,MFF,FFF} a) PROBABILITAT D’UN SUCCÉS: Mesura de la seva expectació. Fins a quin punt esperem que es produeixi el succés.
Teoria de probabilitat - Si P = 1  És probable que el succés es produeixi.
- Si P = ½  Tan probable és que el succés es produeixi com que no.
- Si P = 0  Possiblement el procés no es produirà.
0<P<1 Segons el tipus de variable s’estudiarà mitjançant:  Variables aleatòries discretes : L’altura de la gràfica és igual a la probabilitat de que el valor x de l’eix X succeeixi.
o Funció de densitat f(x)=P[X=x] : Assigna a cada valor de la variable aleatòria discreta la seva probabilitat d’aparèixer en la població.
 Es mou entre 0 i 1. Sent f(x)=0 la impossibilitat de que es produeixi la variable x.
 El sumatori de totes les funcions de densitat dels diferents valors possibles d’una variable és igual a 0.
 Es calcula mitjançant l’espai mostral.
o Funció de distribució acumulada F(x)=P(X<x) : Assigna a cada valor real la seva probabilitat acumulada.
 Sumatori de las funcions de densitat de x més petites o iguals a l’estudiada.
 Es caracteritza mitjançant els ESTADÍSITCS DE LA MOSTRA:  Esperança matemàtica. E(x)=µ Resultat esperat de mitjana en la població.
 Variància poblacional. Var(x) / σ2  Desviació típica poblacional. σ o DISTRIBUCIÓ BINOMINAL: B(x:n,p) :  En cada proba del experiment només són possibles dos resultats. Ex. Que succeeixi allò que ens interessa o que no succeeixi.
 El resultat obtingut en cada prova és independent dels resultats obtingut en les altres.
 La probabilitat d’èxit del succés d’interès p és una constant. La probabilitat de fracàs seria la seva contrària q  q=1-p .
 El experiment consta de un nombre n de probes.
 Calcularem la funció densitat a partir de la taula de la binomial i els valors de x, n i p. I calcularem la funció de distribució acumulada a partir del sumatori de les funcions densitat.
 Amb un % major de 50, no es pot observar directament la taula. S’haurà de mirar a partir de les probabilitats de fracàs: B(n-x:n,1-p).
 Calcularem els estadístics de la mostra de forma manual:  Esperança matemàtica. ( ) ( )  Variància poblacional.
 Desviació típica poblacional.
√  Variables aleatòries contínues: Entre un valor de la variable i un altre, hi ha infinits.
 El àrea de la gràfica serà igual a la probabilitat de que el valor x de l’eix X succeeixi.
 L’àrea total serà igual a 1.
 L’àrea de un punt o de una línia és igual a 0 per definició. Per tant, la probabilitat de que x sigui igual a un número és 0 per definició.
o DISTRIBUACIÓ NORMAL O DE GAUSS:  Coneixem la variància poblacional  Corba simètrica respecte µ  Punts de inflexió  Nivell de significació α  àrea fora del interval de probabilitat. ( generalment serà de 0.05 i en alguns casos es dividirà en dos per tal de deixar el 0.95 restant de forma centrada )  Nivell de confiança 1-α  àrea que forma el interval de probabilitat ( generalment serà de 0.95 )  A partir de tipificar trobem un valor z en la distribució de Gauss N(0,1), que delimita l’àrea de forma equivalent a la nostra corba inicial. De manera que a partir de la taula de Gauss ( valors ja calculats amb anterioritat ), podem trobar la àrea inicial i per tant, la probabilitat d’aquell valor.
 Segons l’àrea desitjada:  agafar columna A,B,C o D..
 Agafar Zα o Zα/2.
 Com és simètrica i està centrada en el 0 : Si z és negatiu podrem agafar les àrees de z positiu tenint en conte que seran contràries les unes amb les altres.
*Interval de probabilitat de X X=N(µ,σ) : valors que delimiten la regió més probable on trobar el valor de la variable de un individu concret de la població. ( normalment amb una certesa del 95% ). –Precisió* P=[x>X>x’]=[ >Z> ]=1-α *Interval de probabilitat de ̅ ̅ = N( µ, √ ) / Teorema del límit central: valors que delimiten la regió més probable on trobar el valor mitjà de la variable en la mostra. ( normalment amb una certesa del 95% ) .
- √ Error estàndard Precisió* *Interval de confiança de µ / Estimació per intervals: valors que delimiten la regió més probable on trobar el valor mitjà de la variable en la població.
 Precisió* - o DISTRIBUCIÓ T DE STUDENT:  No coneixem la variància poblacional.
 S’utilitza en l’estudi de variables:  De domini de més a menys infinit.
 Simètriques i centrades en cero  I la seva forma dependrà del coeficient de Pearson, que ha de ser major de 25.
 Aquest valor equivaldrà a la z en Gauss  A partir de la seva taula (que depèn del coeficient de Pearson i de )n podrem trobar directament la probabilitat, però questa deixarà sempre α a la seva dreta.
- Precisió* o CHI-CUADRAT:  Interval de confiança per a la variància poblacional.
 Interval de probabilitat de la variància mostral.
 Característiques:  El coeficient de Pearson són els graus de llibertat.
 La seva forma depèn del coeficient de Pearson.
  - No és una funció simètrica Té el seu domini de 0 a infinit.
Precisió* o T.MORIVE:  Pas de binomial a normal.
  Sent p el percentatge de cops que succeeix A en un nombre total de n.
 Sent π l’equivalència de p, extrapolada a la població.
 - Precisió* b) VERIFICACIÓ DE HIPÓTESIS:  Ens permet prendre decisions.
 Ho serà la hipòtesis nul·la i H1 la hipòtesis alternativa.
 Entre les dues hipòtesis s’ha de cobrir tot l’espai mostral.
 El igual sempre està posat en H0  Les hipòtesis s’escriuran amb els paràmetres poblacionals.
 Estadígraf teòric  Valor equivalent a la z que delimitaria la zona de rebuig o no rebuig de H0. Dependrà del nivell de significació (sol ser de 95%)  Estadígraf experimental Valor de z en la nostra mostra.
 En caure entre els estadístics teòrics no es rebutja H0.
 En caure fora dels estadístics teòrics es rebutja H0.
 Segons el tipus de hipòtesis pot ser que l’estadígraf teòric sigui:  Unilateral  l’àrea de rebuig de H0 α es concentrarà en un dels dos extrems de la gràfica.
 Bilateral  l’àrea de rebuig de H0 quedarà dividida entre els dos extrems de la gràfica α/2.
 Cada estadígraf correspondrà a una probabilitat concreta de que es produeixi H0. Sent el estadígraf teòric generalment de P=0,05. Per tant:  Els estadígrafs es trobaran a partir de tipificar segons:  Estadística descriptiva monovariant.
 Qualitativa: percentatges  π - T. Moivre  Quantitativa: Mitjana i mediana  µ, σ - La distribució normal o de Gauss. Es coneix la desviació típica poblacional. Per contrastar la mitjana poblacional.
- La distribució de T-Student. Es coneix la desviació típica mostral. S’ha de tenir en conta que és unilateral. Per contrastar la mitjana poblacional.
- Chi-Quadrat. Per contrastar la desviació típica poblacional.
 Estadística descriptiva multivariant.
 Variables independents: Una és independent de l’altre.
- Variables qualitatives.
- Variable qualitativa amb quantitativa.
- Variables quantitatives.
 Variables aparellades: Una es dependent de l’altre a causa de ser la situació inicial i la situació final respecte a algun tipus de acció.
- Variable quantitativa.
- Variable qualitativa.
 Estadística descriptiva bivariant.
 Variables independents: Una és independent de l’altre.
 Si es compleixen les condicions s’utilitzarà Chi-Quadrat. Análisis Tablas(a/b)Chi Cuadrado  Estadístic de contrast major a 5’991 per rebutjar H0 // P<0,05  Si no es compleixen s’utilitzarà el Test Exacte de Fisher. Análisis Tablas(a/b)Fisher (2x2) // Fisher.
Pareados  p<0,05 per rebutjar H0  Variables aparellades:  McNemar. Análisis  P<0,05 per rebutjar H0 ...