UD1; UD2; UD3 (2017)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Psicología - 1º curso
Asignatura Mètodes, Dissenys i Tècniques d'Investigació (MeDiTI)
Año del apunte 2017
Páginas 14
Fecha de subida 09/06/2017
Descargas 1
Subido por

Vista previa del texto

1. POBLACIÓ I MOSTRA.
- Població: conjunt complert d’individus als que es referiran les conclusions del estudi. La població que interessa a l’investigador son molt extenses y per tant es casi impossible estudiar-les.
- Mostra representativa: formada per un grup reduït d’individus de la població. Al treballar amb una mostra; disminueix el cost de l’estudi i millora la qualitat de la captura de dades.
- Individus o subjectes: elements que integren la població / mostra. Ex: persones, animals, objectes,...
1.1. Matriu de dades: tipus de variables: - Matriu de dades es una estructura en forma de taula que conte els valors de cada subjecte en les diferents variables.
o Files: representen cada individu.
o Columnes: representen les diferents variables.
 Variable  caràcters o aspectes que es registren en els subjectes de l’estudi i que poden prendre diferents valors. Característica compartida per a un determinat grup d’individus.
Dades no mètriques (categòriques) Dades mètriques (quantitatives) - Tipus de variable Categòrica Binaria Amb mes de dos categories.
Categories ordenades Discreta (recompte) Continua (mesura) Exemples Sexe: masculí – femení.
Tipus de tractament: A, B, C Nivell socioeconòmic: alt – mitja – baix.
Nombre de símptomes, 1, 2, 3...
Edat, pes, talla. Ex: 1,4...
Les variables quantitatives procedeixen d’una escala mètrica que pot ser: o Escala d’interval: ja que l’origen de l’escala no indica absència. Ex: temperatura  -3ºC o Escala de raó: ja que l’origen de l’escala indica absència. Ex: consum de tabac  0 c/d.
2. TABULACIÓ I REPRESENTACIÓ GRÀFICA.
Després de recollir en la matriu de dades, els valors s’han d’organitzar. L’ordenació es el primer pas per obtenir la distribució de freqüències i representar-la gràficament.
La distribució de freqüències es una sèrie de classes predeterminades amb el nombre total de subjectes que s’inclouen en les classes, es a dir, s’intenta classificar als subjectes en categories o en números o intervals de valors.
2.1.1.Histograma.
És una representació clàssica de la distribució d’una variable contínua. Per dibuixar-lo es parteix d’una distribució de freqüències amb les dades agrupades en intervals de classe d’igual o diferent amplitud (els intervals han de ser mútuament excloents). Sobre cada interval es dibuixa un rectangle amb àrea igual a la freqüència (absoluta) corresponent. Això equival a dibuixar un rectangle amb alçada igual al quocient entre la freqüència i l’amplitud de l’interval, de manera que l’eix d’ordenades representa el nombre de casos per unitat de la variable mesurada.
L’amplitud d’un interval de classe es defineix com la diferència entre els seus llindars verdaders. Per exemple l’amplitud de l’interval (10-19) és igual a 10 anys ( 10 - 20 = 10).
Per dibuixar l’histograma es col·loquen els llindars verdaders de cada classe sobre l’eix de les abscisses, i en l’eix de les ordenades el quocient entre la freqüència i l’amplitud del corresponent interval. Com en aquest cas els intervals tenen una amplitud de 10 anys l’alçada de cada rectangle és igual a la seva freqüència dividida per 10. D’aquesta manera, els rectangles que formen l’histograma presenten la seva sobre els llindars verdaders de cada interval i tenen per superfície el nombre de casos de l’interval: la superfície total de l’histograma representa el 100% dels subjectes.
MIRAR DOSIER P. 20 Y P.62.
2.1.2.Diagrama de tija i fulla. (stem & leaf) Es un diagrama proposat per Tukey. Consisteix en ordenar les dades quantitatives en intervals sense perdre els valors originals que ofereix una representació visual de la forma de la distribució similar a la de l’histograma.
Mirar ejemplo p. 23.
Cada valor se separa en 2 parts: - Els primers dígits (tija – stem)  son les desenes, situats a l’esquerra.
- Últims dígits (fulla – leaf)  son les unitats, situats a la dreta.
Les xifres de les unitats dels subjectes (fulles) formen les barres de l’histograma i la seva longitud es proporcional al nombre de subjectes perquè les xifres es descriuran en espaiat fixe per a qualsevol font de caràcters emprada.
Es com un histograma en el que les barres es dibuixen amb pròpies xifres, de manera que no es perden els valors de les dades.
2.1.3.Altres representacions gràfiques: Les distribucions de freqüències que s’obtenen amb els diferents tipus de variables es poden visualitzar mitjançant representacions gràfiques.
Les representacions gràfiques de les distribucions de dades es poden realitzar de formes molt diverses, però acostumen a seguir unes convencions amb la finalitat d’unificar criteris.
En l’eix de les abscisses (X , horitzontal) es col·loquen els valors de la variable. En l’eix d’ordenades (Y , vertical) les freqüències absolutes o relatives corresponents.
La intersecció dels dos eixos es l’origen, de manera que en l’eix de les abisses les puntuacions mes baixes a l’esquerra, i en l’eix de coordenades els valors petits estan a baix.
Tipus de variable Categòrica (nominal) Categories ordenades Quantitativa discreta.
Quantitativa continua.
Representacions gràfiques.
Diagrama de barres i de sectors.
Diagrama de barres i de lines.
Diagrama de lines i de barres.
Diagrama de caixa.
Diagrama de caixa i histograma.
2.1.4.Representació gràfica de dades quantitatives discretes.
Les dades quantitatives discretes es poden representar amb diagrames de tija i fulla i diagrama de barres i de línies.
Al dibuixar el diagrama de barres en l’eix d’abscisses es col·loquen els diferents valors de la variable, i en l’eix d’ordenades les freqüències. Sobre cada valor de la variable es dibuixa una barra perpendicular amb una alçada igual a la freqüència que li correspon. Es preferible representar freqüències relatives en forma de %, ja que les absolutes fan mes difícil la comparació de gràfiques.
El diagrama de línies es la representació que resulta d’unir línies rectes els extrems superiors de les barres.
Ver p. 26.
3. DESCRIPCIO BASADA EN MOMENTS.
Els índex per descriure distribucions de dades quantitatives es poden construir seguint dues estratègies: a partir dels moments de la distribució o a partir de la ordenació de les dades. Els que explicarem estan basats en moments.
- Mesures de tendència central (mitjana): Les distribucions A i B tenen la mateixa forma però es diferencien per la seva tendència central (posició) representada per les mitjanes µ.
- Mesures de dispersió (variància i desviació estàndard): Les distribucions A i B tenen igual mitjana µ però es diferencien per la seva dispersió (variabilitat) representada per les desviacions estàndard σ.
- Mesures de forma (coeficient de asimetria): Les mesures de posició i dispersió tampoc són suficients per caracteritzar una distribució ja que A i B tenen la mateixa mitjana i la mateixa desviació estàndard. A diferència de les distribucions anteriors que eren simètriques a l’entorn de la mitjana (Г1=0), les distribucions A i B tenen una de les cues més extensa que l’altra. En aquests casos s’observa que els valors es concentren en posicions inferiors o superiors a la mitjana de la distribució. Els valors positius (Г1A>0) s’obtenen quan una cua de la distribució s’allunya per la dreta, de manera que existeixen valors anormalment alts respecte a la mitjana. Els valors negatius (Г1C<0) s’obtenen quan una cua de la distribució s’allunya per l’esquerra, de manera que existeixen valors anormalment baixos respecte a la mitjana.
- Mesures de forma (coeficient d’apuntament): Les distribucions A i B són simètriques i tenen igual mitjana i desviació estàndards però es diferencia pel seu apuntament representat pels coeficients d’apuntament. La forma normal és la mesocúrtica i és igual a 0. La leptocúrtica és i positiva i la platicúrtica negativa.
- - - 3.1. Càlcul de la mitjana, variància, desviació estàndard i l’assimetria en una mostra.
Mitjana: suma de cada valor (xi) dividida pel nombre d’observacions (n).
∑ 𝑋𝑖 13 + 5 + 16 𝑀𝑖𝑡𝑗𝑎𝑛𝑎 → 𝑥 = → = 14,6 𝑁 3 Variància: es defineix com la mitjana de la suma de quadrats de les diferencies entre cada valor de la variable Xi i la mitjana aritmètica x de la distribució.
∑(𝑥𝑖 − 𝑥)2 + (𝑥𝑖 − 𝑥)2 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑞𝑢𝑎𝑑𝑟𝑎𝑡𝑠 𝑆2 = → 𝑛−1 𝑔𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑡 2 2 2 2 2 (8) + (−2) + 2 + 4 +4 104 𝑆2 = = 26 𝑘𝑔2 5−1 4 La desviació estàndard es l’arrel quadrada positiva del resultat de la variància.
∑(𝑥𝑖−𝑥)2 𝑛−1 = ∗∗∗∗ → √∗∗∗∗ 𝑆 = +√26 = 5.1 𝑘𝑔.
La desviació estàndard no té una interpretació física fàcil com la mitjana, i en general tampoc té cap interpretació estadística, únicament la que es dedueix de la seva fórmula: quan les dades estan molt disperses a l’entorn de la mitjana el numerador de la fórmula és gran, s’obté una desviació estàndard gran; però si les dades estan molt agrupades, el numerador de la fórmula serà petit i la desviació estàndard també serà petita. Per tant la desviació estàndard és un índex matemàtic que caracteritza la dispersió (o el grau d’homogeneïtat) d’una distribució.
Diríem que la mitjana de pes és de 56 kg (SD = 5.1 kg). Convé advertir que moltes de les normes de publicació prohibeixen expressament indicar la mitjana i la desviació estàndard de la següent forma: 56  5.1 kg (expressió incorrecta) - Índex d’asimetria: És la suma dels valors de la variable centrada elevats a la tercera potencia, base del moment de tercer ordre. Es calcula igual que la variància per elevat a la tercera potència. el valor negatiu indica que aquesta distribució presenta una asimetria negativa, tal com s’aprecia visualment ja que la cua de l’esquerra és més allargada. L’índex que mesura el grau d’asimetria, calculat en una mostra, és el moment de tercer ordre estandarditzat (Sk) que no té unitats de mesura: Mirar p. 34 Exercici.
3.2. Mesura de dispersió relativa: el coeficient de variació.
Els valors de variància i de desviació estàndard depèn de les unitats de mesura de la variable, la qual cosa impossibilita la comparació entre si d’índex de dispersió que tinguin diferents unitats.
Es pot definir un indexà de dispersió relativa que no depengui de les unitats de mesura, dividint el valor de l’índex de dispersió pel seu corresponent indexà de posició. De tots els possibles índexs, el mes emprats el coeficient de variació, que es el quocient entre la desviació estàndard i la mitjana, expressant en %.
𝑠 𝐶𝑉 = 100 × % 𝑥 No te dimensions, sinó que es el valor de la desviació estàndard mesurada en unitats de magnitud igual a la mitjana.
Ex: La Taula 1-4 presenta les característiques estadístiques del pes i la talla de nens en dos períodes del creixement. Què és més variable, el pes o la talla? Aquests paràmetres són més variables als 2 anys o als 17 anys? La resposta a aquestes preguntes, partint de la desviació estàndard, és que als 2 anys la talla és més variable que el pes (4.1 > 2.05) i als 17 anys passa el contrari; però aquestes conclusions no tenen sentit perquè les desviacions estàndard tenen diferents unitats de mesura i no són comparables (si s’hagués expressat la talla en metres s’haurien canviat les conclusions). Per això hem de fer servir els coeficients de variació calculats en la Taula que indican que el pes és més variable que la talla, tant als 2 anys com als 17 anys.
Mirar p. 37.
3.2.1.La mitjana ponderada.
És una definició més general que la mitjana aritmètica ja que permet assignar diferents pesos a cada observació, de manera que una dada contribuirà en major o menor valor de la mitjana en funció del seu pes assignat.
∑(𝑤𝑖 × 𝑥𝑖) + (𝑤𝑖 × 𝑥𝑖) + (… ) 𝑥= ∑ 𝑤𝑖 Ex: Mirar hoja 38 copiar formules i exercici.
4. DESCRIPCIÓ BASADA EN ORDENACIONS.
Tukey 1977, va proposar que una estadística fonamentada en mesures d’ordre i es destaquen els seus avantatges.
- Quantils: mesures de posició que s’obtenen dividint el conjunt ordenat de les dades en que Q parts iguals.
- Mediana: valor de la variable que divideix la mostra ordenada en 2 grups de la mateixa mida. Indica la tendència central i es alternativa a la mitjana.
- Quartils (Q1, Q2, Q3) son cadascun dels 3 valors de la variable que divideixen la mostra ordenada en 4 grups d’igual grandària.
Ex: si en la distribució de consum de tabac els fumadors el 25% fuma menys de 10c/d, el 50% fuma menys de 16 c/d i el 75% menys de 30 c/d.
𝑐 𝑄1 = 10 ; 𝑑 𝑐 2 𝑀𝑑 = 𝑄 = 16 𝑑 𝑐 𝑄 3 = 30 𝑑 - Percentils (P1) son cadascun dels 99 valors de la variable que divideixen les dades ordenades en 100 grups d’igual grandària. El percentil que ocupa un determinat subjecte l’avalua ja que indica la seva posició respecte a la resta dels individus del seu grup. Quan els percentils es calculen en un grup normatiu o de referència, permeten avaluar qualsevol subjecte ja que a partir de la seva mesura donen la posició que ocuparia en el grup de referència.
Mirar pag. 40.
4.1. Càlcul de quantils.
4.1.1.Càlcul de la mediana i dels quarts amb el mètode de Tukey.
- Càlcul de la mediana: La mediana coincideix amb el percentil 50. El valor de la mediana es el valor de la variable que divideix la distribució en 2 parts iguals. Si tenim els “n” valors ordenats, es fàcil comprovar que la mediana estarà en la posició.
1+𝑛 𝑝𝑜𝑠𝑖𝑐𝑖𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎.
2 Quan el nombre de subjectes es imparell (11) el valor de la mediana esta situat en el 6ª posició, se li assigna el sisè valor.
Quan el nombre de subjectes es parell (10) el valor de la mediana esta situat entre la posició 5º i 6ª i se li assigna la mitjana dels valors de la 5ª i 6ª.
- Càlcul dels quarts. Valors que divideixen cadascuna de les meitats definides per la mediana en 2 parts iguals. El seu càlcul es redueix a trobar la mediana de cada meitat de la distribució.
Per obtenir els quarts, hem de situar la mediana, el primer quart serà la mitat de la primera mediana, el segon quart serà la mediana, i el tercer quart serà la mitat de la segona mediana.
Ex: : Per obtenir els quarts de la distribució de les puntuacions de depressió, primer s’ha de situar la mediana de la distribució (Md=23) en el Quadre 1-11. Donat que el nombre de subjectes és senar, el primer quart H1 és la mediana dels 6 valors (incloent-hi el valor de la mediana) de la meitat esquerra (7, 17; 19; 20; 21 i 23) situats entre les posicions 1ª a 6ª: - Per obtenir els quarts quan el nombre de subjectes es parell, primer se situa la mediana. El primer quart es la mediana dels valors de la meitat esquerra situats entre aquestes posicions.
Mirar p. 42, 43, 44.
4.2. Mediana, desviació quartil i coeficient de variació quartil.
- Mediana (Md): es la mesura de tendència central que indica el valor central del conjunt ordenat de dades.
Correspon amb el percentil 50 y al quartil 2. Si la distribució es simètrica la mediana coincideix amb la mitjana.
𝑀𝑑 = 𝐻2 = 𝑄2 = 𝑃50 - Interval Inter quartil es l’interval [Q1; Q3] o [H1; H3] - Amplitud Inter quartil es una mesura de dispersió de valor igual a la longitud de l’interval que conte el 50% central dels individus de la distribució. Es pot calcular a partir dels quartils o dels quarts.
o Promig ponderat: IQR = Q3 – Q1 = P75 – P25 - Desviació quartil: mesura de dispersió que es defineix com la meitat de l’amplitud Inter quartil: o Promig ponderat: 𝑄3 − 𝑄1 𝑃75 − 𝑃25 𝑄𝐷 = = 2 2 - Coeficient de desviació quartil: es un indexà de dispersió relativa que no depèn de les unitats de mesura de la variable (𝑄 3 − 𝑄1 )/2 (𝑄 3 − 𝑄1 ) 𝐶𝑉 3 = 𝑄 + 𝑄1 )/2 𝑄 3 + 𝑄1 ) PAG. 47.
4.3. Mesures de asimetria basades en ordenacions.
Els índexs de asimetria es basen en comparar la mediana amb el valor mitja (mid) de 2 mesures de posició simètrica a la mediana. Si fem servir com mesures de posició simètriques els percentils P25 i P75, quan estan a la mateixa distancia de la mediana el seu valor intermedi ha de ser similar al valor de la mediana, i en aquest cas, la distribució es simètrica en la zona del 50% central.
𝑆= 𝑃75 + 𝑃25 − 2 × 𝑀𝑑 𝑃75 − 𝑃25 4.3.1.Moda i amplitud.
- Moda (Mo) es la mesura de tendència central que correspon al valor de la variable mes freqüent a la distribució.
- Amplitud: recorregut o rang (Ra) es la mesura de dispersió que correspon a la diferencia entre l valor màxim i el mínim de la distribució.
𝑅𝑎 = 𝑋 𝑚𝑎𝑥 − 𝑋 𝑚𝑖𝑛 Son mesures poc fiables perquè en el seu càlcul únicament intervenen uns quants valors de la distribució. Però poden ser adequades per descriure distribucions de valors poc dispersos.
Mirar p. 49.
4.3.2.Diagrama de caixa (Box plot).
El diagrama de caixa es una representació sintètica de la distribució que permet visualitzar les seves principals característiques: tendència central, dispersió, asimetria i valors allunyats.
La part central està formada per un rectangle d’amplada arbitrària i altura limitada pels quarts tercer i primer (H3 i H1). Un traç horitzontal gruixut a l’interior del rectangle marca la posició de la mediana. Dues potetes (whiskers), que s’ajunten a cada base del rectangle amb una línia perpendicular, marquen els valors adjacents (adjacent) que corresponen al màxim i mínim valor de la distribució que no es consideren diferents de la majoria de valors. Finalment es representen amb punts (●) cadascun dels valors allunyats que corresponen als subjectes amb temps de remissió de 30 i 53 mesos.
Tukey proposa que en una mostra es considerin valors allunyats els valors de les cues que, dels quarts primer (H1) i tercer (H3), estan a una distància superior a 1.5 vegades l’amplitud interquartil (IQRt = H3 – H1).
Els valors molt allunyats són aquells que superen el quartil 3 + 3 vegades l’amplitud interquartil.
Ex: Interpretació d’aquest diagrama de caixa: Indica que a l’inici del 5è mes de tractament ha remès la meitat dels pacients i que el 50% central de les remissions es produeixen entre l’1.5 i els 12 mesos de tractament. A més, la distribució presenta una forta asimetria positiva (el traç gruixut de la mediana està per sota del centre de la caixa i la pota superior es molt més alta que la inferior), i hi ha dos subjectes (Id=11 i 12) amb un temps de remissió anormalment alt respecte als de la resta de pacients.
Mirar p. 49.
El diagrama de caixa es un tipus de representació adequada per: - Localitzar la tendència central de la distribució.
- Avaluar la dispersió del 50% central de la distribució (alçada de la caixa).
- Detectar la possible asimetria en el centre de la distribució (posició de la mediana desplaçada del centre de la caixa).
- Detectar la possible asimetria de les cues de la distribució (potes de diferent longitud).
- Detectar els valors allunyats de la distribució.
5. ÍNDEXS BASATS EN MOMENTS O EN ORDENACIONS? Presentar la mitjana i la desviació estàndard per descriure les variables quantitatives d’un estudi es un ritual que casi sempre es fa sense reflexionar si son els índexs mes adients.
Per les distribucions que segueixen la Llei Normal, sense asimetries ni molts casos allunyats → índexs basats en moments (utilitzem la mitjana aritmètica i la desviació estàndard). En canvi les distribucions amb asimetries considerables: en ordenacions.
1. TABULACIO I REPRESENTACIO GRAFICA DE DADES CATEGORIQUES.
1.1. Distribució de freqüències.
Per construir la distribució de freqüències d’una variable categòrica es classifiquen els subjectes per categories i es presenta el recompte expressat en proporcions o %.
Amb variables nominals es facilita la interpretació presentant les categories ordenades, però amb variables ordinals les categories sempre s’han de presentar en el seu ordre natural.
1.2. Representació gràfica.
- un tipus de representació que ens permet descriure variables categòriques nominals, ordinals, i quantitatives discretes es el diagrama de barres. Per dibuixar aquesta gràfica es col·loquen en l’eix de les abscisses (X) les categories de la distribució a representar i sobre cada categoria es construeix un rectangle d’alçada igual a la freqüència relativa de la respectiva categoria. Es convenient representar el diagrama amb freqüències relatives (%) i no amb freqüències absolutes (nombre de casos).
- Un altre forma de representar variables categòriques es mitjançant un diagrama de sectors. En aquest diagrama a cada classe se li assigna un sector de la superfície proporcional a la seva freqüència relativa. Per dibuixar-lo es suficient repartir els 360º del cercle de forma proporcional a la mida de cada categoria.
𝐴𝑛𝑔𝑙𝑒 = 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 × 100 MIRAR P. 65.
1.2.1.Descripció de variables per subcategories.
En ocasions interessa representar la distribució de diferents atributs de forma conjunta. Ex: segons el sexe. A l’hora de representar el gràfic no hauríem de construir-lo amb les freqüències absolutes (nombre de casos), sinó que haurem de construir-la amb les freqüències relatives (comparar la població de nenes amb el total de nenes i la població de nens amb el total de nens).
En ocasions interessa representar l’evolució d’una variable binaria segons els valors d’una variable ordinal o quantitativa.
1.2.2.Com ens poden enganyar amb un gràfic? Els gràfics han de donar un resum visual el mes objectiu possible. Però en ocasions utilitzen de manera tendenciosa per produir impressions enganyoses o interessades.
- Quan s’utilitzen figures representatives de les categories, l’àrea de cada figura ha de ser proporcional a la seva freqüència. Si es dibuixen de manera que nomes les alçades siguin proporcionals a les freqüències, s’obtindrà un gràfic tendenciós que accentuarà les categories de major freqüència.
- El segon mètode de distorsió consisteix en retallar l’eix d’abscisses de les ordenades de manera que la seva graduació no comença en 0. Aquesta estratègia magnifica es diferencies entre les categories.
- El tercer procediment consisteix en utilitzar diferents pendents en un polígon de freqüències segons interessi accentuar o atenuar les diferencies.
Mirar p. 68 2. MESURES DE FREQÜÈNCIA D’UN ESDEVENIMENT.
- Sota l’òtica transversal es registren dades en un moment temporal, obtenint la mostra de subjectes i recomptant els casos d’interès present. Aquesta informació condueix al càlcul d’índexs estadístics referits a aquest moment temporal. En l’ambit de l’epidemiologia les mesures obtingudes amb aquests índexs s’anomenen prevalences.
- Sota l’òptica de seguiment, les dades es registren en un període de temps determinat que pot incorporar el moment temporal en el qual es produeix l’esdeveniment. En disposar d’informació sobre el ritme en el que es van presentant els esdeveniments es poden calcular índexs que recullen aspectes dinàmics a l’incorporar el temps en el seu càlcul. En l’ambit de l’epidemiologia les mesures obtingudes amb aquests índexs s’anomenen incidències.
Per l’òptica transversal i per la de seguiment, la base dels índexs es el nombre de subjectes que presenten l’esdeveniment estudiat. El nombre de casos presents mai es pot considerar un índex perquè no reflexa la seva importància relativa, donat que li falta un denominador amb la mida de la població en el qual s’ha presentat aquest fet.
Aquests indicadors son el resultat del quocient o raó entre les 2 magnituds.
En psicologia es distingeixen 3 importants tipus de raó: proporcions, odds i taxes.
2.1. Raó.
Una raó (ratio) es l’índex obtingut en dividir 2 quantitats.
𝑛 𝑟= 𝑚 Si aquestes quantitats m i n son números positius, les raons seran números reals entre 0 i infinit.
2.1.1.Proporcions.
Una proporció (proportion) es una raó tal que el valor del numerador esta inclòs en el denominador.
𝑎 𝑝= 𝑎+𝑏 La proporció indica la part que el numerador representa del denominador. Si es multipliquen per 100 s’obtenen els %.
Quan expressen parts molt petites les proporcions s’acostumen a expressar multiplicades per 1000 o 10000,etc.
Quan a i b son números enters positius que representen el recompte o la freqüència de dos esdeveniments mútuament excloents, la proporció p es un numero real entre 0 i 1 que rep el nom de “freqüència relativa”.
Ex: En una mostra a l’atzar de 500 reclusos de les presons catalanes hi ha 400 fumadors i 100 no fumadors. La freqüència de l’hàbit de fumar correspon a la proporció de fumadors i indica que hi ha 80 fumadors per cada 100 reclusos: 400 400 𝑃𝑓 = = = 0.8 (80%) 400 + 100 500 La freqüència relativa es pot considerar com l’estimació d’una probabilitat si es calcula en una mostra representativa d’una població.
2.1.2.Odds.
L’odds es el quocient entre la proporció o probabilitat d’una ocurrència d’un esdeveniment i la proporció o probabilitat (complementaria) de no ocurrència.
𝑎 𝑝 𝑎 𝑂= = 𝑎+𝑏 = 𝑏 1−𝑝 𝑏 𝑎+𝑏 Odds representa la freqüència d’un aspecte relativa als subjectes que no el presenten. Els seus valors poden anar de 0 a infinit.
Mirar p. 69, 70, 71.
2.1.3.Equivalència entre odds i proporció: Una senzilla operació algebraica transforma les proporcions en odds i a la inversa.
𝑝 𝑂 𝑂= ↔𝑝= 1−𝑝 1+𝑂 Propietats de les odds; cas d’esdeveniments poc freqüents: si l’aspecte estudiat te una freqüència molt baixa, a es molt mes petit que b i el denominador (a+b) pràcticament val b, i en aquest cas, el valor de les odds i de proporció pràcticament coincideixen.
𝑎 𝑎 𝑆𝑖 𝐴 < 𝐵 → 𝑝 = ~ =0 𝑎+𝑏 𝑏 3. MESURES DE FREQÜÈNCIA QUE INCORPOREN EL TEMPS: RISC I TAXA.
Els estudis amb seguiment consisteixen en vigilar al llarg d’un període de temps prefixat els subjectes d’una cohort que estan en risc de presentar determinats esdeveniments o respostes d’interès i registrar el moment en que es produeix cada nou esdeveniment. Aquest poden ser: - Malèfics (mort, malaltia...) - Benèfics (curació,...) Seguir una cohort de subjectes en risc comporta excloure a l’inici de tots els subjectes que ja presenten l’esdeveniment d’interès.
Una característica inherent als estudis de seguiment es la presencia de temps censurats, deguts als abandonaments abans de finalitzar l’estudi o a que en acabar el període de seguiment no s’ha presentat en el subjecte l’esdeveniment d’interès.
El registre del moment temporal en el qual es produeix cadascun dels esdeveniments permet obtenir índexs que incorporen el temps en el seu càlcul i que reflecteixen la dinàmica del procés d’aparició dels esdeveniments. Les mesures bàsiques per descriure aquest tipus de dades son les dades de supervivència: risc i taxa.
3.1. Estructura de les dades en un estudi de seguiment.
Els seguiments que acaben amb un cercle representen pacients amb remissió i els temps transcorreguts s’anomenen temps complerts o no censurats (uncensored time). Els que acaben amb una fletxa representen pacients que continuen amb els símptomes al final del tractament o en el moment que han abandonat l’estudi; s’anomenen temps censurats (censored time) perquè no es coneix el temps que tardaran en remetre els símptomes (que serà més enllà dels 14 dies) 3.1.1.Riscos i taxes.
Son dades per descriure les dades de supervivència procedents de registrar l’esdeveniment d’interès en estudis de seguiment.
3.1.2.Càlcul d’un risc.
Un risc indica la probabilitat que un subjecte en risc presenti l’esdeveniment durant el període de seguiment.
𝑁0 − 𝑁1 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑞𝑢𝑒 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑒𝑛 𝑙′𝑒𝑠𝑑𝑒𝑣𝑒𝑛𝑖𝑚𝑒𝑛𝑡 𝑅= = 𝑁0 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑞𝑢𝑒 𝑒𝑠𝑡𝑎𝑟𝑖𝑒𝑛 𝑒𝑛 𝑟𝑖𝑠𝑐 𝑑𝑒 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎𝑟 𝑙′𝑒𝑠𝑑𝑒𝑣𝑒𝑛𝑖𝑚𝑒𝑛𝑡 El risc compleix la definició de proporció, però no es estrictament una proporció perquè per interpretar-lo es necessari donar el període de seguiment.
3.1.3.Càlcul d’una taxa.
La taxa es la mesura de velocitat en que es presenten els esdeveniments en el període de seguiment. Es poden definir taxes absolutes i relatives, però en ciències de la salut nomes es calculen les taxes relatives.
- La taxa mitjana absoluta s’obté dividint el nombre d’esdeveniments per la durada del seguiment.
𝑁0 − 𝑁1 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑′𝑒𝑠𝑑𝑒𝑣𝑒𝑛𝑖𝑚𝑒𝑛𝑡𝑠 𝐼𝑎 = = ∆𝑡 𝑑𝑢𝑟𝑎𝑑𝑎 𝑑𝑒𝑙 𝑠𝑒𝑔𝑢𝑖𝑚𝑒𝑛𝑡 La taxa absoluta no serveix per realitzar comparacions, perquè depèn del nombre de subjectes en risc i es necessari emprar la taxa relativa.
- La taxa central mitjana relativa s’anomena taxa (rate), i es defineix com el quocient entre el nombre de subjectes que han presentat l’esdeveniment durant el període de seguiment i la suma de temps en que els subjectes han estat en risc.
𝑁 0 − 𝑁1 𝐼= ∑ 𝑡𝑖 La taxa central relativa permet realitzar comparacions per que no depèn del nombre de subjectes en risc.
El numerador de la taxa es el nombre dels nous esdeveniments i per tant, no te unitats de mesura. El denominador es la suma d’unitats de temps i te unitats de mesura de temps, si es mesura en dies, la taxa tindrà com unitats el recíproc del temps. Es preferible referir-nos a esdeveniments per subjecte i dia en risc.
Una taxa es una mesura de velocitat. Quan els casos es produeixen molt aviat els subjectes estan poc temps en risc, el denominador disminueix i el valor de la taxa augmenta; si els casos es produeixen lentament els subjectes estaran mes temps en risc, el denominador augmenta i el valor de la taxa disminueix.
El terme taxa es molt confús, perquè te diferents accepcions segons l’ambit en que s’utilitza. En general es refereix a la freqüència en la que es presenta un esdeveniment en un determinat període de temps, es fa servir com a sinònim de proporció de casos ocorreguts en un determinat període i per aquest motiu es part de la de taxa de mortalitat, taxa d’atur...
El risc seria una taxa, però en l’ambit d’epidemiologia es distingeix entre risc i taxa, i es reserva el terme taxa quan els denominadors son temps de subjectes en risc, de manera que, el terme taxa d’atur es substituiria pel de proporció de desocupats.
Mirar p. 76 3.1.4.Càlcul de taxes amb dades agregades.
Quan es tenen dades agregades nomes es coneix el nombre inicial i final de subjectes en risc i el període de seguiment (no se en quin moment s’ha produït els casos). El temps dels subjectes que han estat en risc durant el període no es coneix.
𝑁0 − 𝑁1 𝑁0 − 𝑁1 𝐼= ≅ ∆𝑡 ∑𝑡 (𝑁0 − 𝑁1 ) × + 𝑁1 × ∆𝑡 2 9 𝐼= = 0.086 → 𝑟𝑒𝑚𝑖𝑠𝑖𝑜𝑛𝑠 𝑝𝑒𝑟 𝑝𝑎𝑐𝑖𝑒𝑛𝑡 𝑖 𝑑𝑖𝑎 𝑑𝑒 𝑡𝑟𝑎𝑐𝑡𝑎𝑚𝑒𝑛𝑡.
14 9× + 3 × 14 2 4. PREVALENÇA I INCIDÈNCIA D’UN ESDEVENIMENT.
La prevalença d’una determinada característica es una mesura associada al nombre de subjectes que presenten la característica en un moment donat; aquests subjectes, anomenats casos prevalent, s’identifiquen amb un estudi transversal.
Prevalença durant el temps de vida es la proporció de subjectes de la població que en algun moment de la seva vida han sofert el trastorn.
La incidència d’un determinat esdeveniment es una mesura associada al nombre de nous casos amb l’esdeveniment que es van presentar durant un període de seguiment, anomenats casos incidents, s’identifiquen en un estudi de seguiment.
4.1.1.Càlcul de prevalença i de incidència.
𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑠 𝑒𝑛 𝑢𝑛 𝑖𝑛𝑠𝑡𝑎𝑛𝑡 𝑡 (𝑐𝑎𝑠𝑜𝑠 𝑝𝑟𝑒𝑣𝑎𝑙𝑒𝑛𝑡𝑠) 𝑃𝑡 = 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜 𝑡𝑜𝑡𝑎𝑙 𝑒𝑛 𝑙 ′ 𝑖𝑛𝑠𝑡𝑎𝑛𝑡 𝑡 El risc es una mesura d’incidència que indica la probabilitat de que un subjecte, en risc a l’inici, presenti l’esdeveniment durant el període de l’estudi.
𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑛𝑜𝑢𝑠 𝑐𝑎𝑠𝑜𝑠 𝑑𝑢𝑟𝑎𝑛𝑡 𝑢𝑛 𝑝𝑒𝑟𝑖𝑜𝑑𝑒 (𝑐𝑎𝑠𝑜𝑠 𝑖𝑛𝑐𝑖𝑑𝑒𝑛𝑡𝑠) 𝑅= 𝑝𝑏𝑙𝑎𝑐𝑖𝑜 𝑑𝑒 𝑠𝑢𝑏𝑗𝑒𝑐𝑡𝑒𝑠 𝑞𝑢𝑒 𝑎 𝑙 ′ 𝑖𝑛𝑖𝑐𝑖𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑒 𝑒𝑠𝑡𝑎𝑛 𝑒𝑛 𝑟𝑖𝑠𝑐 𝑑𝑒 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎𝑟 𝑙 ′ 𝑒𝑠𝑑𝑒𝑣𝑒𝑛𝑖𝑚𝑒𝑛𝑡 La taxa mitjana d’incidència es una mesura del ritme d’ocurrència d’un esdeveniment en els subjectes en risc de la població en un determinat període, que es calcula amb la formula de la taxa.
𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑛𝑜𝑢𝑠 𝑐𝑎𝑠𝑜𝑠 𝑒𝑛 𝑢𝑛 𝑝𝑒𝑟𝑖𝑜𝑑𝑒 𝑑𝑜𝑛𝑎𝑡 𝐼= ′ 𝑠𝑢𝑚𝑎 𝑑 𝑢𝑛𝑖𝑡𝑎𝑡𝑠𝑑𝑒 𝑡𝑒𝑚𝑝𝑠 𝑞𝑢𝑒 𝑒𝑙𝑠 𝑠𝑢𝑏𝑗𝑒𝑐𝑡𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜 ℎ𝑎𝑛 𝑒𝑠𝑡𝑎𝑡 𝑒𝑛 𝑟𝑖𝑠𝑐 Mirar p. 79 i 80, 81.
5. DIFERENCIA ENTRE RISC I TAXA D’INCIDÈNCIA.
El risc i la taxa son índexs d’incidència complementaris: - El risc es un índex estadístic i la taxa es dinàmic.
Es molt important conèixer que mesura un risc i que mesura una taxa.
El Quadre 2-5 presenta el resultat d’un experiment en el què s’administren durant 14 dies els neurolèptics A i B a dos grups a l’atzar de 5 pacients esquizofrènics amb símptomes positius; els asteriscs indiquen presència de símptomes i permeten calcular el temps transcorregut des de l’inici del tractament fins a la desaparició dels símptomes de cada pacient.
Aquestes dades indiquen que A i B tenen la mateixa eficàcia al final dels 14 dies (eliminen els símptomes del 80% dels pacients); però l’anàloga eficàcia es desmenteix en examinar el patró de les remissions: amb el neurolèptic A la remissió dels símptomes és molt més ràpida. Aquests dos aspectes queden quantificats calculant els riscos i les taxes de remissions als 14 dies en els dos grups. Si cada asterisc indica un dia de presència de la simptomatologia: El risc de remissió als 14 dies de tractament és el mateix en els dos grups (RA = RB = 0.8), però en el grup A la taxa d’incidència és de 0.17 remissions per subjecte i dia de tractament, quasi el doble que la del grup B que és de 0.09 remissions per subjecte i dia de tractament 6. PRESENTACIÓ I COMUNICACIÓ DELS RESULTATS DESCRIPTIUS.
Els estudis de recerca es poden comunicar mitjançant informes tècnics o a traves d’articles en revistes científiques.
6.1.1.El nombre de decimals.
La majoria d’índexs apareixen a les taules resum o en el text no son valors enters sinó arrodonits. La regla d’arrodoniment es universal. Un factor freqüent es arrodonir a partir d’un valor ja arrodonit.
Una de les preguntes mes habituals en el moment de presentar els resultats descriptius es quants decimals s’han d’utilitzar. Malgrat que no existeix una norma fixa, es important tenir present que fer servir un nombre excessiu de decimals, no aporta informació rellevant i dificulta la lectura de les taules.
En el cas de les dades quantitatives, alguns textos recomanen presentar la mitjana amb un decimal mes en relació a les dades originals, i la desviació estàndard amb dos decimals mes. Tanmateix, la precisió amb la qual es presenten les dades finals depèn de la seva pròpia naturalesa, de tal manera que per l’arrodoniment es tindrà en compte la rellevància practica de la informació que es reté o es rebutja.
6.1.2.La taula resum.
Es una estructura simple on s’inclouen índexs que resumeixen les distribucions de les variables mes rellevants. La seva construcció ha de respondre a 3 requisits: - La simplificació.
- La clarificació.
- Autoexplicacio.
Una taula es poc informativa o difícil de llegir i interpretar, si es construeix amb un format complicat. En moltes ocasions es disposa de dades per a diferents grups, subpoblacions o en diferents moments del temps. En aquests casos els grups se situen en les columnes i els índex estadístics descriptius en les files.
6.1.3.Les representacions gràfiques.
La informació continguda a les taules resum es molt útil però es necessita un cert temps per interpretar-la. Les representacions gràfiques son un extraordinari medi alternatiu i/o complementari per descriure i comunicar la informació.
Els gràfic han de complir el requisits de la simplificació, clarificació i auto explicació. Però a vegades, es dibuixen prioritzant els efectes decoratius i visuals per obtenir imatges suggerents amb el risc de presentar una informació científica insuficient o ambigua.
L’elecció d’un tipus particular de gràfic dependrà de la naturalesa de les dades i de les característiques que es pretenen valorar i comunicar.
El diagrama de caixa es excel·lent representació gràfica de les dades quantitatives, útil per a distribucions amb pocs valors i es una valuosa eina per comparar visualment una distribució en diferents subpoblacions o diferents moments.
Quan la variable es discreta o continua amb un petit rang de variació, Ex: edat, els percentatges de cada valor poden representar amb gràfiques de barres o lines.
Els diagrames de sectors i barres son representacions mes freqüents per a dades categòriques nominals i ordinals. La regla general es representar els % de les diferents categories, excepte en mostres molt petites on s’han de representar el nombre de subjectes.
Per presentar el valor que pren un índex en les subpoblacions definides per les categories d’una altre variable (nominal o ordinal), s’utilitza el diagrama de barres. Ex: associació de la hiperactivitat amb el tabaquisme o consum d’alcohol.
Per representar el valor que pren un índex en les subpoblacions definides per les categories d’una variable quantitativa, s’utilitza el diagrama de línies. Ex: evolució de la prevalença del trastorn de conducta en funció de l’edat.
1. CLASIFICACIO D’ESTUDIS CIENTIFICS EN PSICOLOGIA DE RECERCA.
En Psicologia general i educativa, és habitual referir-se a dissenys experimentals, quasiexperimentals i ex post facto. A continuació es presenta una classificació que agrupa els estudis científics en dues grans categories segons el seu objectiu sigui d'informació o d'investigació i que és habitual dels estudis que es publiquen en revistes científiques d’àmbit internacional.
Escollir-ne un disseny concret comporta una seria reflexió sobre les seves propietats, i la selecció ha de fer-se atenent a diferents criteris: - Quins són els objectius de la recerca: descriptius versus explicatius i predictius.
- Grau de control de la variable independent: experimentals versus no experimentals - Temporalitat (seguiment de les unitats d’informació): transversals versus longitudinals.
- Relació entre l’inici de la recollida de les dades i l’ocurrència real dels esdeveniments: seguiment prospectiu, seguiment retrospectiu o ambispectiu.
1.1. Estudis d’informació.
Tenen com a finalitat descriure com es distribueixen les variables dins d’una determinada població.
També s’empren amb la finalitat d’examinar (explorar) i descriure les relacions que existeixen entre un conjunt de variables en un moment determinat del temps, sense una hipòtesi empírica prèvia objecte de contrastació.
Alguns estudis d’informació: - Estudi de prevalença: Transversal. per definir el patró d’ocurrència d’un esdeveniment en un moment concret del temps.
- Estudi d’incidència: té caràcter longitudinal, i a diferència del transversal comporta el registre de mesures periòdiques i repetides en el temps. És fonamental tenir una bona mostra.
1.2. Estudis d’investigació.
Es dissenyen amb l’objectiu de confirmar hipòtesis i posar de manifestació relacions (a ser possible causals) entre les variables independents (també anomenades exposicions o factors de risc) i la variable dependent (també anomenada resposta, resultat o criteri).
Dins de la investigació amb exposició manipulada es poden diferenciar 2 tipus de dissenys segons la forma en la qual els subjectes s’assignen als diferents nivells de la variable independent: - Si l’assignació es aleatòria el disseny s’anomena experimental.
- Si l’aleatorització no es possible, el disseny el quasi experimental.
En psicologia clínica, els dissenys experimentals amb aleatorització que comporten intervencions en humans son els anomenats assaigs clínics aleatoritzats (o assaigs terapèutics).
Dissenys d’observació: No es pot manipular l’exposició i l’investigador únicament pot actuar “observant” el grau en que la variable independent es presenta en els subjectes (exposició natural). Aquest grup de dissenys també s’anomenen ex post facto.
Estudis de cohorts i de casos i controls: La diferència fonamental entre ambdós és la forma particular en que es seleccionen els participants. En un disseny de cohorts els participants es seleccionen en funció del valor que presenten en la variable independent (exposició), i posteriorment i de forma prospectiva es registra la variable dependent (resposta). En un disseny de casos i controls els subjectes participants són seleccionats en base al valor que presenten en la variable dependent, i a continuació es valora i es registra de forma retrospectiva l’exposició.
Els controls han de representar a la població (base de l’estudi) en la que s’originen els casos.
2. EL METODE CIENTIFIC COM A EINA DE CONEIXEMENT.
Va consolidant les teories a partir dels resultats d’estudis empírics: es consolida si el resultat de l’estudi esta d’acord amb la teoria i es revisa si el resultat no concorda amb l’esperat segons la teoria.
Segons el rol que les variables juguin al disseny de l’estudi, les variables es classifiquen en independents i dependents: - Variable independent (Exposició): és qualsevol factor, característica, intervenció o exposició (ambiental o personal) que pot produir un efecte o tenir una influencia sobre un o més aspectes (variables dependents). El terme variable independent s’origina en l’àmbit dels estudis experimentals i el terme exposició s’usa en els estudis no experimentals.
- Variable dependent (Resposta): és qualsevol efecte o resultat que pot haver estat influït o depèn d’un o més factors (variables independents).
2.1. Interpretació en termes de causalitat. .
S’ha realitzat un estudi sobre convivents fumadors i tabaquisme dels fills amb un nombre important de famílies, extretes a l’atzar d'una determinada població, i que la prova estadística aplicada ha permès concloure amb gran seguretat que la proporció de fills fumadors és més alta en les famílies amb fumadors. Què es pot deduir d'aquest resultat? Aquest resultat permet generalitzar a tota la població de famílies l'existència de la relació observada en la mostra de l'estudi: la prevalença de tabaquisme en els fills de famílies amb fumadors és més alta que en les famílies sense fumadors. D'aquesta constatació s'infereix que créixer amb convivents fumadors és una causa de l'augment del percentatge de fills que fumen? No! Associació no implica causalitat.
Pag. 109.
3. ESTUDI SOBRE ETNIA I TRASTORN DE CONDUCTA.
presenta el resultats d’un estudi per mesurar l’increment del risc de trastorn de conducta en els nens d’ètnia negra en comparació amb els d’ètnia blanca. La base teòrica d’aquesta hipòtesis es troba en la revisió de diferents estudis publicats en mostres afroamericanes que han trobat resultats que van en la línia de que l’ètnia negra te major risc de comportament disruptiu que la blanca.
Les dades corresponen a un disseny de cohorts en el qual es segueix una cohort de 500 nens d’ètnia blanca i una altre de 500 d’ètnia negra residents en una gran ciutat dels EEUU durant un any.
3.1. Com interpretar els índexs de raó.
- RR ó OR > 1  Associació positiva (RD > 0, factor de risc): La proporció de casos en els exposats és major que en els no exposats. Varia entre 1 i + .
- RR ó OR = 1  Absència d'associació (RD = 0, hipòtesi nul·la): La proporció de casos és la mateixa en exposats i no exposats.
- RR ó OR < 1  Associació negativa (RD < 0, factor protector): La proporció de casos en els exposats és menor que en els no exposats. Varia entre 1 i 0.
Les diferencies de proporcions se situen de forma simètrica al voltant de 0 i varien entre -1 i +1, mentre que als índexs de raó sempre son positius i se situen de forma asimètrica al voltant de 1, variant entre 0 i 1 si l’exposició disminueix la proporció o entre 1 i l’infinit si la incrementa.
Les diferencies de proporcions segueixen una escala additiva mentre que els índexs de raó obeeixen a una escala mutiplicatoria.
3.1.1.Índexs de raó inferiors a 1.
Si en aquest estudi es desitja reflectir l'exposició en sentit protector la conclusió serà: “en els nens de raça blanca el risc de TC es multiplica per 0.25”. Però valorar la importància del factor amb la informació multiplica per 0.25 requereix al lector molt més esforç que si s'expressa en sentit de risc: multiplica per 4.
Per aquest motiu recomanem evitar donar raons inferiors a 1 i optar per: - Expressar el factor en sentit de risc.
- Si es tracta realment d’un factor protector, expressar-ho en sentit de risc no es adequat.
4. ASSOCIACIO NO IMPLICA CAUSALITAT: EL FENOMEN DE LA CONFUSIO.
Les proves estadístiques únicament permet generalitzar l'existència de l'associació observada en una mostra a tota la població de subjectes, i en cap cas demostra que aquesta associació impliqui una relació causa-efecte (encara que una variable jugui el paper de factor de risc i l'altra de resposta).
Únicament podrem inferir una relació causal quan el disseny de la investigació i anàlisi han estat realitzats amb una estratègia adequada.
Únicament té sentit formular una conclusió en termes causals atribuint l’increment del risc a l’ètnia negra quan el disseny d'investigació garanteix l’absència de variables de confusió i s’empra una anàlisi estadística adequada.
4.1. Avaluació de la confusió mitjançant anàlisi estratificada.
En l’estudi sobre ètnia i TC hi ha evidències empíriques sòlides que indiquen que el nivell socioeconòmic és un potent factor de risc d’aquest diagnòstic. Per avaluar-ne en quin grau aquesta variable podria estar actuant com un factor de confusió, es decideix reanalitzar les dades separant els nens en dos estrats, en funció de que pertanyin a famílies de nivell socioeconòmic baix versus mitjà-alt.  Amb l’estratificació podem eliminar possibles variables confusionistes.
4.2. Criteris necessaris per formular conclusions en termes causals.
- Temporalitat: L’exposició (X) ha de precedir a la resposta (Y). Aquesta condició implica emprar un disseny en el qual el temps intervingui, de manera que es pugui garantir que les exposicions s’han presentat amb anterioritat a la resposta.
- Associació: Ha d’existir una covariació significativa entre exposició (X) i resposta (Y). Implica trobar relacions estadístiques entre els factors de l’estudi, de manera que la variació en els nivells de les exposicions comporti un canvi en els valors de la resposta.
- Absència d’espurietat: No han d’actuar variables externes (totes aquelles que no formen part de la hipòtesi empírica objecte de contrastació) associats simultàniament amb l’exposició i la resposta. En cas de que aquestes variables estiguin presents, ens trobem davant el fenomen de la confusió.
4.3. Variables que necessàriament s’han de registrar en la recerca.
Existeixen múltiples biaixos que atempten contra la validesa interna d’un estudi. Els més habituals són: - La història natural del fenomen que s’estudia: es refereix a possibles variables externes que transcorren de forma paral·lela a les variables de la hipòtesis empírica i que poden actuar entre les successives mesures del fenomen d’interès - La maduració: processos interns dels participants en un estudi que són exclusivament el resultat del pas del temps - La pròpia reactivitat dels subjectes davant el procés de mesura - Les característiques específiques dels instruments de medició - La variabilitat de l’observador/avaluador - Les pèrdues de registres (especialment en dissenys amb seguiment o longitudinals) - La confusió: falta de superabilitat entre els grups que es comparen.
La presencia i grau en que un tipus de viai o altre pugui afectar a la validesa interna de la investigació dependrà, en gran mesura del disseny d’investigació i de l’ús d’estratègies adequades per controlar el seu efecte.
Entre les tècniques mes emprades per al control de la confusió es troben l’aleatorització (dissenys experimentals) i aparellament (no experimentals).
La tècnica estadística mes important per eliminar el biaix produït per les variables de confusió es realitzar ajustos estadístics amb models de regressió.
Inclòs emprant múltiples mètodes de control de confusió, aquest fenomen no sempre pot ser del tot eliminat d’un estudi. Inclòs havent-hi fet una adequada revisió sistemàtica, hi hagi variables de confusió desconegudes que en el cas de la recerca no experimental poden produir un biaix i en el cas de la recerca experimental poden no haver quedat ben repartides en els diferents grups. Per tant, les conclusions en investigació sempre son de caràcter provisional, inclòs quan es formulen en termes causals.
...

Comprar Previsualizar