TEMA 2. ESTIMACIÓ (1ra part) (2017)

Apunte Catalán
Universidad Universidad de Barcelona (UB)
Grado Ciencias y Tecnología de los Alimentos - 4º curso
Asignatura Salut Pública i Epidemiologia Nutricional
Año del apunte 2017
Páginas 6
Fecha de subida 16/11/2017
Descargas 1
Subido por

Vista previa del texto

SALUT PÚBLICA I EPIDEMIOLOGIA NUTRICIONAL ARUIZPEREZ TEMA 2. ESTIMACIÓ (1ra part) Quan parlem de població, parlarem de paràmetres i quan parlem de mostra, parlarem d’estimacions.
Estimació: intent d’endevinar una quantitat quan no podem conèixer-la amb exactitud.
A aquestes quantitats les anomenem paràmetres (de vegades, paràmetres poblacionals).
Estimació de paràmetres.
PROBLEMA Hauríem de veure tota la població de Catalunya i veure quants fumen del total. A l’hora de treballar estadística, la mostra ha de ser seleccionada d’una manera determinada, allò que anomenarem mostreig.
Aquesta mostra ha de tenir un número necessari d’individus a estudiar.
No és factible conèixer-la amb exactitud.
Si la mostra és representativa de la població, podré utilitzar l’estadística.
Nosaltres no coneixem les poblacions; nosaltres agafem mostres i intentem obtenir informació de la població.
SOLUCIÓ Enquesta a una mostra - Com seleccionar-la? - Quants individus ha d’incloure? Si el procés es du a terme correctament, podrem estimar el paràmetre P: la proporció de fumadors a Catalunya.
Mostreig Consisteix en extreure mostres a partir de la població d’interès. Hi ha molts procediments: 1- Aleatori és en teoria que tots els de la població tenen que la mateixa probabilitat d’aparèixer en la mostra. Quan jo puc sortejar els individus, quan els tinc numerats.
2- No aleatori Tota l’estimació (i casi tota l’estadística inferencial) es basa en la suposició de mostreig aleatori. És important distingir els procediments.
Mostreig aleatori Tinc les següents opcions. En teoria, el més fàcil, el què sempre apareix és el simple, que consisteix en la loteria; tinc tots els individus identificats i els sortejo. És molt difícil de fer en estudis observacionals. El simple seria per exemple, veure la taxa d’obesitat a BCN. Jo podria sortejar els NIUB de la UB i veure d’aquests seleccionats qui en té sobrepès o no.
Aquestes dades són confidencials, per tant, aquí entra en joc els conglomerats.
Els conglomerats es duen a terme quan hi ha tants individus que és impossible (o la informació és confidencial), intento buscar unitats geogràfiques que siguin com a grups de gent. En la UB, podríem pensar que els graus siguin grups. Exemples; la OMS, per SALUT PÚBLICA I EPIDEMIOLOGIA NUTRICIONAL ARUIZPEREZ treballar en països del sud, assumeix que cada família és un grup. Taxa de malària en l’Àfrica subsahariana ells passen casa per casa aleatòriament i fan l’estudi en les famílies.
En els altres casos, estem assumint el què estem estudiant és independent del sexe, edat... i l’estudi es distribueix homogèniament. Quan no és independent, si fem aleatòriament, podem agafar molta gent d’una edat i no tindrem un estudi objectiu.
Aleshores el simple i conglomerats no em serveixen. En aquest cas el què farem serà agrupar per edats i intentarem agafar lo més homogeni possible dins de cada grup.
Per exemple, farem un estudi que està associada a l’índex econòmic de les famílies. Si ens ho diuen que ho fem per Barcelona, seria lògic fer-ho per barris. Els conglomerats serien les cases, un altre grup seria el pis, un altre seria la casa... primer faig un poliètapic, després estratificat i després, conglomerats.
Tota l’estadística que farem nosaltres serà aleatori.
• Aleatori simple Si totes les possibles mostres tenen la mateixa probabilitat de ser seleccionades o, el què és el mateix, si tots els individus de la població tenen la mateixa probabilitat de ser seleccionats.
Sempre que no complim aquesta condició, serà que no és possible.
Aleatori - - Si no depèn d’una sistemàtica coneguda Procediments de selecció “inofensius” o Dia de naixement (par, impar) o Dia de la setmana o Primera lletra del cognom o ...
No compleixen la definició d’aleatori Com obtenir una MAS Només és possible si la població està censada. De vegades, no existeix cens d’individus però sí agregacions d’aquests: - Nens i escoles - Pacients i centres - Metges i col·legis de metges Cens compost per un total de M individus. Obtenció de MAS de mida N: 1. Assignar un número aleatori a cadascun 2. Ordenar per aquest número 3. Seleccionar els N primers Els paquets estadístics solen tenir alguna funció específica per fer-ho.
Des del punt de vista de les màquines, un cop hem assignat números als individus, podem escollir un procés informàtic que em seleccioni els què vulgui.
SALUT PÚBLICA I EPIDEMIOLOGIA NUTRICIONAL ARUIZPEREZ Estimació puntual de P Imaginem que tenim una mostra de mida 100. La probabilitat de fumar és de 0’63. Aquí estem utilitzant les freqüències per decidir quant val la probabilitat. Per això, l’estadística que utilitzem és l’estadística freqüentística.
No hi ha cap màquina que mesuri les probabilitats, per tant, s’ha de buscar la manera de que ho faci fent l’estadística de la proporció.
És una ironia pensar que la població tingui un 0’63, sinó que tingui un valor pròxim. Hem de pensar que és el millor que tenim per estimar la població però no tenim molta idea si estem ajustats o no tenint només un estudi. Per això, normalment es repliquen els estudis per veure si coincideix o no.
No pots estar segur si hi ha 0’63. Per què? Perquè està subjecta a la variabilitat i està governada per atzar, per això, pot prendre valors entre 0 i 1. Estem bastant convençuts, però, que aquest valor sigui bo. Per què? Perquè hi havia dues estimacions; la puntual i per intervals. Ara estem parlant de la puntual; aquesta té un estimador que és una fórmula matemàtica que recull tota la informació de la població. No m’interessa saber si un individu fuma o no, sinó si la proporció de la gent que fuma de la mostra que representa la població total. No m’interessa la mesura de l’individu, sinó la mesura de la mostra. La pregunta que ens fem és; el què estic mesurant, la informació mostral, té moltes probabilitats de ser certes o no? Aquest valor és ESPERANÇA i aquesta és la mitja, és a dir, quina és l’esperança de vida de les dones? Doncs 84 anys però no totes les dones viuran fins els 84 sinó que moltes moriran abans o més tard. Això és el mateix, el 0’63 no deixa de ser una mitja.
L’estimació puntual té un problema; no estem fent una diferència estadística, és a dir, si aquest 0’63 és molt probable o poc probable en la població. Aquí entra en joc l’interval de confiança.
SALUT PÚBLICA I EPIDEMIOLOGIA NUTRICIONAL ARUIZPEREZ Estimació per interval Necessitem alguna orientació sobre el semblant entre l’estimació i el paràmetre. És possible, a costa de certa imprecisió: estimació per interval.
Impresició: no obtenim estimacions puntuals (únic valor) sinó un interval de possibles valors: Interval de confiança.
Intervals de confiança (IC) - IC: eina d’estimació per excel·lència Apareixen en tots els originals Imprescindible interpretar-los correctament Per allò, s’ha de saber com s’obté I per allò, s’ha de passar abans per conceptes previs Aquest seria el interval de confiança. És l’eina d’estimació per excel·lència.
Hauria d’aparèixer sempre en les nostres estimacions. La probabilitat estadística és la probabilitat d’equivocar-me o d’encertar-la. Si no la tinc, és una mica hipòcrita perquè et creus que treballant amb 30 individus, pots generalitzar a la població.
Distribució mostral d’un estimador Quan parlem d’una població, nosaltres només tenim una mostra. Imaginem que puc treure infinites mostres i cadascuna em donaria un valor pròxim a l’altra, però diferent.
Tots els valors serien observats. Què passarà? Com tinc infinites mostres, la variable què estic estudiant serà l’estimador, la proporció. Per tant, obtindré diversos valors per aquesta proporció. Aleshores, aquests valors els represento en una gràfica i veuré que aquestes variables es tracten de variables aleatòries.
Veurem que tots els valors van variant, per això es diu variable aleatòria. Aquesta distribució s’anomenarà distribució mostral de l’estimador.
SALUT PÚBLICA I EPIDEMIOLOGIA NUTRICIONAL ARUIZPEREZ Pm tindrà una distribució mostral. Quina? No la sabem però la podem dibuixar. Si miro la distribució dels %, hem donarà un histograma. La major serà 0’6, que serà l’esperança.
Què passarà si incremento el número de mostres? Tindré més informació i les barretes de l’histograma les podré fer més estretes. Si incremento molt la mida de la mostra, podré fer intervals molt petits i anirà apareixent el concepte de continuïtat i ens acabarà apareixent la distribució normal.
Tots els valors des de 0 fins a infinit, es poden presentar en una mostra de mida 100 però entre 0’5 i 0’7 estan la majoria però per sota hi ha molt pocs però és possible que hi estiguin.
Els valors extrems de la gràfica, son valors estranys per tant, sempre et quedes amb la idea del 95% dels valors centrals. Podem veure que hi ha uns valors molt probables i altres SALUT PÚBLICA I EPIDEMIOLOGIA NUTRICIONAL ARUIZPEREZ poc probables i jo puc establir intervals que em marquin els 95% dels més esperables i deixa fora els menys probables.
La forma de la distribució normal depèn de la variança de les dades. Com més variança té, més ample és la distribució.
...

Tags: