Apuntes completos de Psicometría (parte I) (2015)

Apunte Español
Universidad Universidad Autónoma de Madrid (UAM)
Grado Psicología - 3º curso
Asignatura Psicometria
Año del apunte 2015
Páginas 10
Fecha de subida 21/07/2017
Descargas 0
Subido por

Vista previa del texto

PSICOMETRÍA TEMA 1. Introducción La psicometría es la rama de la psicología que se ocupa de la medición de variables psicológicas. Sin medida no hay diagnóstico preciso, y sin diagnóstico preciso no hay intervención eficaz. Los núcleos temáticos son:  Teorías de la medición Estas teorías estudian los requisitos lógicos y matemáticos necesarios para poder medir. Existen tres:  Concepción conservadora de Campbell (1920): medir es asignar números a objetos, de modo que los números indiquen las cantidades de la propiedad del objeto medido. Bajo esta perspectiva, la medición se hace imposible, por lo que surgen otras alternativas.
 Teoría de las escalas de medición de Stevens (1946): medir es asignar números a objetos de acuerdo a una regla. Los números no indican cantidades, sino relaciones. Desde esta postura, la medición de los constructos psicológicos se hace posible.
 Teoría representacional de Suppes y Zinnes (1963): estudia las condiciones que debe satisfacer el sistema relacional empírico.
 Escalamiento Desarrolla procedimientos y técnicas de análisis estadístico para medir las características psicológicas de los objetos. En el siglo XIX se desarrolló el escalamiento psicofísico gracias a Weber y Fechner, mientras que en el siglo XX se desarrolló el escalamiento psicológico de mano de Thurstone.
 Análisis factorial Es una técnica multivariante (trabaja con muchas variables) de análisis de datos que permite pasar de un conjunto mayor de variables observadas a uno menor de variables latentes. Es una técnica de reducción de la dimensionalidad, y nos permite estudiar la validez de los constructos que medimos. Es una técnica que surgió para explicar las correlaciones existentes entre las distintas variables psicológicas.
 Teorías de los tests Son modelos matemáticos que, a su vez, desarrollan modelos para la construcción y el uso de los tests.
La Teoría Clásica de los Tests (TCT) fue propuesta en 1904 por Spearman, y Galton y Binet fundamentaron la medida de las diferencias individuales. A partir de 1960 se desarrollaron otros modelos que, lejos de ser competidores contra la TCT, aportan cosas distintas:  Teoría de la Generalizabilidad:  Enfoque de la medición referida a un criterio  Teoría de la Respuesta al Ítem (TRI) – es matemáticamente muy compleja y, para poder utilizarla, son necesarios muchos datos. No obstante, supera alguna de las limitaciones de la TCT y se fundamenta en el estudio de los ítems. Permite realizar mediciones que no dependen ni de la muestra utilizada ni de los ítems. Un ejemplo de su aplicación son los informes PISA.
Un test es un procedimiento en el que una muestra de conducta de un examinado en un dominio especificado se obtiene, evalúa y puntúa usando un proceso estandarizado (Standards for Educational and Psychological Testing, 1999). Las propiedades que debe poseer un test son las siguientes: 1. Tener propiedades psicométricas conocidas 2. Administrarse de modo controlado 3. Servir para medir atributos psicológicos – por tanto, una encuesta no es un test Las 6 funciones de los tests Diagnóstico Selección Clasificación Certificación Consejo Descripción e información PSICOMETRÍA Los tipos de tests que existen según:       El tipo de rendimiento: o Tests de rendimiento óptimo: aquellos que pretenden medir el rendimiento máximo que es capaz de alcanzar una persona, tal como se hace en tests de conocimientos o en los tests de inteligencia y aptitudes.
o Tests de rendimiento típico: interesa medir el comportamiento usual, tal como se hace en los tests de personalidad o en las escalas de actitudes. El tiempo de aplicación del test tiene escasa o nula relevancia.
El medio de aplicación: lápiz y papel / informatizados El modo de interpretar las puntuaciones o Tests referidos a normas (normativos): la interpretación se realiza mediante un baremo obtenido en un grupo normativo, como cuando interpretamos los Centiles. Es decir, estos tests nos muestran nuestra posición con respecto a un grupo de referencia.
o Tests referidos al criterio: la interpretación se refiere al rendimiento individual conseguido por una persona en relación a unos criterios o dominios establecidos de antemano. Por ejemplo, el marco europeo de referencia para las lenguas (B1, B2, C1).
Cabe interpretar el rendimiento en el mismo test desde ambas perspectivas.
El formato de respuesta o Tests de respuesta construida: preguntas abiertas de tipo ensayo o Tests de respuesta seleccionada: son tests de rendimiento óptimo con varias opciones de respuesta, normalmente con una sola opción correcta o Tests de categorías ordenadas: por ejemplo, con varias categorías para manifestar el grado de acuerdo con determinadas sentencias o Tests de respuesta binaria: sí / no, V / F o Tests ipsativos: solo son aplicables a los tests de respuesta seleccionada y son muy utilizados en el ámbito de los RRHH porque controlan mejor la deseabilidad social. El participante debe escoger la respuesta entre dos alternativas igualmente deseables:  Soy responsable ( )  Soy emocionalmente estable ( ) El establecimiento de tiempo límite o Tests de velocidad: se fija el tiempo de administración de forma que sea muy difícil resolver todos los ítems, pues con frecuencia la tarea es muy sencilla y se trata de ser cuántas respuestas es capaz de acertar el sujeto en el tiempo disponible. Lo que importa es saber cuántos ítems es capaz de hacer el evaluado.
o Tests de potencia: se suele dar tiempo suficiente para que sea posible dar una respuesta meditada a cada ítem. Se presta especial atención a las características de los ítems que el sujeto contesta.
El marco teórico: psicométricos, proyectivos, comportamentales, situacionales, etc.
PSICOMETRÍA TEMA 2. Construcción de tests y análisis de ítems Un test está formado por una serie de ítems a los que cada individuo debe responder. Después de cuantificar las respuestas de una persona a los ítems del test, se pretende asignar una puntuación a esa persona respecto al constructo o atributo que se pretende medir. Las fases en la construcción de un test son las siguientes: 1. Definición del constructo a medir Lo primero a especificar es el constructo, atributo o característica psicológica a evaluar y el propósito del test. Hay que tener en cuenta una definición operativa del constructo psicológico para poder redactar ítems que cubran todas sus dimensiones o componentes, apoyándose para ello en las teorías psicológicas. También hay que atender a varias características de la población a evaluar, como la edad, el nivel educativo, la eventual presencia de discapacidades y de diferencias en el dominio del lenguaje, etc. En estos dos últimos casos había que considerar la política de acomodaciones; la acomodación más frecuente consiste en modificar el tiempo de administración. Además, conviene construir la tabla de especificaciones, donde se detallan los contenidos del test, las destrezas cognitivas a evaluar y el porcentaje de ítems que debe corresponder a cada celdilla que resulta de cruzar los contenidos y las destrezas. Por ejemplo: Objetivos instruccionales Conocimiento 15 % Aplicación 85 % Contenidos Tema 1 Tema 2 Tema 3 10 % 5% 0% 0% 40 % 45 % Si no trabajamos con esta tabla vamos a tener un exceso de los ítems que son más fáciles de preguntar.
Evaluación Síntesis Análisis Aplicación Comprensión Conocimiento 2. Construcción provisional (redacción de ítems) Recomendaciones de Haladyna para la construcción de ítems de opción múltiple:   Referidas al contenido: o Cada ítem debería estar basado en un tipo de contenido y de demanda cognitiva.
o Utilice material novedoso para poder examinar un nivel alto de pensamiento.
o Mantenga el contenido de cada ítem independiente del contenido del resto de ítems del test.
o Cada ítem debe basarse en contenidos importantes. Evite contenidos demasiado específicos o demasiado generales.
o Evite que los ítems estén basados en opiniones a menos que sean cualificadas.
o Evitar ítems con “truco” (engañosos).
Referidas al formato: o Construya el ítem verticalmente en vez de horizontalmente.
PSICOMETRÍA    Referidas al estilo: o Edite y corrija los ítems.
o Mantenga una complejidad lingüística apropiada para el grupo que está siendo evaluado.
o Reduzca al máximo la cantidad de lectura de cada ítem. Evite la palabrería excesiva.
Referidas al enunciado: o Incluya la idea central clara y concisamente en el enunciado y no en las opciones.
o Exprese el enunciado de manera afirmativa, evitando frases negativas.
Referidas a las opciones: o Use opciones que sean plausibles y discriminativas. Usualmente con tres opciones es suficiente.
o Asegúrese que sólo una de esas opciones es la respuesta correcta.
o Varíe la colocación de la respuesta correcta entre las opciones posibles.
o Coloque las opciones en un orden lógico o numérico.
o Mantenga las opciones independientes. No deben solaparse.
o Evite usar las opciones NINGUNA DE LAS ANTERIORES, TODAS LAS ANTERIORES Y NO LO SÉ.
o Escriba las opciones de forma afirmativa, evite términos negativos tales como NO.
o Evite dar pistas sobre la respuesta correcta, tales como:  Mantenga la longitud de las opciones aproximadamente igual.
 Evite determinantes específicos como SIEMPRE, NUNCA, COMPLETAMENTE o ABSOLUTAMENTE.
 Evite asociaciones por sonido similar y opciones idénticas o parecidas a términos del enunciado.
 Evite pares o tríos de opciones que den pistas al examinado sobre la opción correcta.
 Evite opciones claramente absurdas o ridículas.
 Mantenga las opciones homogéneas en contenido y estructura gramatical.
o Haga plausibles todos los distractores. Use errores usuales de los estudiantes para escribir los distractores.
o Evite usar el humor.
Cuantificación de respuestas a los ítems: o o Tests de rendimiento óptimo  Verdadero / Falso  se muestran dos alternativas y se ha de elegir la que se considera correcta. Los aciertos se cuantifican como 1 y los errores como 0.
 Opción múltiple  un ítem consta de un enunciado y de tres o más opciones de respuesta, de las que solo una es correcta. También en este caso los aciertos se cuantifican con un 1 y los errores con un 0.
Tests de rendimiento típico  Opción binaria  la persona debe elegir entre dos opciones antagónicas  Categorías ordenadas  se establece un continuo ordinal de más de dos categorías, que permite a la persona matizar mejor su respuesta. Hay varios tipos de escalas de respuesta, pero las más comunes son la de grado de acuerdo y la de frecuencia. Si el formato de respuesta es de K categorías ordenadas, las diversas categorías se cuantificarán normalmente desde 1 hasta K.
Dado un formato de respuesta determinado, es necesario cuantificar las posibles respuestas a un ítem teniendo en cuenta si es un ítem directo o inverso.
Redacción de categorías de respuesta Redacción de enunciados PSICOMETRÍA Redacción de ítems de tests de rendimiento típico  El ítem debe elicitar diferentes respuestas para los diferentes niveles del constructo. Evite el uso de universales (todo, siempre, nunca, etc.). Por ejemplo, “nunca me pongo nervioso” o “la participación en conferencias debería tener el mismo peso en la nota final que la participación en las prácticas”, ya que en este caso, una persona que marque la casilla “completamente en descuerdo” puede pensar que las conferencias tienen que tener mucho más peso que las prácticas o que tienen que tener mucho menos peso.
 Cada pregunta debe centrarse en sólo un aspecto, ya que los ítems que preguntan por más de un contenido son difíciles de responder. Por ejemplo, “me gusta ir a fiestas donde hay mucho ruido y diversión”, ya que hay personas a las que les gustan las fiestas divertidas pero no las ruidosas y vicerversa y no pueden responder a la pregunta con las categorías que les ofrecemos.
 Evite hacer suposiciones sobre los entrevistados. Por ejemplo, “estoy satisfecho con las tutorías de esta asignatura”, ya que no todo el mundo ha ido a tutorías.
 Use un vocabulario claro y comprensible. Para la población general, el vocabulario usado debería poder entenderse por un niño de unos 12 años de edad.
 El ítem no debe ser ofensivo para el encuestado desde ningún punto de vista. Hay que tener en cuenta a las minorías de género, raza, grupos de edad, etc.
 Al redactar el ítem ponga la situación o la condición siempre al principio y la conducta siempre al final. Por ejemplo, en vez de poner “me siento nervioso cuando voy al dentista” es recomendable poner “si voy al dentista me siento nervioso”.
 Use frases afirmativas, pero incluya ítems en sentido directo y sentido inverso para intentar evitar la aquiescencia, que es la predisposición a manifestar acuerdo con un enunciado con independencia de su contenido (yes-saying). Por ejemplo, en vez de redactar un ítem como “no estoy nervioso” (sentido directo, negativo) es recomendable redactar “estoy relajado” (sentido inverso, afirmativo).
 Redacte ítems relevantes, es decir, que estén claramente relacionados con el rasgo.
 Siempre que sea posible utilice el tiempo presente, es decir, “estoy nervioso” en vez de “ayer estaba nervioso”.
 Si se usa el formato de categorías ordenadas, debo cuidar que las instrucciones de respuesta estén balanceadas. Por ejemplo, las instrucciones no pueden ser “indique su grado de acuerdo con las siguientes frases”, ya que incitas a que los sujetos muestren su acuerdo y no su desacuerdo. Lo correcto sería “indique en qué grado está usted de acuerdo o en desacuerdo con las siguientes frases”.
 Utilice un etiquetado verbal completo, es decir, etiquete cada una de las categorías de las escalas de respuesta y evite usar solo números.
o Deben preferirse las categorías verbales a las numéricas siempre y redactarse de modo que tengan un significado preciso para el evaluado.
o Debe evitarse que predominen las categorías de respuesta positivas o negativas.
 El espaciado entre las categorías de respuesta puede influenciar la interpretación de las mismas.
Esté seguro de que las columnas que contienen las etiquetas de respuesta tienen la misma amplitud.
 Elija etiquetas específicas para el constructo, con el objetivo de mejorar la precisión de la medida. Al utilizar etiquetas generales (desacuerdo – acuerdo), hacemos que los ítems correlacionen mucho. Por ejemplo, si en las instrucciones añadimos “basándose en su experiencia en el departamento, evalúe la naturaleza de la comunicación entre” y utilizar etiquetas como muy pobre – muy buena.
PSICOMETRÍA La investigación muestra que los entrevistados prefieren escalas de evaluación con etiquetas verbales, ya que las consideran una elección más natural. Además, que la fiabilidad es mayor cuando se usan escalas verbales con etiquetado completo. La ordenación de las categorías (de menos a más o de más a menos) parece poco importante. Las etiquetas de los extremos influyen mucho sobre las distribuciones de las respuestas, especialmente si los extremos son absolutos (nunca/siempre). Las escalas que usan extremos menos absolutos consiguen mayor variabilidad y un uso más similar de todas las categorías.
       Coloque las opciones de respuesta “no sustantivas” al final de la escala, separadas del resto de las opciones. Por ejemplo, añadir una columna en color diferente con la etiqueta “sin base para evaluar”. Esto es eficaz cuando las respuestas no son comprometidas, ya que si las respuestas son comprometidas obtendremos un gran número de elecciones de dicha categoría.
Los ítems en los que se utiliza un formato de respuesta acuerdo/descuerdo (DA/ED) suelen ser menos fiables y válidos que sus equivalentes en los que se utiliza un formato con opciones de respuesta específicas (EE). El mejor resultado del EE se debe a que reduce la aquiescencia, minimiza la carga cognitiva de la pregunta y mantiene una relación monotónica con el constructo de interés.
Las categorías de respuestas deben ser exhaustivas e incluir todas las respuestas plausibles.
Las categorías de respuesta tienen que ser mutuamente excluyentes.
Las categorías de respuesta deberían aproximarse a las distribuciones reales de la población.
A pesar de décadas de investigación no se sabe cuál es el número óptimo de categorías de respuestas o El número óptimo de categorías no es un número constante, sino que depende de la capacidad cognitiva de la muestra y de la motivación para responder adecuadamente.
o Se ha investigado el efecto del número de categorías sobre la fiabilidad y la validez con resultados contradictorios:  Algunos investigadores han encontrado que la fiabilidad y la validez son independientes del número de categorías de la escala  Otros investigadores han encontrado un efecto del número de categorías y han recomendado utilizar más de 3 categorías.
El efecto de la inclusión de una categoría central tampoco está claro, pero en las escalas que miden frecuencia la categoría central sí tiene sentido. La categoría central se elige con mayor frecuencia si el asunto a evaluar es poco interesante para la muestra y si las actitudes sobre el tema son poco intensas.
PSICOMETRÍA 3. Aplicación a una muestra Lo más importante en este aspecto es que el test se aplique a una muestra representativa de la población a evaluar.
4. Análisis de ítems Con análisis de ítems nos referimos a los procedimientos dirigidos a extraer información sobre su calidad. Después de este proceso se podrán determinar los ítems que formarán parte del test definitivo.
a. Media en TRT (Tests de Rendimiento Típico) La media tiene una cuantificación entre 1 y K, si K es el número de categorías ordenadas. Si el ítem tiene 4 categorías ordenadas y, por tanto, cuantificamos entre 1 y 4, la media no puede ser 5. Los valores extremos de la media (próximos a 1 o a K) se asocian a varianzas bajas, porque indica que casi todas las personas han respondido de forma extrema y por igual.
Ej.: A continuación se ofrecen los resultados del análisis de una escala.
La escala es un test de rendimiento típico porque la media de los ítems no está entre 0 y 1, lo que nos indica que no es un test de rendimiento óptimo. Además, la desviación típica es mayor de 0’5. Si se tratase de un test de rendimiento óptimo, la varianza máxima sería 0’25, y la desviación típica 0’5. Por otro lado, la puntuación máxima que se puede asignar a un ítem de este test es un 7 porque hay un ítem con media mayor de 5, lo que descartaría las opciones 3 y 5.
Ej.: Sean los dos ítems siguientes de un test de agresividad: Ítem 1: participo en peleas | Ítem 2: discuto con la gente | Se usó un formato de respuesta tipo Likert (4 opciones). La media de un ítem es 2’81 y la del otro 1’08. Indique qué media corresponderá probablemente a qué ítem.  La media 2’81 corresponde probablemente al ítem 2, ya que es más probable que la gente discuta habitualmente con otras personas que se pelee. Si K (en este caso, 4) es el máximo acuerdo, la media nos indica lo fácil que es estar de acuerdo con el ítem. Cuanto más baja sea la media, habrá que tener más nivel de rasgo para alcanzar una puntuación elevada en el ítem.
b. Varianza en TRT (Tests de Rendimiento Típico) La varianza depende del valor de K.
Ej.: Calcule la varianza máxima en un ítem con 4 categorías de respuesta.
1 2 3 4 La máxima varianza se daría si la mitad de personas respondieran a cada uno de las dos respuestas extremas.
50 50 ̅= 𝑿 ∑ 𝑿𝒊 = ∑ 𝒏𝒊 × 𝑿 = (0.5 × 1) + (0 × 2) + (0 × 3) + (0.5 × 4) = 2.5 𝒏 (siendo ni la proporción relativa, es decir, el número de personas con cada puntuación) 𝑆𝑋2 = ∑ 𝑛𝑖 × (𝑋 − 𝑋̅) = 0.5·(1 – 2.5)2 + 0·(2 – 2.5)2 + 0·(3 – 2.5)2 + 0.5·(4 – 2.5)2 = 2.25 La varianza máxima de los ítems de 4 categorías ordenadas es 2.25.
c. Índice de dificultad (pj) en TRO (Tests de Rendimiento Óptimo) Este indicador sirve para cuantificar el grado de dificultad de cada ítem. Se aplica a los ítems dicotómicos de los tests de rendimiento óptimo. El índice de dificultad de un ítem j, pj, se define como la proporción de evaluados que ha acertado el ítem. Es el cociente entre el número de evaluados que lo han acertado (Aj) y el total de evaluados que lo han respondido (Nj).
PSICOMETRÍA El mínimo valor que puede adquirir pj es O, en el caso de que el ítem sea muy difícil (Sj = 0), y el máximo valor que puede adquirir es 1, en el caso de que el ítem sea muy fácil (S j = 0). A medida que p se acerca a 0.5, su varianza aumenta. De hecho, la varianza de un ítem dicotómica puede obtenerse a partir de su índice de dificultad, pues: S j2 = pj·(1 – pj). La máxima varianza de un ítem dicotómico (0.25) se alcanza cuando p=0.5. A mayor índice de dificultad el ítem es más fácil, mientras que un menor índice de dificultad indica un ítem más difícil. Los ítems pueden ordenarse en función de pj  ítem fácil (1) – ítem intermedio (0.5) – ítem difícil (0).
No obstante, el valor del índice de dificultad depende de la muestra; no es un valor fijo. Se sugiere que su valor oscile entre 0.2 y 0.9, pues si toma valores extremos indica que el ítem no discrimina entre los sujetos que tienen más y menos nivel del rasgo a medir.
Ej.: ¿Qué ítem es más fácil? El ítem más fácil es el nº 4 (𝑋̅ = 0.9592) porque el 95.92% de los participantes lo han acertado y su índice de dificultad es el más alto.
El ítem más difícil ha sido el nº 2, ya que su índice de dificultad es el más bajo (𝑋̅ = 0.4286), lo que indica que solo un 42.86% lo han acertado.
Ej.: En esta tabla ¿las omisiones se han considerado fallos? Las omisiones, en un principio, no se cuentan para la media.
Si de 6 sujetos solo 4 contestan a un ítem determinado, la media (y el índice de dificultad) se calcula sobre 4 y no sobre 6. Por tanto, si las omisiones se contabilizan como fallos hay que decirlo claramente en las instrucciones. Si calculamos la media y varianza de los ítems 5 y 6 obtenemos que: X5 = (1 + 0 + 0 + 0) / 4 = 1/4 = 0.25  S52 = 0.25 · (1 – 0.25) = 0.1875 X6 = (0 + 0 + 0 + 0) / 4 = 0/4 = 0  S62 = 0 · (0 – 0.25) = 0 Está claro que las omisiones sí se han considerado fallos ya que la media se ha calculado sobre el número de personas que han contestado a ese ítem concreto.
d. Varianza de TRO (Tests de Rendimiento Óptimo) El mínimo valor que puede alcanzar la varianza en un TRO es O, en el caso de que el ítem sea nada discriminativo. El máximo valor que puede alcanzar la varianza es 0.25 en el caso de que el ítem sea muy discriminativo.
Los ítems que hacen que un test tenga más varianza son los ítems de dificultad intermedia. Por tanto, la relación que existe entre la varianza y la dificultad de un ítem toma forma de U invertida Ej.: ¿Qué ítem tiene mayor varianza? Los ítems que tienen mayor varianza son el ítem 5 y el ítem 9, ambos con una varianza casi máxima, de 0.24906.
e. Índices de discriminación Un ítem que mida el constructo de interés debe discriminar entre los que tienen altos y bajos valores en el constructo. Nos indican el grado en que ítem y test miden el mismo rasgo.
 Índice de discriminación Dj Este indicador se obtiene exclusivamente para ítems dicotómicos.
Requiere establecer dos o tres subgrupos de evaluados a partir de sus puntuaciones en el test: el de los que tienen altas, el de los que tienen medias y el PSICOMETRÍA de los que tienen bajas puntuaciones. Sea ps la proporción de personas del subgrupo superior que ha acertado el ítem, y sea pi la proporción de personas del subgrupo inferior que ha acertado el ítem, el índice de discriminación del ítem j se define como la diferencia entre ambas proporciones. El indicador D toma valores entre -1 y +1: cuando D = 1, todos los evaluados del subgrupo superior han acertado el ítem y ninguno del subgrupo inferior lo ha hecho. Cuando D = 0, la proporción de los que han acertado el ítem es la misma en todos los subgrupos. Cuando D = -1, ninguno del subgrupo superior ha acertado el ítem y todos los del subgrupo inferior lo han hecho. Cuanto D más se acerque a 1, mayor es la capacidad discriminativa del ítem. Se requiere que D sea positivo y, normalmente, superior a 0.2, para que el ítem no sea eliminado. Si se utiliza este índice de discriminación con muestras pequeñas se pierda mucha información.
𝐷𝑗 = 0.70 − 0.30 = 0.40  Correlación ítem-test (r X , j) Siendo X la puntuación del test y j la puntuación del ítem, se aplica la fórmula de la correlación de Pearson y se obtiene la correlación ítem-test. Para que un ítem sea discriminativo, la correlación tiene que ser directa. Si la correlación es igual a 0, el ítem no discrimina, mientras que si la correlación es igual a 1, se considera que el ítem es muy discriminativo. Si la correlación tiene signo negativo, te está indicando que algo no va bien: puede ser un problema de cuantificación o de ambigüedad del ítem, ya que indica que cuando las personas aciertan el ítem tienen puntuaciones bajas.
 Correlación ítem-resto del test (correlación corregida) 𝑟𝑋𝑐 ,𝑗 = 𝑟𝑋−𝑗, 𝑗 Para calcular la correlación corregida es necesario crear una nueva columna de datos, denominada “total menos ítem en cuestión”. Es mejor utilizar la correlación corregida que la correlación ítem-test, especialmente en los tests con pocos ítems (< 25). Además, esta es la correlación que calcula el SPSS. Es muy importante tener en cuenta que la correlación corregida siempre será menor (o en el peor de los casos igual) que la correlación ítem-test. La razón de ello es que la correlación ítem-test está sobreestimada porque incluye la correlación del ítem en cuestión con él mismo.
 Propiedades de ambas correlaciones  Son aplicables tanto a ítems de rendimiento óptimo como a ítems de rendimiento típico.
 Toman valores, como cualquier correlación, entre -1 y 1  Aconsejable un valor mínimo que sea significativamente distinto de 0. El valor obtenido es significativamente distinto de 0 si: Siendo N el tamaño muestral  Se proponen valores superiores a 0.15 ó 0.2. En tests multidimensionales los valores pueden ser bajos.
PSICOMETRÍA Ej.: A continuación se ofrecen ciertos datos de un ítem dicotómico: su índice de dificultad, su varianza, la correlación ítem-test y la correlación ítem-resto del test. Identifíquelos:     0.15 – correlación corregida 0.24 – varianza 0.40 – índice de dificultad 0.53 – correlación ítem-test Primero probamos qué valor de p nos daría una varianza que tome uno de los cuatro valores del enunciado. Encontramos que si p = 0.40, la varianza del ítem es 0.24, lo que concuerda con dos de los datos del enunciado. Por tanto, los dos valores restantes tienen que ser la correlación ítem-test o la correlación corregida. Sabemos que la correlación ítem-test está sobreestimada y que tomar un valor superior a la correlación corregida. También se observa una gran diferencia entre ambas correlaciones, lo que nos indica que el test era corto.
f.
Análisis de las opciones de respuesta Ej.: Análisis estadístico de las opciones de respuesta Se comienza creando nuevas variables, dependiendo del número de alternativas de respuesta. En este caso, debemos crear 3 nuevas variables. Podemos observar, a partir de las correlaciones, que las personas que eligen la opción A tienden a tener puntuaciones altas en el test, lo que nos indica que la opción correcta debe ser la A. Por otra parte, las opciones B y C tienen correlaciones negativas, lo que indica que las personas que eligen esa opción no tienen puntuaciones altas en el test.
Ej.: Análisis estadístico de las opciones de respuesta A continuación se muestra la correlación ítem-test para cada una de las tres alternativas de un ítem. Sabiendo que el comportamiento del ítem es el adecuado, indique cuál es la alternativa correcta.
La opción correcta es la 3, ya que la correlación tiene signo positivo.
Ej.: Análisis estadístico de las opciones de respuesta En el ítem 1 las respuestas correctas y las incorrectas funcionan bien: la correcta es la más elegida, pero los distractores también son elegidos. En el ítem 2 hay un distractor que ha sido más elegido que la respuesta correcta. Por tanto, el ítem es sospechoso. En el ítem 3 la opción correcta es claramente la más elegida, pero los distractores son malos, pues hay uno que nadie elige y otro que es elegido por una persona. Este ítem está funcionando como uno de 3 opciones de respuesta en vez de 5.
Ej.: Sea un ítem con 4 opciones de respuesta. La opción correcta es la C.
a) Responden 400 personas que no saben nada  A: 100 | B: 100 | C: 100 | D: 100 Como no saben nada, todos responden al azar. Incluso en el peor de los casos, la alternativa correcta no será la menos elegida, sino elegida por igual que los distractores.
b) Responden 400 personas que saben la respuesta correcta  A: 0 | B: 0 | C: 400 | D: 0 c) Responden 400 personas y la mitad sabe la correcta  A: 50 | B: 50 | C: 250 | D: 50 Si la mitad de la muestra sabe la respuesta correcta, de los 200 que no saben se reparten las respuestas. Por tanto, la opción correcta recibiría, aproximadamente, 200 + 50 respuestas.
...

Tags:
Comprar Previsualizar