Tema 7. Inventarios, escalas y cuestionarios (2016)

Apunte Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Psicología - 2º curso
Asignatura Avaluació Psicològica
Año del apunte 2016
Páginas 11
Fecha de subida 05/04/2016
Descargas 17
Subido por

Vista previa del texto

TEMA 7: Inventarios, escalas y cuestionarios 1. INTRODUCCION Y DEFINICIÓN DE TÉRMINOS Cuando hablamos de cuestionarios, inventarios y escalas hacemos referencia a un amplio y heterogéneo grupo de técnicas, que son sin duda los más utilizados e importantes en EP.
Son, además, los procedimientos de recogida más antiguos y simples. En general, son términos referidos a protocolos estructurados presentados de forma impresa.
Autoinforme: mensaje verbal que un sujeto emite sobre cualquier tipo de manifestación propia. Nos referimos a que se harán en papel.
Cuestionarios: autoinforme que conllevan respuestas dicotómicas (si/no, verdadero/falso) Escalas: conjunto de preguntas con respuesta de forma escalar (de 0 a 5 cuando es escala numérica, o cuando es escala adjetivada, “nada”, “algo”, “bastante”, “mucho”): ver hasta qué punto una determinada característica es aplicable al sujeto; y ordinal (pedir al sujeto que asigne un orden de preferencia a tres o más elementos según el grado en el que le son aplicables o los prefiere). Ejemplo: inventario de preferencias vocacionales de Kuder.
Inventario: son listados de problemas o síntomas que pueden tener formato de respuesta dicotómica o escalar-ordinal.
Cuando cuestionarios, inventarios y escalas han sido aplicados a amplios grupos de personas y se han obtenido baremos normativos estamos delante un test.
Un autoinforme es por tanto cualquiera de estas formas, o combinación de ellas con información referida a uno mismo. Puede ser considerado como una derivación de la autoobservación y se refiere a la información verbal que un individuo proporciona sobre sí mismo o sobre su comportamiento.
2. VENTAJAS Y LIMITACIONES DE LA TÉCNICA 2.1 Ventajas  Es una técnica válida para recoger información sobre tres modalidades de respuesta (cognitivo, conductual i fisiológico).
 Se considera un método directo de recogida de información sobre las respuestas cognitivas y la experiencia subjetiva, ya que no puede ser contrastada mediante ningún otro método.
 Refleja una visión subjetiva.
 Permite recoger información sobre las situaciones en que se da la conducta.
 Ayudan a ampliar y contrastar la información obtenida por otros medios como la entrevista.
 Proporcionan información cuantitativa que permite valorar la evolución del cliente a lo largo del proceso de intervención.
 Tiene bajo coste: elevada razón coste-eficacia aportando gran cantidad de información en un tiempo mínimo.
 Es de fácil aplicación (des de un punto de vista del evaluador, sencillos de administrar).
 Sencilla interpretación.
 Tiene validez aparente, tiene credibilidad.
 Alta capacidad predictiva, sirven bastante para predecir.
 Son insustituibles a la hora de realizar una primera especificación del problema.
 Son imprescindibles a la hora de evaluar tanto conductas problema cognitivas como repertorios básicos de conducta que pudiera ser responsables del comportamiento problemático.
 Útiles a la hora de recoger una primera información sobre posibles estímulos ambientales funcionalmente relacionados con las conductas problema los cuales más tarde, habrán de ser verificados por medio de otro procedimientos más finos.
2.2 Limitaciones  No se refieren a conductas particulares, son estandarizados.
 Es de difícil aplicación (desde el punto de vista del evaluado).
 Se pueden dar distorsiones en las respuestas.
 En muchos casos, los estudios de sus cualidades psicométricas (F y V) son insuficientes.
 Los datos normativos provienen con frecuencia de muestras pequeñas y en muchos casos extranjeros.
 Para muchos cuestionarios existen datos de muestras clínicos o de la población general, pero no de ambas.
 Distorsiones de respuestas (sesgos típicos de los autoinformes) 3. DIFICULTADES DE MEDICIÓN CON LOS INVENTARIOS, CUESTIONARIOS Y ESCALAS 3.1 Estudio de la validez El estudio de la validez se ha convertido en el concepto central de los criterios de calidad métrica. Hace referencia a la comprobación empírica de que un instrumento mide lo que pretende medir.
Debido a la heterogeneidad de las técnicas es difícil criticarlos o defenderlos de manera global, ya que junto a instrumentos altamente fiables, válidos y útiles existen otros que no presentan ninguna de estas características.
Fdez-Ballesteros (1991) establece unos parámetros para guiar la calidad del autoinforme:  Contrastabilidad (con otros métodos)  Accesibilidad a la información solicitada (el sujeto es consciente)  Transformación existente entre el evento ocurrido y la información sobre él  Tiempo transcurrido entre la ocurrencia del evento y el momento en que se informa (cuanto más lejano, peor recordamos)  Situación estimular a la que se responde  Inferencias realizadas sobre el autoinforme Según esto, cuanto más contrastable y más accesible sea la información solicitada y cuanto menos tiempo transcurra desde lo informado, menos transformaciones u operaciones cognitivas requiera y menores sean las interferencias realizadas sobre esta información, mayor será la calidad del autoinforme.
3.2 Distorsiones de respuesta Éstas, afectan al resultado del autoinforme con independencia de su contenido. Las más comunes son: simulación o falseamiento, deseabilidad social y las tendencias de respuesta.
Simulación o falseamiento: el sujeto, voluntariamente, pretende falsear sus respuestas y con ello el resultado del autoinforme. Para tratar de minimizar su efecto hay 2 estrategias: - Empleo de instrucciones que persuadan al sujeto sobre la necesidad o conveniencia de no mentir o simular sus respuestas - La inclusión de escalas de sinceridad (o de mentiras) que permitan detectar los casos de falseamiento.
Se denomina escala de sinceridad cuando el resultado nos indica el grado de veracidad con que ha respondido y de mentiras cuando la puntuación refleja el grado de falseamiento. La mayor parte de ellas están referidas a ítems de transgresiones de normas o ligeras faltas que con frecuencia se dan en gran parte de la población.
Como norma general, podemos esperar un mayor grado de falseamiento en los contextos en que el individuo espera conseguir algo (ej: empleo) que no en la cínica, donde el beneficio viene derivado de la propia exactitud de las respuestas.
Deseabilidad social: el sujeto, de forma involuntaria en muchos casos, da respuestas sobre sí mismo consonantes con una imagen socialmente aceptable o deseable. En algunos cuestionarios también se incluyen escalas que miden este sesgo.
Tendencias de respuesta: el sujeto responde, de forma relativamente estable, en función del tipo de respuesta exigido y no del contenido de los ítems, como sería esperable. Va siguiendo el mismo criterio de respuesta todo el autoinforme independientemente del contenido. Este error se ve tanto en los dicotómicos como en los que se utiliza escalas de 3 o más alternativas:  Adquiescencia o asentimiento: tendencia a responder sí o verdadero en los autoinformes de 2 alternativas, sin tener en cuenta el contenido de la pregunta. Aunque también puede darse la tendencia contraria “no”. En algunos casos se ha intentado controlar este sesgo modificando la formulación de las preguntas (invirtiendo su significación o formulándola negativamente).
 Errores escalares: en autoinformes que utilizan escalas discretas de 3 o más alternativas. Incluyen la tendencia a responder en los extremos (severidad), con independencia del contenido de los ítems, y de forma involuntaria, y la tendencia a responder en el centro (tendencia central).
Existen procedimientos estadísticos para el análisis y/o control de estas tendencias de respuesta, pero se implementan en muy pocas ocasiones.
A pesar de ello, se muestran actualmente como instrumentos de gran validez y alta capacidad de predicción.
4. COMO SE CONSTRUYEN LOS CUESTIONARIOS, INVENTARIOS Y ESCALAS 3 estrategias: 1. Estrategia racional: coger manuales de psicopatología para poder detectar los síntomas, mirar artículos publicados, para entre todo pensar cuales son los ítems que pueden ser más adecuados. Los cuestionarios elaborados de esta forma, están formados por elementos, o ítems, seleccionados por el evaluador en función del interés de su contenido para medir la variable deseada. Generalmente su selección obedece a un modelo teórico como punto de partida. Este tipo de estrategia ha sido adoptada principalmente por el enfoque conductual.
2. Estrategia empírica: práctico, ir por centros de atención primaria por ejemplo i diagnosticar lo que tienen en común las personas que padecen por ejemplo ansiedad.
Contienen elementos que han mostrado su capacidad para discriminar entre distintos grupos de sujetos. De esta manera los ítems elaborados para medir una determinada variable son sometidos a pruebas de contraste entre distintos grupos que manifiestan esa variable en distintos grados (ejemplo. Se comparan sujetos normales con depresivos para elaborar un cuestionario que mida depresión) 3. Estrategia factorial: tras someter los datos a un análisis factorial, se seleccionan los ítems o elementos que obtienen mejores pesos factoriales en los distintos factores encontrados, realizando así una validación teórica del constructo estudiado.
La combinación de las distintas estrategias puede dotar a los instrumentos resultantes de mayor calidad, siendo ésta la tendencia que puede observarse en la construcción de cuestionarios de nueva generación.
5. USO DE INVENTARIOS, ESCALAS Y CUESTIONARIOS Su uso varía en función de la fase del proceso de evaluación: 5.1 Primeras fases del proceso EP: identificación y selección de problemas Cribado o pruebas de screening Son instrumentos que se utilizan en las primeras fases del procesos de evaluación. Las pruebas de cribado no sirven para hacer diagnósticos. Estas pruebas sirven para detectar o descartar (selección en poblaciones) problemas. Estas pruebas aportan un punto de corte, que es un valor a partir del cual un sujeto pasa o no pasa a un grupo. Este punto de corte lo decide el autor.
Sensibilidad y especificidad: para que tuvieran una alta garantía métrica deberían tener una alta sensibilidad y una alta especificidad, para que no hubiera ni falsos positivos ni falsos negativos. Las pruebas de cribado deben ser más sensibles que específicas: nos interesa más detectar todos los casos positivos.
También se usan para hacer prevención secundaria, es decir, para detectar el problema cuando ya está presente (cogerlo a tiempo) Estas pruebas son de fácil administración, tienen aceptabilidad y validez aparente. Son pruebas muy precisas que disponen de una alta concordancia interjueces.
Ejemplos: BDI y EAT BDI, inventario de Depresión de Beck.
Punto de corte está en 19. Es decir Normales (0-9), Depre leve (10-18), depre moderada (19-29), depre fuerte (+29).
- Construcción racional - Calidad métrica ampliamente contrastada.
- Indicación clínica: detección y cuantificación del síndrome depresivo.
o P/c previamente diagnosticados.
o Selección de sujetos para investigación o Medida de cambio terapéutico.
EAT, eating, attitude test de Toro 40 ítems con 5 opciones de respuesta (nunca, siempre, escala de frecuencia).
3 escalas: miedo a ganar peso, restricción alimentario, impulso a adelgazar.
Útil para detectar problemas alimentarios en población no clínica i sensible al cambio como resultado del tratamiento. Punto de corte = 20 Hay ítems redactados en función de la patología y otros invertidos para anular las tendencias de respuestas. Hay ítems que se pueden contestar igual que si tuviera patología pero no necesariamente tiene que existir ésta. Ejemplo: Preparo comidas para otros pero no me las como no tiene por qué implicar patología.
Construcción empírica i racional.
Identificación de problemas SCL-90: Es un inventario de 90 ítems que valora estado psicológico actual en adultos.
Hace referencia a los últimos 7 días, cada ítem está graduado en una escala de 0 a 4 (nada/mucho) i ítems agrupados en 9.
Construida racional i empíricamente.
La media es de 50, la desviación de 10: dispone de notas T para interpretar. Se consideran como problemáticas las puntuaciones mayores a 70 en el rango clínico i mayores de 60 en el rango subclínico i son sensibles al cambio.
AI inventario de asertividad Mide asertividad. Son 40 ítems. Para cada ítem o actividad la persona debe indicar el grado de inquietud o ansiedad (1-5) y la probabilidad (1-59) de hacer o llevar a cabo la conducta asertiva si se encontraran en la situación. Además el cliente indica las situaciones en que querría actuar más asertivamente.
Puede ser complejo de contestar y correlaciona fuertemente con la deseabilidad social.
 Corrección: grado de inquietud: se suman la PT de la inquietud dad a los distintos ítems Probabilidad de respuesta: se suma la PT de la probabilidad de repuesta dadas a los distintos ítems. Una PT alta indica una baja probabilidad de respuesta.
CBCL Sirve para avaluar y/o detectar problemas en población infantil. Construido de manera empírica. Diferentes instrumentos que sigue un enfoque multifuente. Abarca diferentes rangos de edad: de 1 a 5, 6 a 18, 18 a 59. Son inventarios porque son listados de síntomas.
Se pide a los sujetos que informan sobre los últimos 6 meses, contestando a los ítems 0 falso o raramente 1 en parte o algunas veces 2 casi siempre.
Dimensiones de trastornos interiorizados (retraimiento, síntomas somáticos ansiedad) mixto (problemas sociales, de pensamiento, atención) exteriorización (conducta delictiva i agresiva).
 TRS exteriores: trastornos de comportamiento en los que los problemas se dirigen a otras personas  TRS interiores: los trastornos de comportamiento se dirigen a uno mismo.
5.2 Diseño del tratamiento Comprensión de factores controladores (ISRA) Adecuación y selección de enfoques de intervención Ante la intervención debemos ver cuáles son las motivaciones del sujeto al cambio. La situación idílica de evaluación es la siguiente: la persona sabe qué le pasa, sabe qué consecuencias comporta eso e intenta cambiarlo. Es importante saber cuáles son las motivaciones del sujeto, qué es lo que le motiva a cambio. Esto es especialmente importante en niños y adolescentes, porqué muchos no tienen conciencia de problema e incluso no quieren cambiar su conducta.
 Listado de refuerzos: son instrumentos para recoger qué motivaciones tiene el sujeto (bebidas, juegos, música…). Está pensado sobre todo para niños. También se usan para manejar “contratos familiares”.
Medidas del cambio Para ver la medida del cambio lo más común es volver a aplicar el test que se ha aplicado en la fase de evaluación después de la intervención y ver la diferencia (retest). No sólo se hace con sujetos individuales, también con programas sociales. En todos los casos, hay que ver si el tratamiento ha sido eficaz. Se mide si el cambio es significativo o no (refiriéndonos a significación clínica, no estadística).
No sólo nos interesa medir el cambio en las conductas objetivo, sino también si se produce mejora en otros aspectos de la vida del paciente.
Elegiremos instrumentos sensibles al cambio.
Jacobson y Truax (1991) consideran que existe mejora cuando una puntuación postratamiento pertenece al rango de la población funcional. Es decir, se refiere a pasar de tener una puntuación clínica a una puntuación normal. Para esto es necesario tener baremos de poblaciones clínicas y de poblaciones normales. Hay que tener en cuenta el efecto que muestra.
6. RECOMENDACIONES DE USO En definitiva, hemos visto que los autoinformes implican el método de recogida de información más utilizado en EP, pero que por otra parte, cuentan con específicas fuentes de error, por ello, para usar los diferentes inventarios, escalas y cuestionarios con garantías debemos esperar que cumplan los siguientes requisitos. Serán tanto más veraces cuantos más aspectos cumplan:  Enfoque multifuente: esto se refiere a que recogen informaciones de diversos informantes, de manera que se puedan encontrar diferencias y similitudes sobre las apreciaciones subjetivas que tiene el sujeto respecto a lo que piensan los que le rodean.
 Enfoque idiográfico: los cuestionarios a utilizar deben ser los adecuados para ese caso, no hacer una aplicación estándar. A veces se utilizan cuestionarios específicos o hechos ad hoc para el cliente.
 Evaluaciones orientadas a la modificación: los cuestionario utilizados deben ayudar en el proceso de toma de decisiones de cara al diseño de la intervención y deben ayudar a valorar el cambio que se produzca durante la misma.
 Calidad métrica:  Fiabilidad y validez  Validez de contenido: los cuestionaros poco específicos o que evalúan áreas demasiado amplias no son recomendables.
 Validez de criterio: considerar la relación entre la información que proporcionan y las conductas emitidas en la vida real. Contrastar siempre que sea posible con otros métodos.
 Baremos: existencia de normas (ej. Baremos). Utilizar las puntuaciones de las subescalas además de las puntuaciones totales o resumen. Baremos múltiples: tienen que estar baremados con los grupos de población general y también con los grupos de personas que tienen el trastorno que pretendemos medir.
 Terminología sencilla y específica  Ítems cuantificables y poco ambiguos  Mayor calidad si:  Información más contrastable (con otros métodos)  Información más accesible (el sujeto es consciente de esta información, p. ej no es consciente de la conductancia de la piel)  Cuanto más lejana es la información peor la recordamos, aunque damos más importancia a sucesos graves pasados que a sucesos no graves más recientes.
 Menor transformación de la información y menos inferencias.
...