Tema 5.- Condicionamiento instrumental (2016)

Apunte Español
Universidad Universidad de Barcelona (UB)
Grado Psicología - 1º curso
Asignatura Aprenentatge, Motivació i Emoció (AME)
Año del apunte 2016
Páginas 8
Fecha de subida 28/04/2016
Descargas 38
Subido por

Vista previa del texto

TEMA  5  -­‐    CONDICIONAMIENTO  INSTRUMENTAL     1.-­‐  Orígenes:  Thorndike  y  Skinner   THORNDIKE   Thorndike  registraba  la  latencia  de  escape  en  la  caja  problema.     LEY   DEL   EFECTO   DE   THORNDIKE:   “De   varias   respuestas   en   una   misma   situación,   aquellas   acompañadas   o   seguidas   de   cerca   (estando   lo   demás   igual)   por   la   satisfacción   animal,   se   conectarán   firmemente   con   la   situación,   de   forma   que,   cuando   la   situación   se   repita   tendrán   más   posibilidades   de   producirse;   Aquellas   respuestas   acompañadas   o   seguidas   de   cerca,   estando   lo   demás   igual,   por   la   incomodidad   del   animal,   debilitarán   sus   conexiones   con   la   situación,   de   forma   que,   cuando   la   situación   se   repita,   tendrán   menos   posibilidades   de   ocurrir.   Cuanto   más   grande   sea   la   satisfacción   o   incomodidad,   más   grande   será   el   fortalecimiento  o  debilitamiento  de  la  conexión”.     Elementos  del  Condicionamiento  Instrumental:   § § § E:   (ED:   estímulo   discriminativo).   El   contexto   (el   aparato   experimental,   o   cualquier   estímulo   discreto:  por  ejemplo,  una  luz)  presente  cuando  se  obtiene  la  consecuencia.     R:  respuesta   C:  consecuencia   Para  Thorndike,  la  asociación  es  EàR     2.-­‐  Situaciones  experimentales  CI   Hay  diferentes  tipos  de  situaciones  experimentales  de  condicionamiento  instrumental:     a. Situaciones  experimentales  de  ensayos  discretos   Con  el  tiempo  se  desarrollan  aparatos  más  estandarizados  que  las  cajas  de  Thorndike,  y  los  llamamos  “de   ensayos  discretos”  porque  sólo  se  permite  una  respuesta  por  ensayo  (un  ensayo  consiste  en  introducir  el   animal  en  un  aparato  y  una  vez  realiza  la  respuesta  instrumental  se  retira).   En   función   de   la   situación   experimental   se   mide   la   latencia   de   respuesta,   el   porcentaje   de   respuestas   correctas,  el  tiempo  en  alcanzar  la  meta,  la  velocidad  de  carrera,  etc.   § § Corredor  recto:  se  registra  el  tiempo,  o  la  velocidad,  que  el  animal  emplea  en  recorrer  el  corredor.   Laberinto  en  T:   en   el   punto   de   decisión   debe   elegir   entre   girar   a   la   derecha   o   izquierda.   Se   registra   el  porcentaje  de  elecciones  correctas.               CORREDOR  RECTO     LABERINTO  EN  T     b. Situaciones  experimentales  de  operante  libre   Su  característica  principal  es  que  se  puede  realizar  la  conducta  instrumental  tantas  veces  como  se  quiera.   Se  mide  la  tasa  de  respuesta,  es  decir,  la  frecuencia  de  respuesta  durante  un  tiempo  determinado.   § SKINNER  à  CONDUCTA   OPERANTE:   operaciones,  maniobras  del  sujeto  sobre  el  entorno.  Se  entiende   la  conducta  como  un  instrumento,  como  una  herramienta  para  alcanzar  objetivos.     REGISTRO  DE  LA  CONDUCTA  EN  SITUACIONES  DE  OPERANTE  LIBRE  à  registro  acumulativo:  registro   continuo  donde  para  cada  respuesta  que  emite  el  sujeto  el  registro  se  desplaza  hacia  arriba.       La   pendiente   de   la   respuesta   acumulada   indica   la   frecuencia   o   tasa   de   la   respuesta.   Entre   A   y   B   el   sujeto   no   emite   respuesa   (línea   plana).   Entre   los   puntos   B   y   C   se   muestra   una   tasa   relativa   de   respuesta.  Entre  C  y  D  se  observa  un  incremento  de   la  tasa  de  respuesta.           3.-­‐  Procedimientos  CI  y  Programas  de  reforzamiento     PROCEDIMENTOS  CONDICIONAMIENTO  INSTRUMENTAL     Contingencia  positiva   Contingencia  negativa   Estímulo  apetitivo   Reforzamiento  positivo   Castigo  negativo  (entrenamiento   por  omisión)   Estímulo  aversivo   Castigo  positivo   Reforzamiento  negativo   (evitación,  escapada)     A. Elementos       − Estímulo  apetitivo:  estímulo  agradable,  que  produce  consecuencias  agradables  en  el  sujeto   − Estímulo  aversivo:  estímulo  desagradable,  que  produce  consecuencias  desagradables  en  el  sujeto.   − Contingencia   positiva:   conducta-­‐estímulo:   la   ejecución   de   la   conducta   provoca   que   aparezca   el   estímulo  (o  al  menos  aumenta  la  probabilidad  de  que  aparezca).   − Contingencia  negativa:  conducta-­‐estímulo:  la  ejecución  de  la  conducta  provoca  que  desaparezca  el   estímulo  (o  al  menos  disminuye  la  probabilidad  de  que  aparezca).     B. Tipos  de  procedimiento     o Reforzamiento   positivo:   la   ejecución   de   la   respuesta   instrumental   conlleva   la   aparición   de   un   estímulo  agradable.   La   correlación   positiva   entre   la   respuesta   y   el   estímulo   apetitivo   aumenta   la   probabilidad   de   la   respuesta.     o o o Castigo   positivo:   la   ejecución   de   la   respuesta   instrumental   conlleva   la   aparición   de   un   estímulo   desagradable.   la  correlación  positiva  entre  respuesta  y  estímulo  aversivo  disminuye  la  probabilidad  de  aparición   de  la  respuesta.     Castigo   negativo:  la  ejecución  de  la  respuesta  instrumental  conlleva  la  desaparición  de  un  estímulo   agradable.   La  correlación  negativa  entre  respuesta  y  estímulo  apetitivo  disminuye  la  probabilidad  de  aparición   de  la  respuesta.     Reforzamiento   negativo:   la   ejecución   de   la   respuesta   conlleva   la   desaparición   (escape)   o   impide   que  aparezca  (evitación),  un  estímulo  desagradable.   La   correlación   negativa   entre   respuesta   y   estímulo   aversivo   aumenta   la   probabilidad   de   la   respuesta.   Pero  en  las  situaciones  de  evitación,  el  animal  realiza  la  conducta  antes  de  que  el  estímulo  aversivo   haya  aparecido.  Esto  se  explica  por  la  Teoría  de  los  dos  procesos  (Mowrer,  1942):  CC  +  CI     • EI  (descarga)  provoca  RI  (miedo)   • EC  (señal  de  aviso)  asociada  al  EI  (descarga)  también  termina  generando  RC  (miedo)   • La   evitación   entendida   como   una   conducta   de   escape   del   estímulo   aversivo   (miedo)   que   ya   está  presente  debido  al  EC.   • Los  ensayos  en  los  que  se  realiza  la  conducta  de  evitación  de  la  descarga  se  entienden  en   términos  de  escape  del  miedo  más  que  de  evitación  de  la  descarga  posterior.     Diferencias  entre  condicionamiento  clásico  e  instrumental:   § § En   el   condicionamiento   clásico,   los   acontecimientos   que   quedan   asociados   son   dos   estímulos   que   el   organismo  no  puede  manipular.     En   el   condicionamiento   instrumental,   hablamos   de   conductas   voluntarias   del   organismo   que   tienen   como  objetivo  cambiar  el  entorno  (conductas  dirigidas  a  una  meta).     MOLDEAMIENTO:   procedimiento   para   instaurar   una   conducta   nueva,   que   no   existe   en   el   repertorio   conductual  del  animal.   Por  ejemplo:  presión  de  palanca  de  una  rata  en  la  caja  de  Skinner.     No   le   enseñamos   componentes   nuevos   de   la   conducta,   sino   una   forma   concreta   de   combinar   estos   componentes.     − − − Es  necesario  detallar  los  componentes  de  la  conducta  final  que  deseamos   Posteriormente,  se  refuerzan  los  componentes  más  sencillos  y  con  más  probabilidad  de  aparecer   espontáneamente.   Cuando  un  componente  de  la  conducta  ya  aparece  con  una  alta  frecuencia,  se   deja   reforzar   y   se   pasa  a  reforzar  el  componente  siguiente.     PROGRAMAS  DE  REFORZAMIENTO  POSITIVO   Tenemos   2   variedades   de   programas   de   reforzamiento   positivo:   los   programas   de   reformamiento   continuo     y   los   intermitentes   o   de   reforzamiento   parcial   (donde   no   todas   las   respuestas   instrumentales   son   reforzadas).   A. PROGRAMAS  DE  REFORZAMIENTO  CONTINUO       B. PROGRAMAS  INTERMITENTES  O  DE  REFORZAMIENTO  PARCIAL         1. De  RAZÓN     Se  obtiene  el  reforzador  con  esfuerzo     Después  de  emitir  un  número  FIJO  de  respuestas:   − Programa  de  razón  fija:  p.ej:  RF-­‐10  (cada  10  respuestas,  reforzador)   Un  ejemplo  se  da  cuando  las  fábricas  pagan  a  sus  obreros  después  de  producir  un  determinado   número  de  productos  (“trabajo  a  destajo”)     Después  de  emitir  un  número  VARIABLE  de  respuestas:   Programa  de  razón  variable:  p.ej:  RV-­‐10  (10  respuestas  promedio  para  obtener  el  reforzador).   Un  ejemplo  con  el  juego  del  golf:  hay  que  golpear  la  bola  un  número  diferente  de  veces  para   hacer  un  hoyo.                     2. De  INTERVALO   − Transcurrido  un  tiempo  de  restricción  se  obtiene  el  reforzador  cuando  se  ejecuta  la  respuesta:   Tras  una  cantidade  de  tiempo  FIJA:   − Programa   de   intervalo   fijo:   p.ej:   IF-­‐10   (cada   10   segundos   puede   conseguir   el   reforzador,   siempre  que  dé  la  respuesta).   Un   ejemplo   seria   un   padre   que   comprueba   cada   media   hora   que   su   hijo   está   estudiando   y   cuando  es  así  le  hace  un  halago.       Tras  una  cantidad  de  tiempo  variable:     − Programa  de  intervalo  variable:   p.ej:  IV-­‐10  (cada  10  segundos  de  promedio  puede  conseguir  el   reforzador,  siempre  que  dé  la  respuesta).   Un   ejemplo   seria   estar   llamando   a   un   amigo   por   teléfono   sin   que   nos   conteste   porque   comunica.               Conclusión:                                     4.-­‐  Variables  CI:  Respuesta  –  Reforzador   El  reforzador  instrumental   Hutt  (1954)  demostró  que  la  cantidad  y  naturaleza  del  reforzador  influyen  en  la  tasa  de  respuesta.                     Cambios  de  reforzador   Los   efectos   del   contraste   señalan   que   la   efectividad   de   un   reforzador   está   determinada,   al   menos   en   parte,   por   las   expectativas   de   los   individuos   en   base   a   sus  experiencias  previas.   El   efecto   en   el   primer   grupo   (4-­‐16),   en   comparación  con  el  grupo  control  (16-­‐16)   se  denomina  contraste  positivo.   El   efecto   del   tercer   grupo   (64-­‐16),   en   comparación  con  el  grupo  control  (16-­‐16)   se  denomina  contraste  negativo.       Relevancia  o  pertinencia  Respuesta-­‐Reforzador   Shettleworth  (1975)  demostró  (con  hamsters)  que  la  privación  de  comida  disminuía  la  frecuencia  de  ciertas   actividades   (autocuidado:   lavarse   la   cara,   rascarse..)   y   aumentaba   las   actividades   preparatorias   relacionadas  con  la  comida  (cavar,  rascar…)   Cuando   un   animal   está   privado   de   comida,   su   sistema   de   respuestas   relacionado   con   la   alimentación   se   activa.     Son   estas   conductas   las   que   serán   más   susceptibles   al   condicionamiento   instrumental.   Las   respuestas   relacionadas  (preparatorias)  con  la  obtención  del  reforzador  son  más  fáciles  de  condicionar.     Breland  y  Breland  (1961:   Trataban  de  entrenar  a  mapaches  y  otros  animales  para  realizar  conductas  curiosas  para  zoos  y  parques.   Por  ejemplo:  entrenar  un  mapache  para  meter  una  moneda  en  una  hucha.  Al  principio  lo  aprendía  (aunque   con   dificultades   para   soltarla),   pero   cuando   le   dieron   dos   monedas   y   le   reforzaban   por   meter   ambas,   el   mapache  tenía  muchos  problemas  y  se  quedaba  frotándolas  entre  ellas  cada  vez  más  tiempo.     Concepto  de  deriva  instintiva  à  los  mapaches  frotan  y  lavan  objetos  relacionados  con  el  alimento.       Contigüidad  temporal   La  demora  en  la  administración  del  reforzador  produce  un  deterioro  del  aprendizaje.     El   CI   es   sensible   a   la   demora   debido   a   la   interferencia   de   otras   respuestas.     Dos  formas  de  controlar  la  interferencia:     − − La   utilización   de     reforzadores   secundarios:   en   humanos   à   dinero,   reforzamiento   verbal,   economía   de   fichas…   Señalan   la   demora  del  reforzador  primario.   Un  reforzador  secundario  es  un  estímulo  condicionado  que  ha   sido   previamente   asociado   con   el   reforzador   (se   llama   secundario   ya   que   su   capacidad   de   reforzar   no   es   innata   es   aprendida).   Estos   reforzadores   secundarios   actúan   como   puente  entre  la  respuesta  y  el  reforzador  primario.       Economia   de   fichas:   reforzadores   secundarios   =   fichas,   puntos,   garbanzos…   //   reforzadores   primarios:  un  juguete,  tiempo  de  juego  o  ocio,  comida  favorita,  etc.       El  procedimiento  de  marcado:  mantiene  la  atención  del  sujeto  sobre  la  respuesta  precedente.       Hipótesis   del   marcado:   consiste   en   marcar   la   respuesta   instrumental   criterio   para   hacerla   distinguible  de  otras  actividades  del  organismo.     Se  demostró  por  primera  vez  por  Lieberman,  McIntosh  y  Thomas.  En  el  experimento  la  respuesta   de  elección  señalada  por  un  estímulo  (manipulación)  en  el  grupo  experimental.       Los   sujetos   del   grupo   “marcado”   aprendieron   la   R   mucho   mejor   que   los   sujetos   del   grupo   no   marcado  (demora  de  60’’).   Resultado   de   los   experimentos   de   Lieberman,   McIntosh   y   Thomas:   los   efectos   de   marcar   una   respuesta  no  pueden  explicarse  en  términos  de  reforzamiento  secundario  porque  el  estímulo  de   marcado  se  presenta  tanto  despyés  de  las  respuestas  correctas  como  de  las  incorrectas.       Si   dentro   de   un   conjunto   de   sucesos   hay   uno   más   distintivo   con   respecto   a   los   demás,   el   sujeto   atenderá  más  al  suceso  que  es  distintivo  y  esta  atención  extra  resultará  en  una  huella  de  memoria   más  sólida  y  por  tanto  más  fácil  de  recordar.   En   el   presente   caso,   debido   a   que   las   ratas   siempre   se   les   presentaba   un   estímulo   saliente   justo   después   de   la   respuesta   de   elección,   esta   experiencia   “marcaba”   la   respuesta   de   elección   haciéndola  más  fácil  de  recordar  cuando  los  sujetos  recibían  posteriormente  un  reforzador.       5.-­‐  La  estructura  asociativa  del  CI   Asociaciones  Ed-­‐R,  Ed-­‐C,  R-­‐C             Asociaciones  jerárquicas:  Ed  (RàC)   Ed   activa   la   expectativa   de   refuerzo:   Expectativa   que   activa   asociaciones   R-­‐C   aprendidas;   se   realiza   la   respuesta  posible.             6.-­‐  Extinción  en  CC  y  en  CI   Tan   importante   como   adquirir   asociaciones   nuevas,   es   que   seamos   capaces   de   eliminarlas   cuando   ya   no   son  necesarias.   En   el   condicionamiento   clásico,   si   el   EC   se   presenta   repetidamente   sin   el   EI   la   respuesta   condicionada   va   disminuyendo.     En  el  condicionamiento  instrumental,  si  la  conducta  instrumental  deja  de  servir  para  alterar  el  ambiente  (se   rompe  la  relación  de  contingencia),  irá  desapariciendo.         Efectos  paradójicos  de  la  recompensa   Efecto   del   sobre-­‐entrenamiento   en   la   extinción  (una  fase  de  entrenamiento  de  reforzamiento  más  larga   produce  una  extinción  posterior  más  rápida).   Efecto   de   la   magnitud   del   reforzamiento   en   la   extinción   (una   respuesta   que   se   ha   reforzado   con   un   reforzador  de  más  magnitud  se  extingue  más  rápido).   Efecto   de   reforzamiento   parcial   en   la   extinción   (las   respuestas   reforzadas   bajo   programas   de   reforzamiento   continuo   se   extinguen   más   rápido   que   las   reforzadas   bajo   programas   de   reforzamiento   parcial).   Si  asumimos  que  el  desempeño  en  la  extinción  se  debe  en  parte  a  la  frustración  que  produce  la  ausencia   inesperada   del   reforzador,   entonces   se   explica   que   en   las   situaciones   en   las   que   se   ha   generado   mayor   expectativa  de  recompensa  generen  una  frustración  mayor.     Aunque   la   extinción   provoca   cambio   de   conducta   y   emocionales,   que   la   respuesta   desaparezca   no   significa   que  hayamos  “borrado”  el  aprendizaje  previo.   Muchos  hallazgos  demuestran  que  la  extinción  no  es  un  borrado  del  aprendizaje  anterior  (demostraciones   tanto   en   condicionamiento   clásico   como   en   condicionamiento   instrumental):   recuperación   espontánea,   renovación…     Recuperación  espontánea   Una   de   las   características   de   la   extinción   es   que   se   disipa   con   el   tiempo   (consecuencia:   la   RC   en   condicionamiento  clásico  y  la  RI  en  condicionamiento  instrumental  reaparece).   Con   Sniffy,   después   de   un   periodo   de   tiempo   sin   estar   expuesta   al   EC   extinguido,   cuando   se   presentaba   de   nuevo  el  EC  se  veía  que  la  respuesta  condicionada  reaparecía.       Renovación   Recuperación  de  la  respuesta  extinguida  que  se  da  cuando  se  camvian  las  claves  del  contexto  que  estaban   presentes   durante   la   extinción   (consecuencia:   la   RC   en   condicionamiento   clásico   y   la   RI   en   condicionamiento  instrumental  reaparece).     ...