La Señal de Recompensa de las Neuronas Dopaminérgicas del Cerebro Medio

Cuando los organismos multicelulares surgieron a través de la evolución de moléculas auto-reproducibles, desarrollaron mecanismos autorreguladores endógenos que aseguraron que sus necesidades de bienestar y supervivencia fueran satisfechas. Los sujetos se involucran en varias formas de comportamiento de enfoque para obtener recursos para mantener el equilibrio homeostático y reproducirse. Se dice que estos recursos biológicos tienen funciones «gratificantes» porque provocan y refuerzan el comportamiento de aproximación. Aunque inicialmente se relacionaron con las necesidades biológicas, las recompensas se desarrollaron más durante la evolución de los mamíferos superiores para apoyar formas más sofisticadas de comportamiento individual y social. Las formas superiores de recompensas a menudo se basan en representaciones cognitivas, y se refieren a objetos y construcciones como la novedad, el desafío, la aclamación, el poder, el dinero, el territorio y la seguridad. Así, las necesidades biológicas y cognitivas definen la naturaleza de las recompensas, y la disponibilidad de recompensas determina algunos de los parámetros básicos de las condiciones de vida del sujeto.

Las recompensas tienen tres funciones básicas (1). En primer lugar, provocan un enfoque y un comportamiento consumador y sirven como objetivos de comportamiento voluntario. Al hacerlo, interrumpen el comportamiento en curso y cambian las prioridades de las acciones de comportamiento. En segundo lugar, las recompensas tienen efectos positivos de refuerzo. Aumentan la frecuencia e intensidad del comportamiento que conduce a tales objetos (aprendizaje) y mantienen el comportamiento aprendido al prevenir la extinción. Esta función constituye la esencia de «volver por más» y se relaciona con la noción de recibir recompensas por haber hecho algo útil. El aprendizaje continúa cuando las recompensas ocurren de manera impredecible y se ralentiza a medida que las recompensas se predicen cada vez más (8). Por lo tanto, el aprendizaje impulsado por la recompensa depende de la discrepancia o «error» entre la predicción de la recompensa y su ocurrencia real. En su tercera función, las recompensas inducen sentimientos subjetivos de placer (hedonia) y estados emocionales positivos. Esta función es difícil de investigar en animales.

La reducción de la neurotransmisión de dopamina en pacientes parkinsonianos y animales con lesiones experimentales se asocia con graves déficits de movimiento, motivación, atención y cognición. Un déficit motivacional consistente se refiere al uso de información de recompensa para aprender y mantener el enfoque y el comportamiento consumador (2, 9). Los déficits ocurren principalmente con la destrucción de las proyecciones de las neuronas dopaminérgicas del cerebro medio al núcleo accumbens y, en menor medida, a la corteza frontal y al cuerpo estriado (núcleo caudado y putamen). Estos sistemas también están involucrados en las propiedades adictivas de las principales drogas de abuso, como la cocaína, la anfetamina, la heroína y la nicotina.

Los cuerpos celulares de las neuronas dopaminérgicas del cerebro medio se encuentran en los grupos A8 (sustancia negra dorsal a lateral), A9 (pars compacta de sustancia negra) y A10 (área tegmental ventral medial a sustancia negra). Estas neuronas liberan dopamina con impulsos nerviosos de varices axonales en el cuerpo estriado, el núcleo accumbens y la corteza frontal, por nombrar los sitios más importantes (Fig. 1). Registramos la actividad de impulso de cuerpos celulares de neuronas dopaminérgicas individuales durante períodos de 20-60 min con microelectrodos móviles desde posiciones extracelulares mientras los monos aprenden y realizan tareas de comportamiento. Las neuronas son fácilmente distinguibles de otras neuronas del cerebro medio por sus impulsos polifásicos característicos, relativamente largos, que se descargan a bajas frecuencias.

 FIGURA 1.

FIGURA 1. Visión general de los territorios de proyección de las neuronas dopaminérgicas del cerebro medio. Los cuerpos celulares de las neuronas dopaminérgicas se localizan principalmente en la parte compacta de la sustancia negra y en el área tegmental ventral adyacente medialmente. Sus axones se proyectan principalmente al cuerpo estriado (núcleo caudado, putamen), al cuerpo estriado ventral, incluido el núcleo accumbens, y a la corteza frontal (corteza prefrontal dorsolateral, ventrolateral y orbital). La dopamina se libera de las terminales de los axones con impulsos e influencias de las neuronas en estas estructuras. Nuestros experimentos investigan la actividad de impulso a nivel de los cuerpos celulares de dopamina.

Constantemente no encontramos covariaciones claras con los movimientos. Por el contrario, las neuronas dopaminérgicas muestran activaciones fásicas después de eventos relacionados con la recompensa y ciertos estímulos que inducen la atención de la modalidad somatosensorial, visual y auditiva (5, 10, 12). Estas respuestas ocurren de manera muy similar en el 60-80% de las neuronas de los grupos A8, A9 y A10 en una variedad de situaciones de comportamiento, mientras que las neuronas dopaminérgicas restantes no responden en absoluto. Las situaciones probadas incluyen condicionamiento clásico, varias tareas de tiempo de reacción simples y de elección, tareas directas y retrasadas de ir-no ir, tarea de respuesta retardada espacial, alternancia retrasada espacial, discriminación visual y movimientos autoiniciados. Las neuronas responden ligeramente más en las regiones mediales del mesencéfalo, como el área tegmental ventral y la sustancia negra medial, en comparación con las regiones más laterales, una diferencia que ocasionalmente alcanza significación estadística. Las activaciones ocurren con latencias similares (50-110 ms) y duraciones (<200 ms) después de recompensas de alimentos y líquidos, estímulos condicionados y estímulos que inducen la atención. Por lo tanto, la respuesta de dopamina constituye una señal de población escalar relativamente homogénea que se clasifica por la magnitud de la respuesta de las neuronas individuales y por las fracciones de neuronas que responden.

Las activaciones fásicas ocurren cuando los animales tocan un bocado de comida oculta o cuando se les entregan gotas de líquido a la boca fuera de las tareas de comportamiento o durante el aprendizaje (Fig. 2, arriba). Las neuronas dopaminérgicas distinguen las recompensas de los objetos no devueltos, pero no parecen discriminar entre diferentes objetos alimenticios o recompensas líquidas. Solo unos pocos muestran las activaciones fásicas después de estímulos aversivos primarios, como soplos de aire no tóxicos en la mano o solución salina hipertónica en la boca (7). Estos estímulos son aversivos porque interrumpen el comportamiento e inducen reacciones de evitación activas.

 FIGURA 2.

FIGURA 2. Las neuronas de dopamina reportan recompensas en la medida en que se desvían de la predicción (error en la predicción de la recompensa). Superior: se produce una gota de recompensa líquida (R), aunque no se prevé ninguna recompensa en este momento. La ocurrencia de la recompensa, por lo tanto, constituye un error positivo en la predicción de la recompensa. La neurona dopaminérgica se activa por la aparición imprevista del líquido. Medio: un estímulo aprendido (estímulo condicionado, CS) predice una recompensa, y la recompensa ocurre de acuerdo con la predicción, por lo tanto, no hay error en la predicción de la recompensa. La neurona dopaminérgica no se activa con la recompensa prevista (derecha). También muestra una activación tras el estímulo de predicción de recompensas (izquierda). Inferior: un estímulo condicionado predice una recompensa, pero la recompensa se omite. La actividad de la neurona dopaminérgica se deprime exactamente en el momento en que se habría producido la recompensa. Nótese la depresión que ocurre > 1 s después del estímulo condicionado sin ningún estímulo interviniente, revelando un proceso interno de expectativa de recompensa en un momento preciso. Los puntos en los paneles individuales denotan impulsos neuronales. Cada línea de puntos muestra una prueba, la secuencia original en cada panel es de arriba a abajo. Reimpreso con permiso de la Ref. 11. Copyright (1997) American Association for the Advancement of Science.

La mayoría de las neuronas dopaminérgicas también se activan mediante estímulos visuales y auditivos condicionados que se han convertido en predictores de recompensas válidos a través de emparejamientos repetidos y contingentes con recompensas en procedimientos de condicionamiento operante o clásico (Fig. 2, centro). Por el contrario, solo unas pocas neuronas dopaminérgicas se activan de forma gradual mediante estímulos visuales o auditivos aprendidos en tareas de evitación activa en las que los animales liberan una llave para evitar una bocanada de aire o una gota de solución salina hipertónica.

Simultáneamente con el desarrollo de la respuesta de dopamina a estímulos predictores de recompensa durante el aprendizaje, la respuesta a la recompensa predicha en sí se pierde, como si la respuesta se transfiriera de la recompensa al estímulo predictor de recompensa (Fig. 2, superior frente al medio). Esto se observa cuando las recompensas gratuitas se entregan fuera de las tareas de comportamiento y se predicen mediante estímulos condicionados a través del aprendizaje o cuando las recompensas ocurren sorprendentemente durante las fases de aprendizaje individuales y se predicen cuando una fase se adquiere por completo. Por lo tanto, las recompensas solo son efectivas para activar las neuronas dopaminérgicas cuando no están predichas por estímulos fásicos.

Las neuronas dopaminérgicas tienen una capacidad limitada para discriminar entre estímulos apetitivos y neutros o aversivos. Solo los estímulos que son físicamente suficientemente diferentes son bien discriminados. Los estímulos que no predicen explícitamente recompensas, pero que físicamente se asemejan a estímulos que predicen recompensas, inducen pequeñas activaciones seguidas de depresiones en una fracción limitada de neuronas.

Las neuronas de dopamina se deprimen en el momento habitual de la recompensa cuando una recompensa predicha no ocurre después de un error del animal, retención por parte del experimentador o retraso en el parto (Fig. 2, abajo). La depresión ocurre en ausencia de un estímulo inmediatamente anterior a la recompensa omitida. Esto refleja un proceso de expectativas basado en un reloj interno que se refiere a la hora exacta de la recompensa prevista. Por otro lado, una activación sigue a la recompensa cuando se presenta en un momento diferente al predicho (Fig. 3). Estos datos sugieren que la predicción que influye en las neuronas dopaminérgicas se refiere tanto a la ocurrencia como al momento de la recompensa.

 FIGURA 3.

FIGURA 3. El error de predicción codificado por las neuronas dopaminérgicas incluye aspectos temporales. En la tarea de comportamiento, una imagen a color bien aprendida aparece en un monitor de computadora (CS on), el animal presiona una palanca debajo de la imagen, sobre la cual la acción del CS se apaga y una gota de jugo se entrega poco después en la boca del animal. La actividad se registra desde una sola neurona de dopamina mientras se varía el intervalo de recompensa táctil de la palanca. Aunque la recompensa que ocurre en el momento habitual previsto no provoca una respuesta dopaminérgica (bloque de prueba superior), un retraso repentino de la recompensa de 0,5 s deprime la actividad de la neurona dopaminérgica en el momento original de la recompensa e induce una activación en el nuevo momento (bloque de prueba posterior). Una activación solo se observa cuando la recompensa se produce antes de lo previsto (segundo bloque de prueba desde abajo). La secuencia de prueba original es de arriba a abajo. Reimpreso de la Ref. 4 con permiso de Nature America.

Los estímulos que inducen la atención, como los estímulos novedosos o físicamente intensos no necesariamente relacionados con recompensas, provocan activaciones en las neuronas dopaminérgicas que a menudo van seguidas de depresiones. Las respuestas novedosas desaparecen junto con las reacciones de orientación conductual después de varias repeticiones de estímulos, siendo la duración más larga con estímulos físicamente más sobresalientes. Estímulos intensos, como clics fuertes o imágenes grandes inmediatamente delante de un animal, provocan respuestas fuertes que aún inducen activaciones medibles después de >1000 ensayos. Sin embargo, las respuestas a estímulos nuevos o intensos disminuyen rápidamente durante el acondicionamiento del comportamiento de evitación activa. Estos datos sugieren que las neuronas dopaminérgicas no son impulsadas exclusivamente por estímulos relacionados con la recompensa, sino que también están influenciadas por estímulos que inducen la atención.

En conjunto, la mayoría de las neuronas dopaminérgicas muestran activaciones fásicas después de recompensas por alimentos y líquidos, y después de estímulos condicionados y predicientes de recompensa. Muestran respuestas bifásicas de activación-depresión después de estímulos que se asemejan a estímulos que predicen recompensas o son novedosos o particularmente destacados. Sin embargo, solo unas pocas activaciones fásicas siguen estímulos aversivos. Por lo tanto, las neuronas dopaminérgicas etiquetan los estímulos ambientales con una «etiqueta» apetitiva, predicen y detectan recompensas, y señalan eventos de alerta y motivación.

Todas las respuestas a recompensas y estímulos de predicción de recompensas dependen de la previsibilidad del evento que se refiere al momento preciso de la recompensa. El contexto ambiental más tónico de predicción de recompensas en el que se produce una recompensa no parece influir en las neuronas dopaminérgicas. La respuesta de recompensa de dopamina parece indicar hasta qué punto una recompensa ocurre de manera diferente a lo predicho, lo que se denomina un «error» en la predicción de la recompensa. Por lo tanto, las neuronas de dopamina reportan recompensas en relación con su predicción, en lugar de señalar recompensas incondicionalmente. Parecen ser detectores de características para la bondad de los eventos ambientales en relación con la predicción, activados por eventos gratificantes que son mejores de lo predicho, no influenciados por eventos que son tan buenos como lo predicho y deprimidos por eventos que son peores de lo predicho (Fig. 2). Sin embargo, no discriminan entre diferentes recompensas y, por lo tanto, parecen emitir un mensaje de alerta sobre la sorprendente presencia o ausencia de recompensas sin indicar la naturaleza particular de cada recompensa. Procesan el tiempo y la predicción de las recompensas, pero no la naturaleza de la recompensa en particular.

Uso potencial de la señal de error de predicción de recompensa

La respuesta moderadamente explosiva, de corta duración y casi sincrónica de la mayoría de las neuronas dopaminérgicas conduce a la liberación óptima y simultánea de dopamina de la mayoría de las varices estrechamente espaciadas en el cuerpo estriado y la corteza frontal. El soplo corto de dopamina alcanza rápidamente concentraciones regionalmente homogéneas que probablemente influyan en las dendritas de probablemente todas las neuronas estriadas y muchas neuronas corticales. De esta manera, el mensaje de error de predicción de recompensa en el 60-80% de las neuronas dopaminérgicas se transmite como una señal de refuerzo divergente, bastante global, al cuerpo estriado, el núcleo accumbens y la corteza frontal, influyendo de forma gradual en un número máximo de sinapsis involucradas en el procesamiento de estímulos y acciones que conducen a la recompensa. La reducción de la liberación de dopamina inducida por depresiones con recompensas omitidas reduciría la estimulación tónica de los receptores de dopamina por la dopamina ambiental.

La disposición básica de las influencias sinápticas de las neuronas dopaminérgicas en las neuronas de la corteza estriada y frontal consiste en una tríada que comprende espinas dendríticas, terminales corticales excitatorias en la punta de las espinas dendríticas y várices dopaminérgicas que entran en contacto con las mismas espinas dendríticas (Fig. 4). Cada neurona espinosa estriada de tamaño mediano recibe ~1.000 sinapsis dopaminérgicas en sus espinas dendríticas y ~5.000 sinapsis corticales. Esta disposición permitiría a las neuronas dopaminérgicas influir en los efectos sinápticos de las entradas corticales a las neuronas estriadas. La dopamina liberada puede actuar sobre las neuronas estriadas y corticales de varias maneras posibles. 1) El efecto inmediato puede consistir en un cambio de la neurotransmisión corticoestriatal. Esto modificaría la información que circula en los bucles de ganglios cortico-basales e influiría en las neuronas en las estructuras corticales involucradas en la estructuración de la salida conductual. 2) El curso de tiempo relativamente lento de la acción de la membrana de dopamina puede dejar un breve rastro del evento de recompensa e influir en toda la actividad posterior durante un corto tiempo. 3) La plasticidad potencial dependiente de dopamina en el cuerpo estriado y las formas observadas de respuestas dopaminérgicas pueden inducir cambios plásticos en las sinapsis estriada y cortical activadas simultáneamente por los eventos que conducen a la recompensa.

 FIGURA 4.

FIGURA 4. Diseño básico de la posible influencia de la señal de error de predicción de dopamina en la neurotransmisión en el cuerpo estriado. Las entradas sinápticas de un solo axón X de dopamina y 2 axones corticales A y B entran en contacto con una neurona estriada espinosa típica de tamaño mediano I. La transmisión corticoestriatal puede ser modificada por la entrada de dopamina X que entra en contacto indiscriminadamente con los tallos de las espinas dendríticas que también son contactadas por entradas corticales específicas A y B. En el presente ejemplo, la entrada cortical A, pero no B, está activa al mismo tiempo que la neurona dopaminérgica X (área sombreada), por ejemplo, después de un evento relacionado con la recompensa. Esto podría llevar a una modificación de la transmisión A → I, pero dejar la transmisión B → I inalterada. El dibujo anatómico se basa en datos anatómicos (3) y se modifica de una figura anterior (14).

En un modelo de influencia de la dopamina en la neurotransmisión estriatal, A y B son entradas que entran en contacto por separado con las espinas dendríticas de una neurona estriatal I (Fig. 4). Los pesos sinápticos A → I y B → I son modificables hebbianos a corto o largo plazo. Las mismas espinas son contactadas indiscriminadamente por la señal de error de predicción de recompensa global de la entrada de dopamina X. Tanto la neurona X como la neurona A, pero no la neurona B, se activan cuando se encuentra una señal relacionada con la recompensa. La Neurona X transmite el mensaje de que se ha producido un evento gratificante sin dar detalles específicos, mientras que la neurona A envía un mensaje sobre uno de varios aspectos detallados del evento relacionado con la recompensa, como el color, la textura, la posición, el entorno, etc. del estímulo o puede codificar un movimiento que conduzca a la obtención de la recompensa. Los pesos de las sinapsis estriadas podrían modificarse de acuerdo con la regla de aprendizaje Δω = Δ• r•i•o, donde ω es peso sináptico, ϵ es constante de aprendizaje, r es señal de error de predicción de dopamina, i es activación de entrada y o es activación de la neurona estriada. Por lo tanto, a través de la simultaneidad o casi simultaneidad de la actividad en A y X, la actividad de la neurona X puede inducir un cambio en la neurotransmisión en la sinapsis activa A → I, pero dejar la neurotransmisión inactiva B → I sin cambios. En el caso de cambios duraderos en la transmisión sináptica, la entrada posterior de la neurona A conduciría a una mayor respuesta en la neurona I, mientras que la entrada de la neurona B conduce a una respuesta sin cambios en la neurona I. Por lo tanto, los cambios sinápticos de la neurotransmisión A → I y B → I están condicionados a que la neurona dopaminérgica X esté activa conjuntamente con A o B.

La codificación de respuesta de dopamina un error en la predicción de recompensa se asemeja en todos los aspectos principales a la señal de refuerzo de una clase particularmente efectiva de modelos de refuerzo que incorporan algoritmos de diferencia temporal (6, 13, 15). Se basan en teorías de aprendizaje conductual que asumen que el aprendizaje depende fundamentalmente de la discrepancia o error entre la predicción del refuerzo y su ocurrencia real (1, 8). En estos modelos, un módulo crítico genera una señal de refuerzo global y la envía al módulo actor que aprende y ejecuta la salida de comportamiento. La arquitectura crítico-actor se asemeja mucho a la conectividad de los ganglios basales, incluida la proyección de dopamina al cuerpo estriado y la proyección estriatonigral recíproca. Los modelos que usan algoritmos de diferencia temporal aprenden una amplia variedad de tareas de comportamiento, que van desde balancear un poste en una rueda de carro hasta jugar al backgammon de clase mundial(para referencias, ver Ref. 11). Los robots que usan algoritmos de diferencia temporal aprenden a moverse por el espacio bidimensional y evitar obstáculos, alcanzar y agarrar, o insertar una clavija en un agujero. Los modelos de diferencia temporal de inspiración neurobiológica replican el comportamiento de forrajeo de las abejas, simulan la toma de decisiones humanas y aprenden las reacciones de orientación, los movimientos oculares, los movimientos secuenciales y las tareas de respuesta retardada espacial. Es particularmente interesante ver que las señales de enseñanza que utilizan errores de predicción dan como resultado un aprendizaje más rápido y completo, en comparación con las señales de refuerzo incondicionales.

Conclusiones y extensiones

La investigación de la actividad de las neuronas dopaminérgicas resultó en el sorprendente hallazgo de que estas neuronas no están moduladas en relación con los movimientos, aunque los movimientos son deficientes en pacientes parkinsonianos. Más bien, las neuronas dopaminérgicas codifican de una forma muy especial los aspectos gratificantes de los estímulos ambientales, junto con ciertas características que inducen la atención. Las respuestas son provocadas por recompensas primarias («estímulos incondicionales»), estímulos condicionados que predicen recompensas, estímulos que se asemejan a estímulos relacionados con recompensas y estímulos nuevos o intensos. Sin embargo, los estímulos relacionados con la recompensa solo se reportan cuando ocurren de manera diferente a lo predicho, la predicción relativa tanto a la ocurrencia como al momento del evento. El mensaje de error de predicción es una señal muy poderosa para dirigir el comportamiento e inducir el aprendizaje, de acuerdo con las teorías de aprendizaje animal y los modelos de refuerzo. Sin embargo, la señal de dopamina no especifica exactamente qué recompensa es la que ocurre de manera diferente a la predicha o si realmente es una recompensa o, más bien, un estímulo que predice la recompensa. Estímulos que se asemejan a recompensas y estímulos nuevos o particularmente sobresalientes provocan secuencias de activación-depresión que se asemejan a las activaciones monofásicas provocadas por estímulos relacionados con recompensas impredecibles. Por lo tanto, la señal de dopamina parece ser una señal predominantemente de alerta de recompensa, y otros sistemas cerebrales deben procesar información adicional para aprender reacciones de comportamiento correctas a estímulos ambientales motivadores.

La información sobre alimentos y recompensas de líquidos también se procesa en estructuras cerebrales distintas de las neuronas dopaminérgicas, como el cuerpo estriado dorsal y ventral, el núcleo subtalámico, la amígdala, la corteza prefrontal dorsolateral, la corteza orbitofrontal y la corteza cingulada anterior. Sin embargo, estas estructuras no parecen emitir una señal de error de predicción de recompensa global similar a las neuronas dopaminérgicas. Estas estructuras muestran 1) respuestas transitorias después de la entrega de recompensas, 2) respuestas transitorias a señales de predicción de recompensas, 3) activaciones sostenidas durante la expectativa de recompensas, y 4) modulaciones de la actividad relacionada con el comportamiento por recompensas predichas (para referencias, ver Ref. 11). Muchas de estas neuronas diferencian bien entre diferentes recompensas de alimentos o líquidos. Por lo tanto, pueden procesar la naturaleza específica del evento gratificante. Algunas respuestas de recompensa dependen de la imprevisibilidad de la recompensa al ser reducidas o ausentes cuando la recompensa es predicha por un estímulo condicionado, aunque no está claro si señalan errores de predicción similares a las neuronas de dopamina. Por lo tanto, parece que el procesamiento de recompensas específicas para aprender y mantener el comportamiento de enfoque se beneficiaría fuertemente de una cooperación entre las neuronas de dopamina que señalan la aparición u omisión imprevista de la recompensa y las neuronas en las otras estructuras que indican simultáneamente la naturaleza específica de la recompensa.

La alteración de la neurotransmisión de dopamina con enfermedad de Parkinson, lesiones experimentales o tratamiento neuroléptico se asocia con muchos déficits conductuales en el movimiento (acinesia, temblor, rigidez), la cognición (atención, bradifrenia, planificación, aprendizaje) y la motivación (reducción de las respuestas emocionales, depresión). La mayoría de los déficits se mejoran considerablemente con la terapia agonista de receptores o precursores de dopamina sistémica, que no puede de manera simple restituir la transmisión de información fásica por impulsos neuronales. Parece que la neurotransmisión de dopamina desempeña dos funciones separadas en el cerebro, el procesamiento fásico de la información apetitiva y de alerta y la activación tónica de una gran variedad de procesos motores, cognitivos y motivacionales sin codificación temporal (11). La función tónica de la dopamina se basa en concentraciones bajas y sostenidas de dopamina extracelular en el cuerpo estriado (5-10 nM) y otras áreas inervadas por dopamina. La concentración de dopamina ambiental se regula localmente dentro de un rango estrecho por impulsos espontáneos, desbordamiento sináptico, transporte de recaptación, metabolismo, liberación y síntesis controladas por autorreceptores, e interacción presináptica del transmisor. La estimulación tónica de los receptores de dopamina no debe ser ni demasiado baja ni demasiado alta para una función óptima de una región determinada del cerebro. Otros neurotransmisores existen en concentraciones ambientales similarmente bajas, como el glutamato en el cuerpo estriado, la corteza cerebral, el hipocampo y el cerebelo, el aspartato y el GABA en el cuerpo estriado y la corteza frontal, y la adenosina en el hipocampo. Las neuronas en muchas estructuras cerebrales aparentemente están bañadas en una «sopa» de neurotransmisores que tienen efectos fisiológicos poderosos y específicos sobre la excitabilidad neuronal. Dada la importancia general de las concentraciones tónicas extracelulares de neurotransmisores, parece que la amplia gama de síntomas parkinsonianos no sería causada por una transmisión deficiente de información de recompensa por parte de las neuronas dopaminérgicas, sino que reflejaría un mal funcionamiento de las neuronas estriadas y corticales causado por la disminución de la dopamina ambiental. Las neuronas dopaminérgicas no participarían activamente en la amplia gama de procesos deficientes en parkinsonismo, pero proporcionarían la importante concentración de dopamina necesaria para mantener el funcionamiento adecuado de las neuronas estriadas y corticales involucradas en estos procesos.

El trabajo experimental fue apoyado por la Fundación Nacional Suiza para la Ciencia, los programas de Capital Humano y Movilidad y Biomed 2 de la Comunidad Europea a través de la Oficina Suiza de Educación y Ciencia, James S. La Fundación McDonnell, la Fundación de Investigación Roche, la Fundación United Parkinson (Chicago) y el British Council.

W. Schultz fue galardonado con el Premio Theodore Ott de 1997 de la Academia Suiza de Ciencias Médicas por el trabajo revisado en este artículo.

Las citas de referencia son limitadas debido a restricciones editoriales

  • 1 Dickinson, A. Contemporary Animal Learning Theory. Cambridge, UK: Cambridge Univ. Press, 1980.
    Google Scholar
  • 2 Fibiger, H. C., and A. G. Phillips. Recompensa, motivación, cognición: psicobiología de mesotelencefálico los sistemas de dopamina. In: Handbook of Physiology. El Sistema Nervioso. Sistemas Reguladores Intrínsecos del Cerebro. Bethesda, MD: Am. Fisiol. Soc., 1986, secc. 1, vol. IV, cap. 12, págs. 647 a 675.
    Google Scholar
  • 3 Freund, T. F., J. F. Powell, and A. D. Smith. Boutones inmunorreactivos tirosina hidroxilasa en contacto sináptico con neuronas estriatonigrales identificadas, con especial referencia a las espinas dendríticas. Neuroscience 13: 1189-1215, 1984.
    Crossref | PubMed | Google / Google Scholar
  • 4 Hollerman, J. R., and W. Schultz. Las neuronas dopaminérgicas informan de un error en la predicción temporal de la recompensa durante el aprendizaje. Neurociencia de la Naturaleza. 1: 304–309, 1998.
    Crossref | PubMed | Google / Google Scholar
  • 5 Ljungberg, T., P. Apicella, and W. Schultz. Respuestas de las neuronas dopaminérgicas de monos durante el aprendizaje de reacciones conductuales. J. Neurofisiol. 67: 145–163, 1992.
    Link / Google / Google Scholar
  • 6 Montague, P. R., P. Dayan, and T. J. Sejnowski. Un marco para sistemas mesencefálicos de dopamina basado en el aprendizaje hebbiano predictivo. J. Neurocirujano. 16: 1936–1947, 1996.
    Crossref | PubMed | Google / Google Scholar
  • 7 Mirenowicz, J., and W. Schultz. Activación preferencial de las neuronas dopaminérgicas del cerebro medio por estímulos apetitivos en lugar de aversivos. Nature 379: 449-451, 1996.
    Crossref / PubMed / Google / Google Scholar
  • 8 Rescorla, R. A., and A. R. Wagner. A theory of Pavlovian conditioning: variations in the effectiveness of reinforcement and nonreinforcement (en inglés). En: Classical Conditioning II: Current Research and Theory, editado por A. H. Black y W. F. Prokasy. Nueva York: Appleton Century Crofts, 1972, págs. 64 a 99.
    Google Scholar
  • 9 Robbins, T. W., and B. J. Everitt. Mecanismos neuroconductuales de recompensa y motivación. Curr. Opin. Neurobiol. 6: 228–236, 1996.
    Crossref | PubMed | Google / Google Scholar
  • 10 Romo, R., and W. Schultz. Neuronas dopaminérgicas del cerebro medio del mono: contingencias de las respuestas al tacto activo durante los movimientos autoiniciados de los brazos. J. Neurofisiol. 63: 592–606, 1990.
    Link / Google / Google Scholar
  • 11 Schultz, W. Señal de recompensa predictiva de neuronas dopaminérgicas. J. Neurofisiol. 80: 1–27, 1998.
    Link / Google / Google Scholar
  • 12 Schultz, W., P. Apicella, and T. Ljungberg. Respuestas de las neuronas dopaminérgicas de monos a estímulos condicionados y de recompensa durante pasos sucesivos de aprendizaje de una tarea de respuesta retardada. J. Neurocirujano. 13: 900–913, 1993.
    Crossref | PubMed | Google / Google Scholar
  • 13 Schultz, W., P. Dayan, and R. P. Montague. Un sustrato neuronal de predicción y recompensa. Science 275: 1593-1599, 1997.
    Crossref | PubMed | Google / Google Scholar
  • 14 Smith, A. D., and J. P. Bolam. La red neuronal de los ganglios basales revelada por el estudio de las conexiones sinápticas de neuronas identificadas. Tendencias Neurosci. 13: 259–265, 1990.
    Crossref / PubMed / Google / Google Scholar
  • 15 Sutton, R. S., and A. G. Barto. Toward a modern theory of adaptive networks: expectation and prediction (en inglés). Psicol. Apo. 88: 135-170, 1981.
    Crossref / PubMed / Google / Google Scholar

You might also like

Deja una respuesta

Tu dirección de correo electrónico no será publicada.