En la década de 1950, los científicos James Olds y Peter Milner investigaban en la Universidad de McGill (Montreal, Canadá) un área cerebral en el tronco cerebral, denominada red de formación. Para ello, colocaban a las ratas unos microelectrodos muy largos y finos conectados a un estimulador eléctrico, con el fin de estimular esta determinada área cerebral. Al no haber receptores para sentir dolor en el cerebro, las ratas no sentían dolor, pero sí sensaciones molestas. Lo que los investigadores Olds y Milner querían ver era si al acercarse a un lugar les daban descargas eléctricas al sentir que las ratas evitaban ese lugar.
Se anestesió una rata, se le colocaron microelectrodos y se hizo el experimento. Los investigadores se sorprendieron al ver el resultado: la rata, en lugar de evitarlos, prefería los lugares que recibían descargas eléctricas. Además, según el momento en el que le daban las descargas eléctricas, le gustaba un lugar u otro; dicho de otro modo, los investigadores podían conducir la rata estimulando su cerebro. La explicación era la siguiente. Parece ser que el microelectrodo estaba instalado en otro lugar, concretamente en un área denominada septo peluzido. Normalmente cometer este tipo de errores es una mala noticia, ya que se desaprovecha el experimento, pero en este caso el error de los investigadores se convirtió en una ventaja. Los científicos Olds y Milner reorganizaron su antigua hipótesis de investigación al descubrir el "centro de la curiosidad".
Para continuar con la investigación de este nuevo centro, se llevó a cabo un diseño experimental que permitió a las ratas estimular a sí mismas. Para ello utilizaron un sistema ideado desde hace tiempo por el psicólogo Burrhus Frederich Skinner: Las cajas de Skinner. En estas cajas, las ratas reciben la comida (premio) o una sensación dolorosa (castigo) al pulsar una palanca. A las ratas les resulta bastante fácil entender el mecanismo y muestran rápidamente qué palanca les gusta más. En este caso, los investigadores hicieron un cambio: al pulsar las ratas la palanca, en lugar de recoger la comida, estimularon las áreas concretas de su cerebro. Tras estos experimentos, los investigadores descubrieron cómo el interés por la palanca de descargas eléctricas era desproporcionado, mucho mayor que el de comida o el de agua. ¡Las ratas apretaban la palanca mil veces por hora para estimular su cerebro!
Tras ver estos resultados claros, Olds y Miler comenzaron a pensar que el área del cerebro investigado no era un "centro de la curiosidad" sino un "centro del placer". Este centro fue mejor investigado y tras unos experimentos se describió la estructura y la red de neuronas. Se llamó sistema de recompensas porque está relacionado con el placer o la vía mesocorticolínvica dopaminérica; los principales componentes del circuito mesocorticolínico son la zona ventral tegmentel del mesencéfalo (VTA) y el núcleo accumbens del prosencéfalo (NAC), el cerebro cortex prefrontal (PF) y el circuito neurotramínico que constituyen la dopamina.
El sistema de premios es un circuito formado por varias áreas interconectadas del cerebro. En VTA se encuentran los cuerpos celulares (o somas) de las neuronas dopaminérgicas. Desde allí se proyectan a otros lugares las prolongaciones (o axones) de las neuronas dopaminérgicas, que constituyen el eje central del sistema de premios. Estos axones llegan al núcleo accumbens y desde allí a la amígdala y la corteza prefrontal. Además, el sistema de recompensas se conecta con otras áreas cerebrales como el hipocampo, el estriado y otras zonas del mesencéfalo o del cortex.
Se ha explicado que las neuronas que forman este circuito utilizan dopamina neurotransmisor. Aunque la dopamina es el principal neurotransmisor, en este complejo e integrado sistema participan otros neurotransmisores. Por lo tanto, se pueden encontrar neuronas glutamatergicas, GABAérgicas, serotoninérgicas, noradrenérgicas u opioidergicas.
¿Cómo se activa la red neuronal que compone el sistema de premios? Cuando un estímulo activa las neuronas de la ATV, el impulso nervioso generado se transporta a través de los axones hasta las zonas de proyección, y finalmente se producen derrames de dopamina en estas áreas cerebrales (al estar almacenada la dopamina en el extremo de los axones). Por un lado, se activa el núcleo accumbens, área cerebral relacionada con los premios, la risa, el placer, las adicciones y el miedo. Por otro lado, la dopamina llega al área cerebral, la amigdalara, en la que las emociones están relacionadas con la creatividad, y al hipocampo, el área cerebral que controla la memoria. Finalmente, los axones dopaminérgicos también se proyectan sobre la corteza prefrontal. Este área está relacionada con la identidad, los procesos de toma de decisiones, el comportamiento social y otros procesos cognitivos complejos. En todos estos lugares la dopamina produce placer.
Las conexiones también se producen de forma inversa. A las neuronas de ATV llegan los axones de la corteza prefrontal y de las neuronas del núcleo accumbens. Las neuronas de la corteza prefrontal son glutamatergicas, es decir, segregan glutamato neurotransmisor (excitante). Las neuronas del núcleo accumbens son GABAergicas, es decir, segregan GABA o ácido gamma-aminobutírico (inhibidor). Por lo tanto, el efecto es lo contrario: el glutamato estimula las neuronas dopaminérgicas de la ATV, provocando fugas de dopamina, mientras que el neurotransmisor GABA reduce la emisión de dopamina. Así se regula la cantidad de dopamina que llega a los lugares de proyección.
Tal y como vieron los científicos Olds y Milner, en los escenarios de la ATV en los humanos las emisiones de dopamina provocan placer. Las fugas de dopamina se producen por estimulación eléctrica del cerebro, como se hizo en las ratas. Lo cierto es que cualquier activador de neuronas dopaminérgicas de ATV es placentero. El sexo, la comida, la bebida, la música o el juego son refuerzos positivos de forma natural, ya que activan el sistema de premios. Las drogas actúan igual, ya que provocan una hiperactividad dopaminérgica. En todos los casos se puede crear dependencia, por ejemplo, de sexo, comida o máquinas de monedas. En el caso de las drogas puede resultar más fácil, es decir, se establece un elevado porcentaje de hábitos patológicos que tienen como objetivo el consumo de drogas.
En todas las culturas se utilizan diferentes sustancias que actúan sobre el cerebro. Estas sustancias pueden ser suaves (como la cafeína) o de gran potencia (como la cocaína o la morfina). Otros son sedantes o alucinógenos. Los efectos son muy diferentes. Café, cocaína o anfetaminas son estimulantes, eliminan el sueño y aceleran la función mental. Por su parte, los sedantes (alcohol, barbitúrico, benzodiazepina o GHB) producen somnolencia y dificultan la coordinación y los reflejos. Los opioides (morfina o heroína) provocan analgesia y euforia y los alucinógenos (LSD, mescalina o ketamina) modifican los sentidos, la percepción y el estado de ánimo. Independientemente del efecto, en mayor o menor medida, el consumo de drogas en todos los casos puede ser excesivo. Esto puede deberse a que las drogas son sustancias eficaces que refuerzan el efecto de las neuronas dopaminérgicas o, lo que es lo mismo, son sustancias de gran potencia para hacer sentir placer.
¿Cómo refuerzan la acción de la dopamina? Por ejemplo, la cocaína o las anfetaminas prolongan el efecto de la dopamina, ya que el neurotransmisor permanece durante mucho tiempo en los lugares interneuronales, es decir, en las sinapsis. De este modo, el efecto de la dopamina es más prolongado y, por tanto, la sensación de placer. El mecanismo es el siguiente: una vez liberada la dopamina del axón y accionada en la siguiente neurona, desaparece de la sinapsis porque una proteína toma dopamina para retornarla al axón. La cocaína o anfetaminas bloquean esta proteína transportadora.
Por su parte, el principio activo del cannabis (THC) se asocia a receptores específicos (CB1). Estos receptores CB1 se encuentran en varios axones que segregan GABA. Dado que el THC inhibe la liberación de GABA y los neurotransmisores GABA inhiben la actividad de las neuronas dopaminérgicas de ATV, el THC deshiniba el bloqueo de las neuronas de ATV (causado por GABA). Como consecuencia, se segrega más dopamina.
La nicotina se asocia a los receptores nicotínicos específicos del axón glutamatergico. Estos axones glutamatergicos llegan a la ATV. Como el glutamato es un neurotransmisor excitante, activa las neuronas de la ATV, por lo que se segrega dopamina en las zonas de proyección.
En otros casos, el efecto producido en el sistema de premios es menos claro y directo. Los opioides, por ejemplo, se asocian a receptores opioides específicos. De esta forma actúan sobre el núcleo accumbens y finalmente la actividad de las neuronas dopaminérgicas cambia. Diversas sustancias alucinógenas, como el LSD, han actuado sobre el sistema serotonérgico, lo que permite modificar la actividad del núcleo accumbens. Esto puede moldear indirectamente la actividad de la dopamina.
Además de los diferentes mecanismos de acción, la capacidad de reforzar el sistema de premios es diferente y la fuerza de crear dependencia. Por último, muchos otros factores ambientales deben tenerse en cuenta para comprender las dependencias. Sin embargo, lo que sí está claro es que el grado de activación del sistema de premios está relacionado con la capacidad de los productores de dependencia.