close

生活中的每一瞬間,我們都在學習所遇到的事件之間的關聯。一隻狗狗可能會知道,它在鈴聲響起時能得到食物獎勵。同樣地,一個幼兒可能會意識到周六的午餐會比平時更美味。這些都是線索-獎勵關聯的例子,其中的線索(鈴聲或周六午餐)預測了某種獎勵。

多巴胺,一種經常被吹捧為"獎勵神經遞質"的大腦化學物質,已經被證明在學習這些線索-獎勵關聯中發揮了作用。但是,如果獎勵先於提示會發生什麼?科學家們發現,多巴胺峰可能對學習更複雜的關聯具有關鍵影響。

在發表於Current Biology的一項研究中,來自加州大學洛杉磯分校的Benjamin Seitz團隊用大鼠表明,中腦一個區域的多巴胺峰對於動物學習兩個事件之間的"反向連結"非常重要,即線索發生在獎勵之後。

但這項研究有什麼意義呢?眾所周知,學習標準的線索-獎勵關聯是至關重要的--我們需要了解獎勵之前會發生的事物,從而可以嘗試和尋找它們。

"例如,如果你看到一棵樹,然後找到了一些食物,你就想學習樹與食物之間的聯繫,並尋找更多的樹,"該論文的主要作者Seitz在一封電子郵件中說,"但有時你偶然發現一些有獎勵的東西(如食物),然後注意到一個刺激物(樹)。這種關係的學習也很重要,而且還沒有得到充分的研究。"

打開光源,抑制細胞

在這項研究中,團隊首先使用反向調節程序對大鼠進行訓練:先給它們一塊食物或碳水化合物獎勵,10秒後再播放一個獨特的聽覺提示。

用下面的例子來思考這種逆向條件:如果你在上班前經常在一家餐館停下來吃甜甜圈,那麼只要去上班,就意味着你在接下來的24小時內不會得到任何甜甜圈;因此,你的大腦在中性線索(工作)和獎勵(甜甜圈)之間學會了一種抑制性關係。

作者的目的是研究老鼠是否會學習每個食物獎勵和它之後的聽覺提示之間的關係。在播放聽覺提示之前,作者使用光遺傳學來抑制中腦分泌多巴胺的神經元。

光遺傳學利用被稱為蛋白酶的光激活蛋白質,選擇性地激活或抑制大腦特定區域的神經元。當抑制性蛋白被光激活時,使神經元更難被激活,從而阻礙它們的功能。但是,科學家是如何讓大鼠大腦中的神經元區域表達這些蛋白質的呢?

這裡就用到了在現實世界中令人畏懼的病毒。在遺傳學實驗室中,可以用病毒去感染細胞並將其遺傳物質插入細胞中。因此,病毒經常被用作基因的載體,例如那些編碼視網膜蛋白的基因。

在病毒感染了大鼠中腦的一個亞區後,作者向大腦的這一區域提供光線,暫時使產生多巴胺的細胞失活,而這阻止了中腦在向後提示開始時釋放多巴胺的尖峰。如果多巴胺對大鼠學習這些聯想確實很重要,那麼當神經元被停用時,這種學習就不會發生。

後向調節中多巴胺作用的測試

在這些實驗大鼠中,它們中腦的一個亞區在向後調節期間被暫時停用,導致獎勵和提示之間的關係不能被學習。

另一方面,具有完整中腦多巴胺神經元的對照組大鼠學會了食物顆粒獎勵後的聽覺提示意味着它們很快就不會再得到食物獎勵。當它們被訓練為按下兩個槓桿中的一個以獲得獎勵時,對照組大鼠在聽到提示時,按下了碳水化合物溶液的槓桿,反之亦然。這類似於我意識到一旦上班就不會有更多的甜甜圈了,不如給自己買一杯咖啡來代替。

對照組大鼠傾向於按下能給他們帶來替代獎勵的槓桿,而中腦多巴胺神經元失活的大鼠卻沒有表現出這種傾向,這表明完整的多巴胺活動對獎勵-線索關聯的學習至關重要。

Seitz說:"這一發現最重要的意義在於,它使我們認識到,關於多巴胺如何促進學習的一個非常簡單和優雅的模型是不正確的。過去我們往往認為,中腦多巴胺的峰對應於獎勵前的事物。」

"而我們的研究結果表明,多巴胺參與了更為複雜的學習情景,並可能在某些情況下(如精神分裂症)導致受試者過度學習那些在功能上不需要連接的刺激物之間的聯繫。"


參考文獻:Melissa J. Sharpe, et al., Dopamine errors drive excitatory and inhibitory components of backward conditioning in an outcome-specific manner, Current Biology (2022). DOI: 10.1016/j.cub.2022.06.035

譯者:潘奕辰,天津大學碩士研究生。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()