成瘾科学并不是一个陌生的领域——它本质上是在研究生物体的奖赏系统失调。Schultz 等人(1997)在猕猴实验中发现,多巴胺神经元的放电模式精确对应强化学习中的时序差分误差(Temporal Difference Error),这一发现成为 RL 理论最重要的神经科学依据之一。本文所探讨的 GLP-1 药物,通过调节这一奖赏信号的增益,实质上是在对一个"失控的优化器"进行干预——而这个视角,对于思考 reward design 和 alignment 问题的研究者而言,或许有超出医学本身的启发。
引言:一个意外的发现
2023年,一位名叫 Mary 的丹麦社工在酒吧注意到一个奇怪的现象:她那位同样嗜酒的朋友,面前的酒几乎没动过。
"我开始吃 Ozempic 减肥,"朋友解释道,"现在喝两杯以上就想吐。"
Mary 困惑了。Ozempic 不是糖尿病药吗?这和喝酒有什么关系?
第二天,她在 Facebook 上看到一则临床试验广告——研究 Semaglutide(司美格鲁肽)对酒精成瘾的影响。她报名参加了。
几周后,奇迹发生了。
"人们说 Ozempic 消除了对食物的渴望(Food Noise)。对我来说,它消除了『酒精杂音』(Alcohol Noise)。"
—— Mary
这不是孤例。Weill Cornell 医学院助理教授 Dhruv Khullar 在《纽约客》的深度报道中指出,GLP-1 类药物正在从代谢领域的"明星"悄然变成成瘾科学的"希望之光"。
一、从"噪音"到"寂静":成瘾者的主观体验
1.1 Mary 的故事
Mary 的酗酒史始于13岁。在丹麦——这个欧洲青少年饮酒率最高的国家之一——她曾一次喝下18瓶啤酒。
她尝试过戒酒互助会(AA)、康复中心、甚至会引发呕吐的药物 Antabuse。但没有一种方法能够平息她脑海中那个永恒的审问:
"什么时候喝?在哪里喝?喝多少?"
这种强迫性的念头像背景噪音一样,始终占据着她的精神带宽。
参加 Semaglutide 临床试验后,变化是渐进的:
- 首先,她失去了对啤酒的兴趣
- 然后换成白葡萄酒
- 最后,彻底停止饮酒
但最令人惊讶的不是戒酒本身,而是心理空间的释放。
"因为酒精不再是问题,所有这些精力都被释放出来了。我终于有了心理空间去思考:我到底想要什么样的生活?"
在服药几个月后,Mary 做出了一个她犹豫多年的决定——离开妻子,开始独立的新生活。
1.2 Susan 的体验
另一位试验参与者 Susan 是前 ICU 护士。她在试验开始前每晚要喝一瓶葡萄酒外加一两杯玛格丽塔。
在"线索反应性测试"中——研究人员把酒放在你面前,看你有多想喝——她形容那五分钟的闻酒时间简直是"酷刑":
"我拼命想要那杯酒。"
但试验结束时,当她再次面对那杯酒:
"我的大脑认出了它——噢,这是你以前想要的东西——但我的身体对它毫无欲望。"
1.3 共同的转变模式
在 Khullar 的报道中,这些受访者展现出惊人的共性:
| 用药前 | 用药后 |
|---|---|
| 脑子里全是酒/毒品,想别的都想不了 | 渴望还在,但不再是压倒一切的冲动 |
| 被本能拽着走,明知不该还是要 | 终于能退一步想:"我真的想要吗?" |
| 时刻盘算何时喝、怎么喝、喝多少 | 杂念消散,脑子清净了 |
二、神经生物学机制:GLP-1 与大脑的深层对话
2.1 GLP-1 是什么?
GLP-1(胰高血糖素样肽-1)是一种人体天然分泌的激素。传统上,我们认为它的功能是:
- 由肠道分泌
- 作用于胰腺,促进胰岛素释放
- 减缓胃排空
- 向大脑发送饱腹信号
然而,现代神经科学揭示了一个关键发现:GLP-1 受体广泛分布于中枢神经系统,尤其是与动机和奖赏相关的脑区。
2.2 "想要"vs."喜欢":成瘾的神经学基础
理解 GLP-1 治疗成瘾的关键,在于区分大脑中两种微妙的神经通路:
| "想要"(Wanting) | "喜欢"(Liking) | |
|---|---|---|
| 背后的化学物质 | 多巴胺 | 内啡肽等 |
| 感觉像什么 | "我必须得到它"的冲动 | 得到之后的满足感 |
| 在成瘾中扮演的角色 | 驱使你去找 | 让你觉得爽 |
密歇根大学神经科学家 Kent Berridge 在80年代做了一个经典实验:他给多巴胺缺乏的老鼠喂糖水。如果快感完全依赖多巴胺,这些老鼠应该不会享受糖水。
但奇怪的是,它们的愉悦反应和正常老鼠一样。
改变的是什么?它们不再愿意为糖水付出努力。
更惊人的发现来自另一个实验:Berridge 将多巴胺刺激与愉悦刺激(糖水、可卡因)和厌恶刺激(电击棒)配对。结果,老鼠对电击棒的"想要"程度和对可卡因一样强烈。
"我的天,这是成瘾的完美原型。『想要』完全脱离了『喜欢』。"
—— Kent Berridge
这解释了一个临床现象:成瘾者可能已经不再享受某种物质,但仍然强迫性地寻求它。
与强化学习的深层联系: Berridge 的框架与 RL 理论有着精确的对应关系。Schultz(1997)证明,多巴胺神经元的放电编码的正是奖赏预测误差(Reward Prediction Error, RPE)——这是时序差分学习(TD Learning)的核心量:当实际奖赏超出预期时多巴胺激增,低于预期时下降。从计算角度看,"想要"对应智能体的奖赏信号(驱动行为选择),"喜欢"对应真实效用(reward 的内在价值)。成瘾的本质是奖赏函数被劫持:药物诱导的多巴胺释放作为虚假的高幅度 reward signal,覆盖了真实奖赏,使大脑这个"优化器"的策略完全偏离了真实目标——这正是 RL alignment 研究中 reward misspecification 的生物学案例。GLP-1 的干预机制,则类似于对特定刺激进行奖赏塑形(reward shaping):选择性压低成瘾物质触发的多巴胺增益,而不关闭整体奖赏系统。
2.3 GLP-1 如何发挥作用?
GLP-1 药物的妙处在于:
它削弱了"想要",但没有毁掉"喜欢"。
动物实验发现,吃了 GLP-1 的小鼠:
- 嗑药时多巴胺飙升的幅度变小了
- 但平时的多巴胺水平没变——日常的小确幸还在
打个比方:GLP-1 就像把成瘾物质的"音量"调低了,但没有把整个音响系统关掉。 你还能享受生活,只是那些让你上瘾的东西不再那么"吵"了。
2.4 GLP-1 如何穿越血脑屏障?
这里存在一个谜团:随着科学家不断改进 GLP-1 药物,将短效的天然肽变成长效注射剂,这些分子变得越来越大——理论上不应该能穿过血脑屏障。
那它们是如何影响大脑的?
科学家有几种假说:
- 迷走神经传导:通过连接大脑与内脏的迷走神经传递信号
- 刺激大脑自产 GLP-1:促进大脑自身的 GLP-1 工厂增产
- "后门入口":通过血脑屏障较薄弱的区域(如 area postrema,又称"呕吐中枢")渗透
"事实是,没人真正知道。"
—— Lorenzo Leggio,NIH 临床主任
三、"通用病理学"假说:成瘾的统一理论
3.1 跨越物质边界
传统的成瘾治疗是"专病专药"模式:
- 美沙酮 → 阿片类成瘾
- 尼古丁贴片 → 烟草成瘾
- Antabuse → 酒精成瘾
但 GLP-1 药物展现出令人惊讶的广谱性:
| 成瘾类型 | 研究发现 |
|---|---|
| 烟草 | 2021年研究:服用 Exenatide 的吸烟者戒烟成功率是安慰剂组的近两倍 |
| 阿片类 | 电子健康记录分析:GLP-1 使用者药物过量风险降低 40% |
| 酒精 | 科罗拉多大学试验:受试者日均饮酒量从7杯降至3.5杯 |
| 行为成瘾 | 正在评估对赌博、强迫性购物的干预潜力 |
3.2 Heath D. Schmidt 的颠覆性理论
宾夕法尼亚大学神经科学家 Heath D. Schmidt 提出了一个极具野心的概念:
"GLP-1 可能在告诉我们,成瘾存在某种『通用病理学』(Universal Pathology)。而 GLP-1 是修复它的一部分。"
想想看:一种激素就能同时管住酒瘾、烟瘾、毒瘾,甚至赌瘾——这说明什么?
也许所有成瘾,在大脑深处都是同一个毛病。
成瘾不是你对某样东西特别"馋",而是你大脑里管"想要"的那套系统整个坏掉了。
对 RL 研究者而言,这个"通用病理学"假说在概念上类似于:不同的过拟合(overfitting)现象——无论是在什么任务上——都源于同一个优化机制的失控。GLP-1 的广谱性暗示,生物奖赏系统有一个可被统一干预的底层调节节点,这为思考通用 reward regulation 机制提供了有趣的生物学类比。
四、临床试验:从老鼠到人类
4.1 宾州州立大学的芬太尼研究
Sue Grigson 教授在宾州州立大学进行了精密的动物实验。她的实验室里有一套装置:老鼠可以通过反复舔空喷嘴来"赚取"芬太尼注射。
实验设计:
- 让老鼠对芬太尼成瘾
- 分为两组:一组注射 Liraglutide(GLP-1 药物),一组注射盐水
- 关闭芬太尼供应,观察老鼠的"寻药行为"
结果:
| 组别 | 舔舐空喷嘴的次数 |
|---|---|
| 盐水组 | 超过100次 |
| GLP-1组 | 几十次后就停止 |
"对盐水组的老鼠来说,这毫无用处!"Grigson 说。
更有意思的是脑部扫描的发现:GLP-1 不光让"想要"的冲动变弱了,连戒断时的难受劲儿也减轻了——大脑里负责"难受"的区域(蓝斑核)活动明显下降。
换句话说:不想要了,而且不要也没那么痛苦。
4.2 科罗拉多大学的人体试验
Joseph Schacht 在科罗拉多大学安舒茨医学院主持了美国首个针对重度酒精使用的 Semaglutide 随机对照试验。
初步结果:
| 指标 | 试验前 | Semaglutide 组(2个月后) |
|---|---|---|
| 日均饮酒量 | ~7杯 | ~3.5杯 |
| 重度饮酒天数比例 | ~65% | ~25% |
关键发现:药物没有让人更倾向于完全戒酒,而是让他们喝得更少。
"对我来说,这是最有意义的结果。大多数患者不想完全戒酒。他们想像『正常人』一样喝酒。"
—— Joseph Schacht
4.3 Adrienne Pierce 的阿片类康复之旅
50岁的 Adrienne Pierce 有着太多成瘾者都有的过去:小时候在寄养家庭之间辗转,16岁被强奸后开始碰大麻、酒、可卡因,最后染上海洛因。两个儿子先后被政府带走。
在参加 Semaglutide + 美沙酮的联合试验后:
- 以前:戒海洛因需要6个月
- 现在:只用了6周
"毒品和针头就在那儿,我随时能拿到,但我压根不想碰。就好像——连想嗨的念头都没了!"
更深的变化在于:
"以前我戒不掉,是因为脑子里那些乱七八糟的念头老是冒出来。Ozempic 把那些全给带走了。"
五、代价与风险:当"调节器"调得太低
5.1 极端的副作用
药物对欲望的强力接管并非没有代价。
Mary 在试验后期遭遇了严重的食欲丧失。最糟糕的时候,她每天只摄入200卡路里。五个月内,她减掉了55磅。
有一天,她在超市货架间失声痛哭:
"满眼都是吃的,但我什么都不想碰。我知道我得吃,但身体里一点饿的感觉都没有。我觉得特别绝望。"
那是一种很原始的恐惧——连饿都不会饿了,我还是个正常人吗?
5.2 快感缺失(Anhedonia)
2024年,《纽约时报》采访了24位因 GLP-1 药物而受影响的人,其中包括一位失去性欲的女性。
在 Reddit 上,用户讨论着各种心理变化:
"我不再享受家人、自己、生活。我不想成为行尸走肉。"
记者 Johann Hari 在其著作《Magic Pill》中描述了自己服用 Ozempic 的体验:
"我对新一天不再感到兴奋。我经常情感麻木。"
丹麦科学家 Jens Juul Holst(GLP-1 的发现者之一)在2023年表达过担忧:
"这药可能把生活搞得太寡淡了,淡到你受不了,最后还是回到老路上去。"
5.3 自杀风险争议
2023年,欧洲药品管理局在收到大量 GLP-1 使用者自杀念头和自残的报告后,启动了安全审查。
结论是:现有证据无法确立因果关系。
美国 FDA 在2024年表示"无法完全排除存在小风险",但在2025年1月要求从 GLP-1 药物标签上移除自杀警告。
数据仍然模糊不清:
- 有观察性研究发现 GLP-1 可能使自杀念头风险降低一半以上
- 也有研究发现它可能使自杀行为风险增加一倍以上
六、根本问题:药物能代替意志吗?
6.1 进化的悖论
宾州州立健康中心成瘾服务主任 Sarah Kawasaki 说了一句很有意思的话:
"追求快乐这件事,本来是帮我们这个物种活下来的。"
想想看:喜欢吃东西,所以祖先不会饿死;喜欢交配,所以人类得以繁衍。成瘾,不过是这套"追求快乐"的系统跑偏了。
但如果我们用药物把这套系统调低,会发生什么?
"人活着需要快乐。要是全社会的人都打 GLP-1,咱们会不会都变成一群没劲的人?"
6.2 "桥梁"还是"目的地"?
一个更现实的问题:GLP-1 是帮你过渡的跳板,还是得吃一辈子?
密歇根营养肥胖研究中心主任 Randy Seeley 有点悲观:
- 减肥的人体重降到一定程度就不再降了,然后饿的感觉又回来了
- 成瘾可能也一样:药效稳定之后,那股子馋劲儿可能还是会回来
就连 Grigson 的老鼠实验也发现:吃了几周药之后,有些老鼠产生了耐药性,又开始找毒品了。
"现在有些人觉得这药什么都能治。但我的看法是,这些『附带好处』是暂时的。等体重不再往下掉了,这些好处也就没了。"
—— Randy Seeley
6.3 无法被药物触及的"为什么"
Kawasaki 还说了一句更扎心的话:
"这些药管不了你『为什么』会上瘾。"
创伤、孤独、痛苦、压力、穷——这些才是成瘾的根儿。时间长了,嗑药喝酒本身变成了应对生活的方式,"为什么"早就看不见了,但它一直在那儿使劲。
GLP-1 充其量是半个解决方案。它代替不了心理治疗。
但对 Adrienne Pierce 来说,这药确实帮了大忙:
"Ozempic 不光让我不想嗑药了,连那些老是冒出来、逼我去嗑药的破念头和烂回忆,也都消停了。"
七、未来展望:等待批准与自我实验
7.1 监管的不确定性
如果像 Schacht 这样的试验继续产生积极结果,FDA 可能会正式批准 GLP-1 用于成瘾治疗。
但药物不一定需要 FDA 的"祝福"才能获得新用途。历史先例:
- 阿司匹林用于预防心脏病发作:使用了几十年后才获得 FDA 批准
- 普萘洛尔(血压药)用于焦虑:至今仍是"超适应症使用"
很快,医生将不得不自行决定如何开具 GLP-1 处方。
7.2 Susan 的"自我实验"
Susan 在 Schacht 的试验结束后,寻找继续获得 GLP-1 的途径。最终,她通过一位经营美容 spa 的执业护士获得了处方——名义上是"想减几磅体重"。
现在,她把药物放在家里,在感觉有饮酒风险时自行注射:
- 丈夫被诊断为晚期癌症时:注射
- 结婚纪念日长途旅行前:注射
"我可不想在 happy hour 的时候,别人都在喝酒,就我端着杯健怡可乐干坐着。"
作为医生,Khullar 对这种随意使用强效药物感到不安。但他无法否认结果:
GLP-1 帮助 Susan 的程度超过了任何其他方法。在最后一次通话时,她仍然保持清醒。
结语:从"道德缺陷"到"神经回路失衡"
这场围绕 GLP-1 的医学探索,正在改变我们看待成瘾的方式:
| 过去怎么看 | 现在怎么看 |
|---|---|
| 意志力不行,管不住自己 | 大脑回路出了问题 |
| 人品差、道德败坏 | 一种可以治的脑部疾病 |
| 咬牙硬撑、靠毅力戒 | 可以用药物帮大脑"重新校准" |
Mary 在采访最后说的一句话,或许是对这类药物最好的定位:
"这些药能给你一个喘息的机会,让你有力气去真正改变生活。"
GLP-1 不是终点,而是一个起点——它帮你把脑子里的噪音关掉,但接下来往哪走、怎么活,还得你自己来。
成瘾科学走到今天,正站在一个微妙的路口:药能帮上忙,但药救不了命。 真正的康复,终究要在化学分子和人生故事之间,找到属于自己的那条路。
附录:核心术语对照
| 英文术语 | 中文释义 | 语境 |
|---|---|---|
| GLP-1 (Glucagon-like peptide 1) | 胰高血糖素样肽-1 | 天然激素及其合成类似物 |
| Semaglutide | 司美格鲁肽 | Ozempic/Wegovy 的活性成分 |
| Mesolimbic pathway | 中脑边缘通路 | 大脑奖赏系统的核心 |
| Ventral striatum | 腹侧纹状体 | 多巴胺释放的关键区域 |
| Food/Alcohol Noise | 食物/酒精噪音 | 大脑中持续的强迫性渴求 |
| First-order desire | 一阶欲望 | 即时的、本能的渴望 |
| Second-order desire | 二阶欲望 | "想要不想要"的反思性愿望 |
| Wanting vs. Liking | "想要"vs."喜欢" | Berridge 的动机与快感分离理论 |
| Universal Pathology | 通用病理学 | Schmidt 提出的成瘾统一理论假说 |
| Anhedonia | 快感缺失 | 对愉悦体验能力的减退 |
| Cue-reactivity test | 线索反应性测试 | 测量对成瘾物质渴求程度的方法 |
参考来源: Dhruv Khullar, "In Search of a Fix: What Ozempic Reveals About the Science of Addiction," The New Yorker, February 16 & 23, 2026.