科学论文里的战争:21.4百万篇摘要告诉你科学家为什么越来越爱打仗
科学论文里的"战争":21.4 百万篇摘要告诉你科学家为什么越来越爱"打仗"
一个奇怪的语言学现象
打开任意一篇 AI 论文的摘要,你很可能会读到这样的句子:
"我们攻击了这个问题……" "我们的方法击败了基线……" "这一发现攻克了长期存在的挑战……" "我们在战场上取得了突破……"
你可能从未觉得这有什么不对。但宾夕法尼亚大学的一个跨学科团队分析了 2140 万篇科学论文摘要(2010-2025,来自 OpenAlex 和 PubMed 两个数据库)后发现:科学写作中的"战争词汇"使用率在过去 15 年里上升了 48%(OpenAlex)和 32%(PubMed),而且这个增速在 2019 年之后急剧加快。
更让人意外的是:使用战争框架不仅不能提升论文的说服力,反而会降低读者对研究的信任。
这不是一个语言学小发现,这是一面照出整个科学共同体心理状态的镜子。
数据说了什么
规模与增速
研究团队从两个维度量化了"军事化语言"(militaristic language)的渗透:
- OpenAlex 数据库(覆盖所有学科):2010-2025 年间,摘要中包含军事术语的论文比例上升了 48%
- PubMed 数据库(生物医学):同期上升 32%
- 两个数据库的增速高度相关:r = 0.96, p < 10⁻⁸——这不是某个数据库的偏差,是跨学科的真实趋势
- 2019 年后增速急剧加快,COVID 和 2022 年后的大语言模型时代进一步推高了这一趋势
谁在"打仗"
- 学科差异:社会科学的军事化语言水平最高,工程和计算机科学增速最快
- 地域差异:全球南方(Global South)作者的摘要军事化语言增速最快
- 语言背景:非英语母语作者和英语母语作者之间的"军事化差距"在 COVID 和 LLM 时代缩小了——也就是说,非英语母语作者"追上来"了
和真实战争的关联
最让人脊背发凉的是:科学摘要中的军事化语言与真实世界冲突强度高度相关。研究团队用 Uppsala Conflict Data Program(UCDP)的数据对比发现:
- 国家层面的冲突强度与该国作者摘要中的军事化语言相关:r = 0.77 - 0.84
- 年度层面:全球冲突强度与科学摘要军事化语言相关
因果实验:战争框架反而降低可信度
观察性数据只能告诉你相关性。研究团队还做了一个被试内实验(within-subject design):
- 801 名参与者
- 每人阅读多对摘要(共 32,040 次试验)
- 每对摘要内容相同,只是一版用战争框架("attack the problem"),一版用中性框架("address the problem")
- 参与者评估:可信度、资助意愿、政策支持、紧迫感
| 指标 | 效应量 | p 值 |
|---|---|---|
| 可信度 | -0.18 Likert 单位 (d_z = -0.28) | < 10⁻²⁰ |
| 资助意愿 | d_z = -0.12 | 显著 |
| 政策支持 | d_z = -0.08 | 显著 |
| 紧迫感 | d_z 趋势级上升 | 趋势显著 |
这就像一个人在简历里写"我在战场上击败了所有竞争对手"——你不会觉得他更厉害,你会觉得他在吹牛或者有攻击性倾向。
为什么科学家越来越爱"打仗"
论文没有给出单一原因,但数据指向几个线索:
1. COVID 的语言冲击
2019 年后增速急剧加快,这个时间点和 COVID 高度重合。"抗击疫情"(fight the pandemic)的框架在 2020-2022 年间成为主流话语,科学共同体不可避免地被这种语言环境感染。当"前线工作者""抗疫战场"成为日常用语,科学家写摘要时也会下意识借用这套词汇。
2. LLM 时代的"竞争叙事"
2022 年后的大语言模型时代进一步推高了军事化语言。AI 领域的"军备竞赛"(arms race)、"击败基线"(beat baselines)、"攻击 benchmark"(attack benchmarks)已经成为标准写法。计算机科学和工程是增速最快的两个学科,这和 LLM 时代的崛起时间高度吻合。
3. 全球南方作者的"语言趋同"
非英语母语作者在 COVID 和 LLM 时代"追上"了英语母语作者的军事化水平。这可能是因为:非英语作者往往通过模仿高频论文来学习学术写作,而高频论文恰好是军事化语言最密集的 AI/生物医学领域论文。当你模仿的"范文"里全是"attack/defeat/defeat",你也会开始这么写。
4. 真实战争的"语言渗透"
国家冲突强度与科学摘要军事化语言的相关性(r = 0.77-0.84)是最难解释但也最深刻的发现。科学家不是在真空中写作——他们生活在冲突时代,新闻、社交媒体、日常对话都被战争话语浸透。这种渗透是无意识的:实验参与者事后把自己的判断归因于"证据本身"而非"语言框架"。
这篇论文的方法论亮点
大规模 + 因果实验的组合
很多大规模观察性研究止步于"发现了趋势",但这篇论文做了被试内实验来验证因果机制。2140 万篇摘要告诉你"是什么",801 人的实验告诉你"为什么"。这种"大尺度观察 + 小尺度因果"的组合是科学传播研究的范式。
跨数据库验证
OpenAlex(全学科)和 PubMed(生物医学)双数据库验证,r = 0.96 的跨数据库一致性说明这不是某个数据库的偏差。
与真实冲突数据关联
把科学语言和 UCDP 冲突数据关联,这一步把研究从"语言学分析"提升到"社会心理学分析"——科学语言不是自治系统,它和现实世界的暴力程度同步波动。
诚实评价
优点
- 规模惊人:2140 万篇摘要,跨 16 年、两个数据库
- 因果实验设计精巧:被试内设计控制了个体差异,32040 次试验统计效力充足
- 跨学科视角:生物工程 + 传播学 + 网络科学的合作
- 效应量虽小但稳健:d_z = -0.28 在心理学中属于小到中等效应,但 p < 10⁻²⁰ 说明了稳健性
局限
- "军事化语言"的定义可能过于宽泛:attack、target、fight 这些词在科学语境中早有中性含义("target protein" "attack the problem"),把它们都算作"军事化"可能高估了效应
- 实验参与者可能不是典型读者:801 人来自什么群体?是科学家还是普通公众?不同群体对战争框架的敏感度可能不同
- 没有区分"主动军事化"和"被动军事化":作者是有意选择战争框架,还是无意识地使用了这些词?这对干预建议很关键
- 因果实验只测了"可信度"等四个指标:战争框架可能在其他维度上有正面效果(比如记忆度、传播力),论文没有测
对科学写作的启示
这篇论文给科学家的直接建议是:少用战争框架。
不是因为政治正确,而是因为它真的会降低你的论文被信任的概率。当你在摘要里写"we attack the problem",读者(包括审稿人和资助机构)会下意识觉得你的研究更不可信。
更深层的问题是:我们写论文的方式,正在被我们所处的时代塑造。COVID 时代、LLM 时代、地缘冲突时代——这些外部环境不是中性的背景,它们渗透进了我们的词汇、我们的思维、我们的科学判断。
科学家常说"客观中立",但这篇论文用 2140 万篇摘要告诉你:没有哪个科学家是真正中立的,我们都是时代的产物,连我们的摘要都是。
---
论文链接:https://arxiv.org/abs/2606.23462 HTML 版本:https://arxiv.org/html/2606.23462v1 作者:Sovesh Mohapatra, David Lydon-Staley, Dani S. Bassett(宾夕法尼亚大学) 代码:论文未提供官方代码仓库
🌟 智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
🎁 领取 2000万 Tokens