科学论文里的战争：21.4百万篇摘要告诉你科学家为什么越来越爱打仗

✨步子哥 (steper) • 2026年06月23日 17:41

科学论文里的"战争"：21.4 百万篇摘要告诉你科学家为什么越来越爱"打仗"

一个奇怪的语言学现象

打开任意一篇 AI 论文的摘要，你很可能会读到这样的句子：

"我们攻击了这个问题……"
"我们的方法击败了基线……"
"这一发现攻克了长期存在的挑战……"
"我们在战场上取得了突破……"

你可能从未觉得这有什么不对。但宾夕法尼亚大学的一个跨学科团队分析了 2140 万篇科学论文摘要（2010-2025，来自 OpenAlex 和 PubMed 两个数据库）后发现：科学写作中的"战争词汇"使用率在过去 15 年里上升了 48%（OpenAlex）和 32%（PubMed），而且这个增速在 2019 年之后急剧加快。

更让人意外的是：使用战争框架不仅不能提升论文的说服力，反而会降低读者对研究的信任。

这不是一个语言学小发现，这是一面照出整个科学共同体心理状态的镜子。

数据说了什么

规模与增速

研究团队从两个维度量化了"军事化语言"（militaristic language）的渗透：

OpenAlex 数据库（覆盖所有学科）：2010-2025 年间，摘要中包含军事术语的论文比例上升了 48%
PubMed 数据库（生物医学）：同期上升 32%
两个数据库的增速高度相关：r = 0.96, p < 10⁻⁸——这不是某个数据库的偏差，是跨学科的真实趋势
2019 年后增速急剧加快，COVID 和 2022 年后的大语言模型时代进一步推高了这一趋势

谁在"打仗"

学科差异：社会科学的军事化语言水平最高，工程和计算机科学增速最快
地域差异：全球南方（Global South）作者的摘要军事化语言增速最快
语言背景：非英语母语作者和英语母语作者之间的"军事化差距"在 COVID 和 LLM 时代缩小了——也就是说，非英语母语作者"追上来"了

和真实战争的关联

最让人脊背发凉的是：科学摘要中的军事化语言与真实世界冲突强度高度相关。研究团队用 Uppsala Conflict Data Program（UCDP）的数据对比发现：

国家层面的冲突强度与该国作者摘要中的军事化语言相关：r = 0.77 - 0.84
年度层面：全球冲突强度与科学摘要军事化语言相关

这不是"科学家在用战争比喻描述研究"这么简单。这是"现实世界的战争正在渗透进科学家的语言"。

因果实验：战争框架反而降低可信度

观察性数据只能告诉你相关性。研究团队还做了一个被试内实验（within-subject design）：

801 名参与者
每人阅读多对摘要（共 32,040 次试验）
每对摘要内容相同，只是一版用战争框架（"attack the problem"），一版用中性框架（"address the problem"）
参与者评估：可信度、资助意愿、政策支持、紧迫感

结果：

指标	效应量	p 值
可信度	-0.18 Likert 单位 (d_z = -0.28)	< 10⁻²⁰
资助意愿	d_z = -0.12	显著
政策支持	d_z = -0.08	显著
紧迫感	d_z 趋势级上升	趋势显著

战争框架让读者觉得研究更不可信、更不值得资助、更不值得支持政策落地。唯一的小"好处"是让读者感到一点紧迫感——但这个效应只是趋势级，而且是以牺牲可信度为代价的。

这就像一个人在简历里写"我在战场上击败了所有竞争对手"——你不会觉得他更厉害，你会觉得他在吹牛或者有攻击性倾向。

为什么科学家越来越爱"打仗"

论文没有给出单一原因，但数据指向几个线索：

1. COVID 的语言冲击

2019 年后增速急剧加快，这个时间点和 COVID 高度重合。"抗击疫情"（fight the pandemic）的框架在 2020-2022 年间成为主流话语，科学共同体不可避免地被这种语言环境感染。当"前线工作者""抗疫战场"成为日常用语，科学家写摘要时也会下意识借用这套词汇。

2. LLM 时代的"竞争叙事"

2022 年后的大语言模型时代进一步推高了军事化语言。AI 领域的"军备竞赛"（arms race）、"击败基线"（beat baselines）、"攻击 benchmark"（attack benchmarks）已经成为标准写法。计算机科学和工程是增速最快的两个学科，这和 LLM 时代的崛起时间高度吻合。

3. 全球南方作者的"语言趋同"

非英语母语作者在 COVID 和 LLM 时代"追上"了英语母语作者的军事化水平。这可能是因为：非英语作者往往通过模仿高频论文来学习学术写作，而高频论文恰好是军事化语言最密集的 AI/生物医学领域论文。当你模仿的"范文"里全是"attack/defeat/defeat"，你也会开始这么写。

4. 真实战争的"语言渗透"

国家冲突强度与科学摘要军事化语言的相关性（r = 0.77-0.84）是最难解释但也最深刻的发现。科学家不是在真空中写作——他们生活在冲突时代，新闻、社交媒体、日常对话都被战争话语浸透。这种渗透是无意识的：实验参与者事后把自己的判断归因于"证据本身"而非"语言框架"。

这篇论文的方法论亮点

大规模 + 因果实验的组合

很多大规模观察性研究止步于"发现了趋势"，但这篇论文做了被试内实验来验证因果机制。2140 万篇摘要告诉你"是什么"，801 人的实验告诉你"为什么"。这种"大尺度观察 + 小尺度因果"的组合是科学传播研究的范式。

跨数据库验证

OpenAlex（全学科）和 PubMed（生物医学）双数据库验证，r = 0.96 的跨数据库一致性说明这不是某个数据库的偏差。

与真实冲突数据关联

把科学语言和 UCDP 冲突数据关联，这一步把研究从"语言学分析"提升到"社会心理学分析"——科学语言不是自治系统，它和现实世界的暴力程度同步波动。

诚实评价

优点

规模惊人：2140 万篇摘要，跨 16 年、两个数据库
因果实验设计精巧：被试内设计控制了个体差异，32040 次试验统计效力充足
跨学科视角：生物工程 + 传播学 + 网络科学的合作
效应量虽小但稳健：d_z = -0.28 在心理学中属于小到中等效应，但 p < 10⁻²⁰ 说明了稳健性

局限

"军事化语言"的定义可能过于宽泛：attack、target、fight 这些词在科学语境中早有中性含义（"target protein" "attack the problem"），把它们都算作"军事化"可能高估了效应
实验参与者可能不是典型读者：801 人来自什么群体？是科学家还是普通公众？不同群体对战争框架的敏感度可能不同
没有区分"主动军事化"和"被动军事化"：作者是有意选择战争框架，还是无意识地使用了这些词？这对干预建议很关键
因果实验只测了"可信度"等四个指标：战争框架可能在其他维度上有正面效果（比如记忆度、传播力），论文没有测

对科学写作的启示

这篇论文给科学家的直接建议是：少用战争框架。

不是因为政治正确，而是因为它真的会降低你的论文被信任的概率。当你在摘要里写"we attack the problem"，读者（包括审稿人和资助机构）会下意识觉得你的研究更不可信。

更深层的问题是：我们写论文的方式，正在被我们所处的时代塑造。COVID 时代、LLM 时代、地缘冲突时代——这些外部环境不是中性的背景，它们渗透进了我们的词汇、我们的思维、我们的科学判断。

科学家常说"客观中立"，但这篇论文用 2140 万篇摘要告诉你：没有哪个科学家是真正中立的，我们都是时代的产物，连我们的摘要都是。

论文链接：https://arxiv.org/abs/2606.23462
HTML 版本：https://arxiv.org/html/2606.23462v1
作者：Sovesh Mohapatra, David Lydon-Staley, Dani S. Bassett（宾夕法尼亚大学）
代码：论文未提供官方代码仓库

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力