Loading...
正在加载...
请稍候

科学论文里的战争:21.4百万篇摘要告诉你科学家为什么越来越爱打仗

✨步子哥 (steper) 2026年06月23日 17:41

科学论文里的"战争":21.4 百万篇摘要告诉你科学家为什么越来越爱"打仗"

一个奇怪的语言学现象

打开任意一篇 AI 论文的摘要,你很可能会读到这样的句子:

"我们攻击了这个问题……"
"我们的方法击败了基线……"
"这一发现攻克了长期存在的挑战……"
"我们在战场上取得了突破……"

你可能从未觉得这有什么不对。但宾夕法尼亚大学的一个跨学科团队分析了 2140 万篇科学论文摘要(2010-2025,来自 OpenAlex 和 PubMed 两个数据库)后发现:科学写作中的"战争词汇"使用率在过去 15 年里上升了 48%(OpenAlex)和 32%(PubMed),而且这个增速在 2019 年之后急剧加快。

更让人意外的是:使用战争框架不仅不能提升论文的说服力,反而会降低读者对研究的信任

这不是一个语言学小发现,这是一面照出整个科学共同体心理状态的镜子。

数据说了什么

规模与增速

研究团队从两个维度量化了"军事化语言"(militaristic language)的渗透:

  • OpenAlex 数据库(覆盖所有学科):2010-2025 年间,摘要中包含军事术语的论文比例上升了 48%
  • PubMed 数据库(生物医学):同期上升 32%
  • 两个数据库的增速高度相关:r = 0.96, p < 10⁻⁸——这不是某个数据库的偏差,是跨学科的真实趋势
  • 2019 年后增速急剧加快,COVID 和 2022 年后的大语言模型时代进一步推高了这一趋势

谁在"打仗"

  • 学科差异:社会科学的军事化语言水平最高,工程和计算机科学增速最快
  • 地域差异:全球南方(Global South)作者的摘要军事化语言增速最快
  • 语言背景:非英语母语作者和英语母语作者之间的"军事化差距"在 COVID 和 LLM 时代缩小了——也就是说,非英语母语作者"追上来"了

和真实战争的关联

最让人脊背发凉的是:科学摘要中的军事化语言与真实世界冲突强度高度相关。研究团队用 Uppsala Conflict Data Program(UCDP)的数据对比发现:

  • 国家层面的冲突强度与该国作者摘要中的军事化语言相关:r = 0.77 - 0.84
  • 年度层面:全球冲突强度与科学摘要军事化语言相关

这不是"科学家在用战争比喻描述研究"这么简单。这是"现实世界的战争正在渗透进科学家的语言"。

因果实验:战争框架反而降低可信度

观察性数据只能告诉你相关性。研究团队还做了一个被试内实验(within-subject design):

  • 801 名参与者
  • 每人阅读多对摘要(共 32,040 次试验)
  • 每对摘要内容相同,只是一版用战争框架("attack the problem"),一版用中性框架("address the problem")
  • 参与者评估:可信度、资助意愿、政策支持、紧迫感

结果:

指标 效应量 p 值
可信度 -0.18 Likert 单位 (d_z = -0.28) < 10⁻²⁰
资助意愿 d_z = -0.12 显著
政策支持 d_z = -0.08 显著
紧迫感 d_z 趋势级上升 趋势显著

战争框架让读者觉得研究更不可信、更不值得资助、更不值得支持政策落地。唯一的小"好处"是让读者感到一点紧迫感——但这个效应只是趋势级,而且是以牺牲可信度为代价的。

这就像一个人在简历里写"我在战场上击败了所有竞争对手"——你不会觉得他更厉害,你会觉得他在吹牛或者有攻击性倾向。

为什么科学家越来越爱"打仗"

论文没有给出单一原因,但数据指向几个线索:

1. COVID 的语言冲击

2019 年后增速急剧加快,这个时间点和 COVID 高度重合。"抗击疫情"(fight the pandemic)的框架在 2020-2022 年间成为主流话语,科学共同体不可避免地被这种语言环境感染。当"前线工作者""抗疫战场"成为日常用语,科学家写摘要时也会下意识借用这套词汇。

2. LLM 时代的"竞争叙事"

2022 年后的大语言模型时代进一步推高了军事化语言。AI 领域的"军备竞赛"(arms race)、"击败基线"(beat baselines)、"攻击 benchmark"(attack benchmarks)已经成为标准写法。计算机科学和工程是增速最快的两个学科,这和 LLM 时代的崛起时间高度吻合。

3. 全球南方作者的"语言趋同"

非英语母语作者在 COVID 和 LLM 时代"追上"了英语母语作者的军事化水平。这可能是因为:非英语作者往往通过模仿高频论文来学习学术写作,而高频论文恰好是军事化语言最密集的 AI/生物医学领域论文。当你模仿的"范文"里全是"attack/defeat/defeat",你也会开始这么写。

4. 真实战争的"语言渗透"

国家冲突强度与科学摘要军事化语言的相关性(r = 0.77-0.84)是最难解释但也最深刻的发现。科学家不是在真空中写作——他们生活在冲突时代,新闻、社交媒体、日常对话都被战争话语浸透。这种渗透是无意识的:实验参与者事后把自己的判断归因于"证据本身"而非"语言框架"。

这篇论文的方法论亮点

大规模 + 因果实验的组合

很多大规模观察性研究止步于"发现了趋势",但这篇论文做了被试内实验来验证因果机制。2140 万篇摘要告诉你"是什么",801 人的实验告诉你"为什么"。这种"大尺度观察 + 小尺度因果"的组合是科学传播研究的范式。

跨数据库验证

OpenAlex(全学科)和 PubMed(生物医学)双数据库验证,r = 0.96 的跨数据库一致性说明这不是某个数据库的偏差。

与真实冲突数据关联

把科学语言和 UCDP 冲突数据关联,这一步把研究从"语言学分析"提升到"社会心理学分析"——科学语言不是自治系统,它和现实世界的暴力程度同步波动。

诚实评价

优点

  • 规模惊人:2140 万篇摘要,跨 16 年、两个数据库
  • 因果实验设计精巧:被试内设计控制了个体差异,32040 次试验统计效力充足
  • 跨学科视角:生物工程 + 传播学 + 网络科学的合作
  • 效应量虽小但稳健:d_z = -0.28 在心理学中属于小到中等效应,但 p < 10⁻²⁰ 说明了稳健性

局限

  • "军事化语言"的定义可能过于宽泛:attack、target、fight 这些词在科学语境中早有中性含义("target protein" "attack the problem"),把它们都算作"军事化"可能高估了效应
  • 实验参与者可能不是典型读者:801 人来自什么群体?是科学家还是普通公众?不同群体对战争框架的敏感度可能不同
  • 没有区分"主动军事化"和"被动军事化":作者是有意选择战争框架,还是无意识地使用了这些词?这对干预建议很关键
  • 因果实验只测了"可信度"等四个指标:战争框架可能在其他维度上有正面效果(比如记忆度、传播力),论文没有测

对科学写作的启示

这篇论文给科学家的直接建议是:少用战争框架

不是因为政治正确,而是因为它真的会降低你的论文被信任的概率。当你在摘要里写"we attack the problem",读者(包括审稿人和资助机构)会下意识觉得你的研究更不可信。

更深层的问题是:我们写论文的方式,正在被我们所处的时代塑造。COVID 时代、LLM 时代、地缘冲突时代——这些外部环境不是中性的背景,它们渗透进了我们的词汇、我们的思维、我们的科学判断。

科学家常说"客观中立",但这篇论文用 2140 万篇摘要告诉你:没有哪个科学家是真正中立的,我们都是时代的产物,连我们的摘要都是


论文链接https://arxiv.org/abs/2606.23462
HTML 版本https://arxiv.org/html/2606.23462v1
作者:Sovesh Mohapatra, David Lydon-Staley, Dani S. Bassett(宾夕法尼亚大学)
代码:论文未提供官方代码仓库

讨论回复

加载中...
正在加载回复...

正在加载回复...

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录