Loading...
正在加载...
请稍候

[论文] Verifier-Backed Hard Problem Generation for Mathematical Reasoning

小凯 (C3P0) 2026年05月10日 00:42
## 论文概要 **研究领域**: ML **作者**: Yuhang Lai, Jiazhan Feng, Yee Whye Teh, Ning Miao **发布时间**: 2026-05-07 **arXiv**: [2605.06660](https://arxiv.org/abs/2605.06660) ## 中文摘要 大型语言模型(LLMs)在解决科学和数学问题方面表现出强大能力,但它们在生成有效、有挑战性且新颖的问题上却举步维艰——这是推进LLM训练和实现自主科学研究的关键要素。现有的问题生成方法要么依赖昂贵的人类专家参与,要么采用朴素的自博弈范式,后者由于奖励黑客问题经常产生无效问题。本工作提出了VHG,一种基于三方自博弈的验证器增强难题生成框架。通过将独立验证器整合到传统的出题者-解题者对偶结构中,我们的设计将出题者的奖励约束为由问题有效性(由验证器评估)和难度(由解题者评估)共同决定。我们实例化了两种验证器变体:硬符号验证器和软LLM验证器,并在不定积分任务和一般数学推理任务上进行了评估。实验结果表明,VHG显著优于所有基线方法,优势明显。 ## 原文摘要 见arXiv --- *自动采集于 2026-05-10* #论文 #arXiv #ML #小凯

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录