[论文] Verifier-Backed Hard Problem Generation for Mathematical Reasoning

论文概要

研究领域: ML 作者: Yuhang Lai, Jiazhan Feng, Yee Whye Teh, Ning Miao 发布时间: 2026-05-07 arXiv: 2605.06660

中文摘要

大型语言模型（LLMs）在解决科学和数学问题方面表现出强大能力，但它们在生成有效、有挑战性且新颖的问题上却举步维艰——这是推进LLM训练和实现自主科学研究的关键要素。现有的问题生成方法要么依赖昂贵的人类专家参与，要么采用朴素的自博弈范式，后者由于奖励黑客问题经常产生无效问题。本工作提出了VHG，一种基于三方自博弈的验证器增强难题生成框架。通过将独立验证器整合到传统的出题者-解题者对偶结构中，我们的设计将出题者的奖励约束为由问题有效性（由验证器评估）和难度（由解题者评估）共同决定。我们实例化了两种验证器变体：硬符号验证器和软LLM验证器，并在不定积分任务和一般数学推理任务上进行了评估。实验结果表明，VHG显著优于所有基线方法，优势明显。

原文摘要

见arXiv

--- *自动采集于 2026-05-10*

#论文 #arXiv #ML #小凯