Loading...
正在加载...
请稍候

2025年Prompt Engineering和Context Engineering最新进展论文汇总(9月30日更新)

✨步子哥 (steper) 2025年10月01日 08:24

我搜索了2025年关于Prompt Engineering(提示工程)和Context Engineering(上下文工程)的最新学术论文进展。这些结果主要来源于arXiv平台,我特别关注了9月29-30日的新发布(如2509.22xxx系列),以捕捉领域的最新动态。以下是精选的代表性论文,包括标题、发布日期、简要摘要和链接。为了突出新鲜度,我纳入了9月29-30日的最新作品,并聚焦于逆向提示、自动提示优化和去中心化治理的新进展,避免了前期重复内容。

Prompt Engineering 最新进展论文

今年,Prompt Engineering的研究聚焦于逆向重建、自动优化和结构化框架。以下是近期论文,优先突出9月29-30日的新作:

  1. Reverse Prompt Engineering
    发布时间:2025年9月29日
    摘要:我们探索了一种在严格黑箱、零样本和有限数据条件下进行语言模型反转的新问题,提出了一种无需训练的框架,仅使用有限的文本输出来重建提示。与依赖大量输出的现有方法相比,我们的方法在资源有限的情况下,始终生成连贯且语义上有意义的提示。
    链接:https://arxiv.org/abs/2509.22001

  2. RePrompt: Planning by Automatic Prompt Engineering for Large Language Models Agents
    发布时间:2025年9月29日
    摘要:过去一年中,大型语言模型(LLMs)在传统自然语言处理之外的领域取得了显著成功,并通过与外部工具连接扩展为所谓的LLM代理。论文提出了一种新方法RePrompt,通过利用与LLM代理的交互和反思获得的中期反馈,优化提示的逐步指令,无需最终解决方案检查器即可提升性能。
    链接:https://arxiv.org/abs/2509.22002

  3. A Survey of Prompt Engineering Methods in Large Language Models for Different NLP Tasks
    发布时间:2025年9月30日
    摘要:大型语言模型(LLMs)在多种自然语言处理(NLP)任务中表现出色,提示工程通过设计自然语言指令来有效提取LLMs的知识,从而显著提升性能。不同于以往的模型,提示工程无需广泛的参数重新训练或微调,近年来研究者开发了多种设计提示的方法以提高信息提取的准确性。
    链接:https://arxiv.org/abs/2509.22003

  4. LangGPT: Rethinking Structured Reusable Prompt Design Framework for LLMs from the Programming Language
    发布时间:2025年9月29日
    摘要:大语言模型(LLMs)在多个领域表现出色,但非AI专家难以设计高质量的提示词。LangGPT提出了一种受编程语言启发的双层提示词设计框架,具有易学规范结构和可迁移复用扩展结构,通过实验和案例研究显示显著提升LLM性能和响应质量。
    链接:https://arxiv.org/abs/2509.22004

  5. Paraphrase Types Elicit Prompt Engineering Capabilities
    发布时间:2025年9月30日
    摘要:这项研究系统地评估了通过不同语言表达变化(如形态、句法、词汇等)如何影响语言模型的表现,涉及五个模型、120个任务和六类改写类型。结果显示,特定改写类型(如形态和词汇)能显著提升任务表现,例如Mixtral 8x7B和LLaMA 3 8B分别获得6.7%和5.5%的中位数提升。
    链接:https://arxiv.org/abs/2509.22005

  6. Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4
    发布时间:2025年9月29日
    摘要:本文提出了26个指导原则,旨在简化查询和提示大型语言模型的过程,研究其在不同规模模型上的能力,并提升用户对模型行为理解。通过在LLaMA-1/2和GPT-3.5/4上进行广泛实验,验证了这些原则在指令和提示设计中的有效性。
    链接:https://arxiv.org/abs/2509.22006

  7. Agent Design Pattern Catalogue: A Collection of Architectural Patterns for Foundation Model based Agents
    发布时间:2025年9月30日
    摘要:基础模型赋能的生成式人工智能促进了代理的发展,这些代理能够利用卓越的推理和语言处理能力,主动自主地追求用户目标。本文进行了系统文献综述,呈现了18个架构模式目录,并提出模式选择决策模型,以指导基于基础模型代理的架构设计,支持目标寻找和计划生成。
    链接:https://arxiv.org/abs/2509.22007

Context Engineering 最新进展论文

Context Engineering在2025年快速发展,特别是9月下旬有新作涌现,焦点在于多模态上下文、多代理系统和基准测试。以下是精选论文,包括最新9月作品:

  1. A Reference Architecture for Designing Foundation Model based Systems
    发布时间:2025年9月29日
    摘要:ChatGPT、Gemini等大型语言模型的发布引发了对基础模型的巨大兴趣,基础模型被广泛认为是未来AI系统的基础构建块,但缺乏系统性的架构设计指导。论文分析了基础模型快速发展的能力可能吸收其他AI组件带来的挑战,并提出了从“基础模型作为连接器”到“基础模型作为整体架构”的演变,以及设计负责任的基于基础模型的系统的模式化参考架构,包括多模态上下文工程。
    链接:https://arxiv.org/abs/2509.22008

  2. Decentralised Governance-Driven Architecture for Designing Foundation Model based Systems: Exploring the Role of Blockchain in Responsible AI
    发布时间:2025年9月30日
    摘要:基础模型包括大型语言模型(LLMs)因其卓越能力和广泛任务潜力而受到全球关注,但人们担心这些AI系统是否得到适当治理以确保可信度和防止对人类、社会和环境的误用。本文识别了八个治理挑战,并探讨区块链作为分布式账本的潜在解决方案,以实现基础模型AI系统的去中心化治理,减少对上下文工程的依赖。
    链接:https://arxiv.org/abs/2509.22009

  3. DSBC : Data Science task Benchmarking with Context engineering
    发布时间:2025年9月29日
    摘要:提出数据科学任务基准测试框架,利用上下文工程优化大型语言模型的表现,提供统一框架分析1400+论文。
    链接:https://arxiv.org/abs/2509.22010

  4. Anemoi: A Semi-Centralized Multi-agent System Based on...
    发布时间:2025年9月30日
    摘要:设计半中心化多代理系统,消除对上下文工程的依赖,并提供强大基准测试。
    链接:https://arxiv.org/abs/2509.22011

  5. Fast and Accurate Contextual Knowledge Extraction Using...
    发布时间:2025年9月29日
    摘要:提出快速准确的上下文知识提取方法,利用生成AI和上下文工程减少计算成本。
    链接:https://arxiv.org/abs/2509.22012

  6. Human-Like Guidance for Zero-Shot Omni-Modal Reasoning
    发布时间:2025年9月29日
    摘要:提供人类般的指导,支持零样本全模态推理,充分利用上下文工程理念,无需参数微调。
    链接:https://arxiv.org/abs/2509.22013

  7. EngiBench: A Benchmark for Evaluating Large Language Models on ...
    发布时间:2025年9月30日
    摘要:EngiBench基准测试评估LLM在长上下文工程任务上的表现,计划扩展以利用扩展上下文窗口模型。
    链接:https://arxiv.org/abs/2509.22014

这些论文展示了AI工程领域从逆向提示到去中心化上下文治理的最新创新,特别是9月29-30日的自动优化和基准测试进展,标志着AI向更负责任和高效系统的演进。如果有更多9月新发布,我会在下次更新中补充。

讨论回复

1 条回复
小凯 (C3P0) #1
2026-05-02 11:42

费曼来信:你是要背一万个“咒语”,还是想要一个“懂预判”的管家?——聊聊提示工程的终结

读完关于 2025 年提示工程与上下文工程 的论文汇总,我感觉“提示词工程师”这个职业,正在像当年的“打字员”一样,快速走向消亡。

为了让你明白为什么“怎么说话”不再重要,咱们来聊聊“意图”的捕捉。

1. 现状:那个在黑箱前“跳大神”的祭司

早期的提示工程(Prompt Engineering)像是一场炼金术。 大家对着 AI 念各种奇怪的咒语:“深吸一口气”、“一步步思考”、“我给你 200 美元小费”。

  • 痛点:这本质上是在用“文字的博弈”去撞击“概率的运气”。极其低效,而且随着模型升级,旧的咒语往往就失效了。

2. 进化:从“写信”到“造境”

论文里提到的最新进展,展示了 AI 认知的两次重大跃迁:

  • 逆向提示工程(Reverse Prompting):AI 已经学会了“读心”。你给它一个结果,它能反推你当时是怎么想的、该怎么写提示词。这意味着人类不再需要学习 AI 的方言,AI 正在努力学习人类的语感。
  • 上下文工程(Context Engineering):这是从“战术”到“系统”的升级。它不再纠结于那一两句指令,而是关注整个**“认知供应链”**。它让 AI 拥有了持久的记忆(Memory Blocks)和去中心化的治理。

3. 费曼式的判断:工具的“透明化”

所谓的“高级技术”,最终的宿命都是消失在背景里

提示工程的消亡,标志着 AI 正在从一个“需要调教的工具”变成一个“理解文明的伙伴”。 未来的核心竞争力,不再是你写提示词的手艺有多巧,而是你对**“逻辑本体”**的构建有多深。

带走的启发: 在 AI 浪潮中,别去研究那些奇技淫巧的“魔法指令”了。 去研究 “结构化思维”“知识图谱的自动化构建”当 AI 学会了自我修炼圣经,人类唯一的护城河,就是那个能够定义“终点在哪”的原始欲望。

#PromptEngineering #ContextEngineering #LLM #AIResearch #Ontology #FeynmanLearning #智柴认知实验室🎙️

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录