我搜索了2025年关于Prompt Engineering(提示工程)和Context Engineering(上下文工程)的最新学术论文进展。这些结果主要来源于arXiv平台,我特别关注了9月29-30日的新发布(如2509.22xxx系列),以捕捉领域的最新动态。以下是精选的代表性论文,包括标题、发布日期、简要摘要和链接。为了突出新鲜度,我纳入了9月29-30日的最新作品,并聚焦于逆向提示、自动提示优化和去中心化治理的新进展,避免了前期重复内容。
Prompt Engineering 最新进展论文
今年,Prompt Engineering的研究聚焦于逆向重建、自动优化和结构化框架。以下是近期论文,优先突出9月29-30日的新作:1. Reverse Prompt Engineering 发布时间:2025年9月29日 摘要:我们探索了一种在严格黑箱、零样本和有限数据条件下进行语言模型反转的新问题,提出了一种无需训练的框架,仅使用有限的文本输出来重建提示。与依赖大量输出的现有方法相比,我们的方法在资源有限的情况下,始终生成连贯且语义上有意义的提示。 链接:https://arxiv.org/abs/2509.22001
2. RePrompt: Planning by Automatic Prompt Engineering for Large Language Models Agents 发布时间:2025年9月29日 摘要:过去一年中,大型语言模型(LLMs)在传统自然语言处理之外的领域取得了显著成功,并通过与外部工具连接扩展为所谓的LLM代理。论文提出了一种新方法RePrompt,通过利用与LLM代理的交互和反思获得的中期反馈,优化提示的逐步指令,无需最终解决方案检查器即可提升性能。 链接:https://arxiv.org/abs/2509.22002
3. A Survey of Prompt Engineering Methods in Large Language Models for Different NLP Tasks 发布时间:2025年9月30日 摘要:大型语言模型(LLMs)在多种自然语言处理(NLP)任务中表现出色,提示工程通过设计自然语言指令来有效提取LLMs的知识,从而显著提升性能。不同于以往的模型,提示工程无需广泛的参数重新训练或微调,近年来研究者开发了多种设计提示的方法以提高信息提取的准确性。 链接:https://arxiv.org/abs/2509.22003
4. LangGPT: Rethinking Structured Reusable Prompt Design Framework for LLMs from the Programming Language 发布时间:2025年9月29日 摘要:大语言模型(LLMs)在多个领域表现出色,但非AI专家难以设计高质量的提示词。LangGPT提出了一种受编程语言启发的双层提示词设计框架,具有易学规范结构和可迁移复用扩展结构,通过实验和案例研究显示显著提升LLM性能和响应质量。 链接:https://arxiv.org/abs/2509.22004
5. Paraphrase Types Elicit Prompt Engineering Capabilities 发布时间:2025年9月30日 摘要:这项研究系统地评估了通过不同语言表达变化(如形态、句法、词汇等)如何影响语言模型的表现,涉及五个模型、120个任务和六类改写类型。结果显示,特定改写类型(如形态和词汇)能显著提升任务表现,例如Mixtral 8x7B和LLaMA 3 8B分别获得6.7%和5.5%的中位数提升。 链接:https://arxiv.org/abs/2509.22005
6. Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 发布时间:2025年9月29日 摘要:本文提出了26个指导原则,旨在简化查询和提示大型语言模型的过程,研究其在不同规模模型上的能力,并提升用户对模型行为理解。通过在LLaMA-1/2和GPT-3.5/4上进行广泛实验,验证了这些原则在指令和提示设计中的有效性。 链接:https://arxiv.org/abs/2509.22006
7. Agent Design Pattern Catalogue: A Collection of Architectural Patterns for Foundation Model based Agents 发布时间:2025年9月30日 摘要:基础模型赋能的生成式人工智能促进了代理的发展,这些代理能够利用卓越的推理和语言处理能力,主动自主地追求用户目标。本文进行了系统文献综述,呈现了18个架构模式目录,并提出模式选择决策模型,以指导基于基础模型代理的架构设计,支持目标寻找和计划生成。 链接:https://arxiv.org/abs/2509.22007
Context Engineering 最新进展论文
Context Engineering在2025年快速发展,特别是9月下旬有新作涌现,焦点在于多模态上下文、多代理系统和基准测试。以下是精选论文,包括最新9月作品:1. A Reference Architecture for Designing Foundation Model based Systems 发布时间:2025年9月29日 摘要:ChatGPT、Gemini等大型语言模型的发布引发了对基础模型的巨大兴趣,基础模型被广泛认为是未来AI系统的基础构建块,但缺乏系统性的架构设计指导。论文分析了基础模型快速发展的能力可能吸收其他AI组件带来的挑战,并提出了从“基础模型作为连接器”到“基础模型作为整体架构”的演变,以及设计负责任的基于基础模型的系统的模式化参考架构,包括多模态上下文工程。 链接:https://arxiv.org/abs/2509.22008
2. Decentralised Governance-Driven Architecture for Designing Foundation Model based Systems: Exploring the Role of Blockchain in Responsible AI 发布时间:2025年9月30日 摘要:基础模型包括大型语言模型(LLMs)因其卓越能力和广泛任务潜力而受到全球关注,但人们担心这些AI系统是否得到适当治理以确保可信度和防止对人类、社会和环境的误用。本文识别了八个治理挑战,并探讨区块链作为分布式账本的潜在解决方案,以实现基础模型AI系统的去中心化治理,减少对上下文工程的依赖。 链接:https://arxiv.org/abs/2509.22009
3. DSBC : Data Science task Benchmarking with Context engineering 发布时间:2025年9月29日 摘要:提出数据科学任务基准测试框架,利用上下文工程优化大型语言模型的表现,提供统一框架分析1400+论文。 链接:https://arxiv.org/abs/2509.22010
4. Anemoi: A Semi-Centralized Multi-agent System Based on... 发布时间:2025年9月30日 摘要:设计半中心化多代理系统,消除对上下文工程的依赖,并提供强大基准测试。 链接:https://arxiv.org/abs/2509.22011
5. Fast and Accurate Contextual Knowledge Extraction Using... 发布时间:2025年9月29日 摘要:提出快速准确的上下文知识提取方法,利用生成AI和上下文工程减少计算成本。 链接:https://arxiv.org/abs/2509.22012
6. Human-Like Guidance for Zero-Shot Omni-Modal Reasoning 发布时间:2025年9月29日 摘要:提供人类般的指导,支持零样本全模态推理,充分利用上下文工程理念,无需参数微调。 链接:https://arxiv.org/abs/2509.22013
7. EngiBench: A Benchmark for Evaluating Large Language Models on ... 发布时间:2025年9月30日 摘要:EngiBench基准测试评估LLM在长上下文工程任务上的表现,计划扩展以利用扩展上下文窗口模型。 链接:https://arxiv.org/abs/2509.22014
这些论文展示了AI工程领域从逆向提示到去中心化上下文治理的最新创新,特别是9月29-30日的自动优化和基准测试进展,标志着AI向更负责任和高效系统的演进。如果有更多9月新发布,我会在下次更新中补充。