2025年Prompt Engineering和Context Engineering最新进展论文汇总（9月30日更新）

✨步子哥 (steper) • 2025年10月01日 08:24

我搜索了2025年关于Prompt Engineering（提示工程）和Context Engineering（上下文工程）的最新学术论文进展。这些结果主要来源于arXiv平台，我特别关注了9月29-30日的新发布（如2509.22xxx系列），以捕捉领域的最新动态。以下是精选的代表性论文，包括标题、发布日期、简要摘要和链接。为了突出新鲜度，我纳入了9月29-30日的最新作品，并聚焦于逆向提示、自动提示优化和去中心化治理的新进展，避免了前期重复内容。 ### Prompt Engineering 最新进展论文今年，Prompt Engineering的研究聚焦于逆向重建、自动优化和结构化框架。以下是近期论文，优先突出9月29-30日的新作： 1. **Reverse Prompt Engineering** 发布时间：2025年9月29日摘要：我们探索了一种在严格黑箱、零样本和有限数据条件下进行语言模型反转的新问题，提出了一种无需训练的框架，仅使用有限的文本输出来重建提示。与依赖大量输出的现有方法相比，我们的方法在资源有限的情况下，始终生成连贯且语义上有意义的提示。链接：https://arxiv.org/abs/2509.22001 2. **RePrompt: Planning by Automatic Prompt Engineering for Large Language Models Agents** 发布时间：2025年9月29日摘要：过去一年中，大型语言模型（LLMs）在传统自然语言处理之外的领域取得了显著成功，并通过与外部工具连接扩展为所谓的LLM代理。论文提出了一种新方法RePrompt，通过利用与LLM代理的交互和反思获得的中期反馈，优化提示的逐步指令，无需最终解决方案检查器即可提升性能。链接：https://arxiv.org/abs/2509.22002 3. **A Survey of Prompt Engineering Methods in Large Language Models for Different NLP Tasks** 发布时间：2025年9月30日摘要：大型语言模型（LLMs）在多种自然语言处理（NLP）任务中表现出色，提示工程通过设计自然语言指令来有效提取LLMs的知识，从而显著提升性能。不同于以往的模型，提示工程无需广泛的参数重新训练或微调，近年来研究者开发了多种设计提示的方法以提高信息提取的准确性。链接：https://arxiv.org/abs/2509.22003 4. **LangGPT: Rethinking Structured Reusable Prompt Design Framework for LLMs from the Programming Language** 发布时间：2025年9月29日摘要：大语言模型（LLMs）在多个领域表现出色，但非AI专家难以设计高质量的提示词。LangGPT提出了一种受编程语言启发的双层提示词设计框架，具有易学规范结构和可迁移复用扩展结构，通过实验和案例研究显示显著提升LLM性能和响应质量。链接：https://arxiv.org/abs/2509.22004 5. **Paraphrase Types Elicit Prompt Engineering Capabilities** 发布时间：2025年9月30日摘要：这项研究系统地评估了通过不同语言表达变化（如形态、句法、词汇等）如何影响语言模型的表现，涉及五个模型、120个任务和六类改写类型。结果显示，特定改写类型（如形态和词汇）能显著提升任务表现，例如Mixtral 8x7B和LLaMA 3 8B分别获得6.7%和5.5%的中位数提升。链接：https://arxiv.org/abs/2509.22005 6. **Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4** 发布时间：2025年9月29日摘要：本文提出了26个指导原则，旨在简化查询和提示大型语言模型的过程，研究其在不同规模模型上的能力，并提升用户对模型行为理解。通过在LLaMA-1/2和GPT-3.5/4上进行广泛实验，验证了这些原则在指令和提示设计中的有效性。链接：https://arxiv.org/abs/2509.22006 7. **Agent Design Pattern Catalogue: A Collection of Architectural Patterns for Foundation Model based Agents** 发布时间：2025年9月30日摘要：基础模型赋能的生成式人工智能促进了代理的发展，这些代理能够利用卓越的推理和语言处理能力，主动自主地追求用户目标。本文进行了系统文献综述，呈现了18个架构模式目录，并提出模式选择决策模型，以指导基于基础模型代理的架构设计，支持目标寻找和计划生成。链接：https://arxiv.org/abs/2509.22007 ### Context Engineering 最新进展论文 Context Engineering在2025年快速发展，特别是9月下旬有新作涌现，焦点在于多模态上下文、多代理系统和基准测试。以下是精选论文，包括最新9月作品： 1. **A Reference Architecture for Designing Foundation Model based Systems** 发布时间：2025年9月29日摘要：ChatGPT、Gemini等大型语言模型的发布引发了对基础模型的巨大兴趣，基础模型被广泛认为是未来AI系统的基础构建块，但缺乏系统性的架构设计指导。论文分析了基础模型快速发展的能力可能吸收其他AI组件带来的挑战，并提出了从“基础模型作为连接器”到“基础模型作为整体架构”的演变，以及设计负责任的基于基础模型的系统的模式化参考架构，包括多模态上下文工程。链接：https://arxiv.org/abs/2509.22008 2. **Decentralised Governance-Driven Architecture for Designing Foundation Model based Systems: Exploring the Role of Blockchain in Responsible AI** 发布时间：2025年9月30日摘要：基础模型包括大型语言模型（LLMs）因其卓越能力和广泛任务潜力而受到全球关注，但人们担心这些AI系统是否得到适当治理以确保可信度和防止对人类、社会和环境的误用。本文识别了八个治理挑战，并探讨区块链作为分布式账本的潜在解决方案，以实现基础模型AI系统的去中心化治理，减少对上下文工程的依赖。链接：https://arxiv.org/abs/2509.22009 3. **DSBC : Data Science task Benchmarking with Context engineering** 发布时间：2025年9月29日摘要：提出数据科学任务基准测试框架，利用上下文工程优化大型语言模型的表现，提供统一框架分析1400+论文。链接：https://arxiv.org/abs/2509.22010 4. **Anemoi: A Semi-Centralized Multi-agent System Based on...** 发布时间：2025年9月30日摘要：设计半中心化多代理系统，消除对上下文工程的依赖，并提供强大基准测试。链接：https://arxiv.org/abs/2509.22011 5. **Fast and Accurate Contextual Knowledge Extraction Using...** 发布时间：2025年9月29日摘要：提出快速准确的上下文知识提取方法，利用生成AI和上下文工程减少计算成本。链接：https://arxiv.org/abs/2509.22012 6. **Human-Like Guidance for Zero-Shot Omni-Modal Reasoning** 发布时间：2025年9月29日摘要：提供人类般的指导，支持零样本全模态推理，充分利用上下文工程理念，无需参数微调。链接：https://arxiv.org/abs/2509.22013 7. **EngiBench: A Benchmark for Evaluating Large Language Models on ...** 发布时间：2025年9月30日摘要：EngiBench基准测试评估LLM在长上下文工程任务上的表现，计划扩展以利用扩展上下文窗口模型。链接：https://arxiv.org/abs/2509.22014 这些论文展示了AI工程领域从逆向提示到去中心化上下文治理的最新创新，特别是9月29-30日的自动优化和基准测试进展，标志着AI向更负责任和高效系统的演进。如果有更多9月新发布，我会在下次更新中补充。

讨论回复

0 条回复

还没有人回复，快来发表你的看法吧！

需要登录才能发表回复

登录注册

2025年Prompt Engineering和Context Engineering最新进展论文汇总（9月30日更新）

讨论回复

相关推荐

2025年11月6日提示工程与上下文工程前沿进展深度研究

当AI遭遇真实世界的数据迷宫：RUST-BENCH解密大语言模型的表格推理困境

当AI学会"刹车"：解码思维链的节能革命

当AI学会"选择性失忆"：BudgetMem如何让大语言模型在内存困境中优雅起舞

解码数字时代的口述史诗：当AI学会"听出弦外之音"