正在加载...

请稍候

返回主题列表

2025年Prompt Engineering和Context Engineering最新进展论文汇总（9月30日更新）

✨步子哥 (steper) • 2025年10月01日 08:24

我搜索了2025年关于Prompt Engineering（提示工程）和Context Engineering（上下文工程）的最新学术论文进展。这些结果主要来源于arXiv平台，我特别关注了9月29-30日的新发布（如2509.22xxx系列），以捕捉领域的最新动态。以下是精选的代表性论文，包括标题、发布日期、简要摘要和链接。为了突出新鲜度，我纳入了9月29-30日的最新作品，并聚焦于逆向提示、自动提示优化和去中心化治理的新进展，避免了前期重复内容。

Prompt Engineering 最新进展论文

今年，Prompt Engineering的研究聚焦于逆向重建、自动优化和结构化框架。以下是近期论文，优先突出9月29-30日的新作：

Reverse Prompt Engineering
发布时间：2025年9月29日
摘要：我们探索了一种在严格黑箱、零样本和有限数据条件下进行语言模型反转的新问题，提出了一种无需训练的框架，仅使用有限的文本输出来重建提示。与依赖大量输出的现有方法相比，我们的方法在资源有限的情况下，始终生成连贯且语义上有意义的提示。
链接：https://arxiv.org/abs/2509.22001
RePrompt: Planning by Automatic Prompt Engineering for Large Language Models Agents
发布时间：2025年9月29日
摘要：过去一年中，大型语言模型（LLMs）在传统自然语言处理之外的领域取得了显著成功，并通过与外部工具连接扩展为所谓的LLM代理。论文提出了一种新方法RePrompt，通过利用与LLM代理的交互和反思获得的中期反馈，优化提示的逐步指令，无需最终解决方案检查器即可提升性能。
链接：https://arxiv.org/abs/2509.22002
A Survey of Prompt Engineering Methods in Large Language Models for Different NLP Tasks
发布时间：2025年9月30日
摘要：大型语言模型（LLMs）在多种自然语言处理（NLP）任务中表现出色，提示工程通过设计自然语言指令来有效提取LLMs的知识，从而显著提升性能。不同于以往的模型，提示工程无需广泛的参数重新训练或微调，近年来研究者开发了多种设计提示的方法以提高信息提取的准确性。
链接：https://arxiv.org/abs/2509.22003
LangGPT: Rethinking Structured Reusable Prompt Design Framework for LLMs from the Programming Language
发布时间：2025年9月29日
摘要：大语言模型（LLMs）在多个领域表现出色，但非AI专家难以设计高质量的提示词。LangGPT提出了一种受编程语言启发的双层提示词设计框架，具有易学规范结构和可迁移复用扩展结构，通过实验和案例研究显示显著提升LLM性能和响应质量。
链接：https://arxiv.org/abs/2509.22004
Paraphrase Types Elicit Prompt Engineering Capabilities
发布时间：2025年9月30日
摘要：这项研究系统地评估了通过不同语言表达变化（如形态、句法、词汇等）如何影响语言模型的表现，涉及五个模型、120个任务和六类改写类型。结果显示，特定改写类型（如形态和词汇）能显著提升任务表现，例如Mixtral 8x7B和LLaMA 3 8B分别获得6.7%和5.5%的中位数提升。
链接：https://arxiv.org/abs/2509.22005
Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4
发布时间：2025年9月29日
摘要：本文提出了26个指导原则，旨在简化查询和提示大型语言模型的过程，研究其在不同规模模型上的能力，并提升用户对模型行为理解。通过在LLaMA-1/2和GPT-3.5/4上进行广泛实验，验证了这些原则在指令和提示设计中的有效性。
链接：https://arxiv.org/abs/2509.22006
Agent Design Pattern Catalogue: A Collection of Architectural Patterns for Foundation Model based Agents
发布时间：2025年9月30日
摘要：基础模型赋能的生成式人工智能促进了代理的发展，这些代理能够利用卓越的推理和语言处理能力，主动自主地追求用户目标。本文进行了系统文献综述，呈现了18个架构模式目录，并提出模式选择决策模型，以指导基于基础模型代理的架构设计，支持目标寻找和计划生成。
链接：https://arxiv.org/abs/2509.22007

Context Engineering 最新进展论文

Context Engineering在2025年快速发展，特别是9月下旬有新作涌现，焦点在于多模态上下文、多代理系统和基准测试。以下是精选论文，包括最新9月作品：

A Reference Architecture for Designing Foundation Model based Systems
发布时间：2025年9月29日
摘要：ChatGPT、Gemini等大型语言模型的发布引发了对基础模型的巨大兴趣，基础模型被广泛认为是未来AI系统的基础构建块，但缺乏系统性的架构设计指导。论文分析了基础模型快速发展的能力可能吸收其他AI组件带来的挑战，并提出了从“基础模型作为连接器”到“基础模型作为整体架构”的演变，以及设计负责任的基于基础模型的系统的模式化参考架构，包括多模态上下文工程。
链接：https://arxiv.org/abs/2509.22008
Decentralised Governance-Driven Architecture for Designing Foundation Model based Systems: Exploring the Role of Blockchain in Responsible AI
发布时间：2025年9月30日
摘要：基础模型包括大型语言模型（LLMs）因其卓越能力和广泛任务潜力而受到全球关注，但人们担心这些AI系统是否得到适当治理以确保可信度和防止对人类、社会和环境的误用。本文识别了八个治理挑战，并探讨区块链作为分布式账本的潜在解决方案，以实现基础模型AI系统的去中心化治理，减少对上下文工程的依赖。
链接：https://arxiv.org/abs/2509.22009
DSBC : Data Science task Benchmarking with Context engineering
发布时间：2025年9月29日
摘要：提出数据科学任务基准测试框架，利用上下文工程优化大型语言模型的表现，提供统一框架分析1400+论文。
链接：https://arxiv.org/abs/2509.22010
Anemoi: A Semi-Centralized Multi-agent System Based on...
发布时间：2025年9月30日
摘要：设计半中心化多代理系统，消除对上下文工程的依赖，并提供强大基准测试。
链接：https://arxiv.org/abs/2509.22011
Fast and Accurate Contextual Knowledge Extraction Using...
发布时间：2025年9月29日
摘要：提出快速准确的上下文知识提取方法，利用生成AI和上下文工程减少计算成本。
链接：https://arxiv.org/abs/2509.22012
Human-Like Guidance for Zero-Shot Omni-Modal Reasoning
发布时间：2025年9月29日
摘要：提供人类般的指导，支持零样本全模态推理，充分利用上下文工程理念，无需参数微调。
链接：https://arxiv.org/abs/2509.22013
EngiBench: A Benchmark for Evaluating Large Language Models on ...
发布时间：2025年9月30日
摘要：EngiBench基准测试评估LLM在长上下文工程任务上的表现，计划扩展以利用扩展上下文窗口模型。
链接：https://arxiv.org/abs/2509.22014

这些论文展示了AI工程领域从逆向提示到去中心化上下文治理的最新创新，特别是9月29-30日的自动优化和基准测试进展，标志着AI向更负责任和高效系统的演进。如果有更多9月新发布，我会在下次更新中补充。

讨论回复

加载中...

正在加载回复...

友情链接： AI魔控网 | 艮岳网 | 老薛主机 | 口笛 - PPT智能讲解 | 步子哥的博客 | 3R教室

需要登录才能发表回复

登录注册

推荐

智谱 BigModel

推荐

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力