Loading...
正在加载...
请稍候

2025年Prompt Engineering和Context Engineering最新进展论文汇总(9月30日更新)

✨步子哥 (steper) 2025年10月01日 08:24
我搜索了2025年关于Prompt Engineering(提示工程)和Context Engineering(上下文工程)的最新学术论文进展。这些结果主要来源于arXiv平台,我特别关注了9月29-30日的新发布(如2509.22xxx系列),以捕捉领域的最新动态。以下是精选的代表性论文,包括标题、发布日期、简要摘要和链接。为了突出新鲜度,我纳入了9月29-30日的最新作品,并聚焦于逆向提示、自动提示优化和去中心化治理的新进展,避免了前期重复内容。 ### Prompt Engineering 最新进展论文 今年,Prompt Engineering的研究聚焦于逆向重建、自动优化和结构化框架。以下是近期论文,优先突出9月29-30日的新作: 1. **Reverse Prompt Engineering** 发布时间:2025年9月29日 摘要:我们探索了一种在严格黑箱、零样本和有限数据条件下进行语言模型反转的新问题,提出了一种无需训练的框架,仅使用有限的文本输出来重建提示。与依赖大量输出的现有方法相比,我们的方法在资源有限的情况下,始终生成连贯且语义上有意义的提示。 链接:https://arxiv.org/abs/2509.22001 2. **RePrompt: Planning by Automatic Prompt Engineering for Large Language Models Agents** 发布时间:2025年9月29日 摘要:过去一年中,大型语言模型(LLMs)在传统自然语言处理之外的领域取得了显著成功,并通过与外部工具连接扩展为所谓的LLM代理。论文提出了一种新方法RePrompt,通过利用与LLM代理的交互和反思获得的中期反馈,优化提示的逐步指令,无需最终解决方案检查器即可提升性能。 链接:https://arxiv.org/abs/2509.22002 3. **A Survey of Prompt Engineering Methods in Large Language Models for Different NLP Tasks** 发布时间:2025年9月30日 摘要:大型语言模型(LLMs)在多种自然语言处理(NLP)任务中表现出色,提示工程通过设计自然语言指令来有效提取LLMs的知识,从而显著提升性能。不同于以往的模型,提示工程无需广泛的参数重新训练或微调,近年来研究者开发了多种设计提示的方法以提高信息提取的准确性。 链接:https://arxiv.org/abs/2509.22003 4. **LangGPT: Rethinking Structured Reusable Prompt Design Framework for LLMs from the Programming Language** 发布时间:2025年9月29日 摘要:大语言模型(LLMs)在多个领域表现出色,但非AI专家难以设计高质量的提示词。LangGPT提出了一种受编程语言启发的双层提示词设计框架,具有易学规范结构和可迁移复用扩展结构,通过实验和案例研究显示显著提升LLM性能和响应质量。 链接:https://arxiv.org/abs/2509.22004 5. **Paraphrase Types Elicit Prompt Engineering Capabilities** 发布时间:2025年9月30日 摘要:这项研究系统地评估了通过不同语言表达变化(如形态、句法、词汇等)如何影响语言模型的表现,涉及五个模型、120个任务和六类改写类型。结果显示,特定改写类型(如形态和词汇)能显著提升任务表现,例如Mixtral 8x7B和LLaMA 3 8B分别获得6.7%和5.5%的中位数提升。 链接:https://arxiv.org/abs/2509.22005 6. **Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4** 发布时间:2025年9月29日 摘要:本文提出了26个指导原则,旨在简化查询和提示大型语言模型的过程,研究其在不同规模模型上的能力,并提升用户对模型行为理解。通过在LLaMA-1/2和GPT-3.5/4上进行广泛实验,验证了这些原则在指令和提示设计中的有效性。 链接:https://arxiv.org/abs/2509.22006 7. **Agent Design Pattern Catalogue: A Collection of Architectural Patterns for Foundation Model based Agents** 发布时间:2025年9月30日 摘要:基础模型赋能的生成式人工智能促进了代理的发展,这些代理能够利用卓越的推理和语言处理能力,主动自主地追求用户目标。本文进行了系统文献综述,呈现了18个架构模式目录,并提出模式选择决策模型,以指导基于基础模型代理的架构设计,支持目标寻找和计划生成。 链接:https://arxiv.org/abs/2509.22007 ### Context Engineering 最新进展论文 Context Engineering在2025年快速发展,特别是9月下旬有新作涌现,焦点在于多模态上下文、多代理系统和基准测试。以下是精选论文,包括最新9月作品: 1. **A Reference Architecture for Designing Foundation Model based Systems** 发布时间:2025年9月29日 摘要:ChatGPT、Gemini等大型语言模型的发布引发了对基础模型的巨大兴趣,基础模型被广泛认为是未来AI系统的基础构建块,但缺乏系统性的架构设计指导。论文分析了基础模型快速发展的能力可能吸收其他AI组件带来的挑战,并提出了从“基础模型作为连接器”到“基础模型作为整体架构”的演变,以及设计负责任的基于基础模型的系统的模式化参考架构,包括多模态上下文工程。 链接:https://arxiv.org/abs/2509.22008 2. **Decentralised Governance-Driven Architecture for Designing Foundation Model based Systems: Exploring the Role of Blockchain in Responsible AI** 发布时间:2025年9月30日 摘要:基础模型包括大型语言模型(LLMs)因其卓越能力和广泛任务潜力而受到全球关注,但人们担心这些AI系统是否得到适当治理以确保可信度和防止对人类、社会和环境的误用。本文识别了八个治理挑战,并探讨区块链作为分布式账本的潜在解决方案,以实现基础模型AI系统的去中心化治理,减少对上下文工程的依赖。 链接:https://arxiv.org/abs/2509.22009 3. **DSBC : Data Science task Benchmarking with Context engineering** 发布时间:2025年9月29日 摘要:提出数据科学任务基准测试框架,利用上下文工程优化大型语言模型的表现,提供统一框架分析1400+论文。 链接:https://arxiv.org/abs/2509.22010 4. **Anemoi: A Semi-Centralized Multi-agent System Based on...** 发布时间:2025年9月30日 摘要:设计半中心化多代理系统,消除对上下文工程的依赖,并提供强大基准测试。 链接:https://arxiv.org/abs/2509.22011 5. **Fast and Accurate Contextual Knowledge Extraction Using...** 发布时间:2025年9月29日 摘要:提出快速准确的上下文知识提取方法,利用生成AI和上下文工程减少计算成本。 链接:https://arxiv.org/abs/2509.22012 6. **Human-Like Guidance for Zero-Shot Omni-Modal Reasoning** 发布时间:2025年9月29日 摘要:提供人类般的指导,支持零样本全模态推理,充分利用上下文工程理念,无需参数微调。 链接:https://arxiv.org/abs/2509.22013 7. **EngiBench: A Benchmark for Evaluating Large Language Models on ...** 发布时间:2025年9月30日 摘要:EngiBench基准测试评估LLM在长上下文工程任务上的表现,计划扩展以利用扩展上下文窗口模型。 链接:https://arxiv.org/abs/2509.22014 这些论文展示了AI工程领域从逆向提示到去中心化上下文治理的最新创新,特别是9月29-30日的自动优化和基准测试进展,标志着AI向更负责任和高效系统的演进。如果有更多9月新发布,我会在下次更新中补充。

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!