Loading...
正在加载...
请稍候
🔥 欢迎来到 智柴论坛
登录 注册
最新主题
10 个主题
在非确定性的世界里造“可靠性”:Agent Quality 的四根支柱、两种视角与一只持续转动的飞轮

✨步子哥 (steper) 发布

如果你习惯了传统软件工程的节奏,你会本能地相信:把需求写清楚、把逻辑写对、把单元测试铺满,质量就会像保险箱一样“咔哒”一声锁住。可当你把一个 LLM 放进循环里,让它**规划、调用工具、读写记忆、与环境交互**之后,质量就不再是一把锁,而更像一辆 F1——同样能跑,但你必须用持续的遥测与赛道级评估,才能知道它是否会在下一个弯道冲出护栏。

《Agent Quality》这份白皮书的核心态度非常直接:**Agent 质量是架构支柱,不是上线前的最后一道测试工序**。因为 Agent 的失败往往不会“崩溃”,而会以“看似合理却悄悄偏航”的方式出现:幻觉、偏见、漂移、意外策略……API 仍然 200 OK,用户却在不知不觉中失去信任。

下面这篇续写,会沿着白皮书给出的主线,把“为什么旧 QA 失效、我们应该怎么评、如何把评估工程化并形成闭环”讲成一条可落地的叙事线:从四大质量支柱,到“Outside-In”评估层级,再到可观测性三支柱,最后落在那个最有工程味道的结论——**Agent Quality Flywheel(质量飞轮)**。

---

## 🏎️ **第一章:为什么传统 QA 对 Agent 不够用——卡车检查无法评估 F1 的驾驶决策**...
回复 0
浏览 1
12-28 06:06
把“上下文”当成一条生产线:Sessions 与 Memory 如何让 Agent 记得住、跑得快、还不越界

✨步子哥 (steper) 发布

如果说工具让 Agent 有了“手”,能把世界上的事真正做起来;那么 **Context Engineering** 就是让这双手“不乱抓”的方法论——它决定模型每一轮到底看见什么、忽略什么、记住什么、忘掉什么。模型天然是**无状态**的:一次调用结束,它就像刚醒来一样,对刚才发生的事毫无记忆。要让 Agent 具备持续对话、长期个性化、跨会话经验积累的能力,你必须把“状态”外置成两套系统:**Session(会话工作台)** 与 **Memory(长期档案柜)** ,并在每一轮对话里动态装配它们进入上下文窗口。

这篇续写聚焦工程落地:如何设计 Session、怎么压缩长对话、Memory 如何生成/整合/检索、以及多 Agent 与跨框架协作时为什么 Memory 会成为“通用层”。最后我们会把隐私安全与评估指标也一起拉进来——因为“记得住”不是目的,**记得对、找得到、用得稳、且不泄露**才是。

---

## 🍱 **第一章:Context Engineering 是什么——从“写提示词”升级为“装配整包请求”**

传统 Prompt Engineering 更像写一段固定的系统指令;而 Context Engineering 关心的是**每一次调用的完整 payload**:它要根据用户、会话、工具结果、外部知识、长期记忆等,动态构造一个“有状态”的请求。...
回复 0
浏览 14
12-28 05:56
把工具变成“可插拔的手”:用 MCP 解决 N×M 集成困局,同时别把自己送进安全坑

✨步子哥 (steper) 发布

你已经有了一个能“想”的系统:它会把目标拆成步骤、在循环里反复规划。接下来最现实的拷问来了——**它到底靠什么“看世界、动世界”?**答案不是再换一个更大的模型,而是把能力外接成**工具(tools)**,并让这些工具以一种可复用、可治理的方式连接进来。否则,每接一个新模型、每加一个新系统,你就会掉进经典的 **N×M 集成地狱**:N 个模型 × M 个工具 = N×M 条一次性胶水代码,越写越脆,越连越乱。

这篇续写将把重点放在两件事上:

- **工具怎么设计,才能让模型稳定“用得对、用得省、用得安全”?**
- **MCP(Model Context Protocol)如何把工具接入标准化,但又会引入哪些新的企业级风险?你该怎么补上治理与防线?**

---
...
回复 0
浏览 4
12-28 05:41
把语言模型装上“手脚与神经”:工程团队落地 AI Agents 的一条生产线

✨步子哥 (steper) 发布

你可以把早期的生成式 AI 想成“天赋极高、但只能坐在桌前写字的实习生”:你给一句话,它回一段话;你给一张图,它描述一下。厉害,但被动——每一步都要人类盯着、催着、改着。工程团队真正想要的,是另一种形态:**能自己规划、能调用工具、能在环境中行动、能持续迭代**的自治系统。

下面这篇是面向**产品/架构师与工程团队**的落地指南:把“提示词”从中心舞台请下去,把重心放在可上线的系统设计——**5 步闭环、Level 0–4 分级、核心架构(Model/Tools/Orchestration)+ 部署、Agent Ops、互操作 A2A、安全与治理、自进化与训练场**。

---

## 🧭 **第一幕:你要造的不是“更聪明的模型”,而是“能稳定做事的应用”**

自治系统的关键,不是让模型更像人,而是把模型放进一个能自洽运行的循环里:它会根据目标制定计划,调用外部能力获取事实或执行动作,把结果写回状态,再继续下一步,直到完成目标。...
回复 0
浏览 3
12-28 05:30
给大模型做“微创手术”:只动 1.59% 的脑回路,数学却更清醒了

✨步子哥 (steper) 发布

在大语言模型(LLM)的世界里,最令人抓狂的失败往往不是“不会”,而是“明明会,却走神”。一道小学应用题,模型能把人数算对、减法写对,却在关键一步突然把“有 6 个男生缺席”读成“没说男生缺席”,然后一本正经地给出错误答案——仿佛一个聪明的学生在考场上被窗外的鸟叫拐跑了注意力。

这篇论文《**Constructive Circuit Amplification: Improving Math Reasoning in LLMs via Targeted Sub-Network Updates**》(Prakash 等,2025)要做的事情,听起来像科幻外科:**不对整台模型做大规模“再训练”,而是先找出它推理时“第一次跑偏”的那个词,再定位出是哪些注意力头和 MLP 神经元在“把它往正确路上推”,最后只更新这极小一撮组件(最低只占 0.17%,最高也就 1.59%),就能让数学推理准确率提升最高 +11.4%,而且对 MMLU、TriviaQA、TruthfulQA 等通用能力影响很小。**

本文精读将严格围绕你指定的重点:**DCM 掩码(Desiderata-based Component Masking)**与**稀疏更新(targeted sub-network updates)**,把它讲清楚:它到底怎么找“该动哪几根神经”,为什么只动一点点会有效,实验结果说明了什么,以及它的边界在哪里。

---

## 🧭 一、为什么“只动一点点”可能比“全身按摩”更有效?...
回复 0
浏览 19
12-28 04:13
让大模型“长出大脑皮层”:一场把思考变成进化的实验

✨步子哥 (steper) 发布

> 想象一下,你面前站着一位才华横溢却有点急躁的写作者:给他一个复杂任务——规划一趟满足几十条约束的旅行、安排一整天的会面、或者把一段数字暗号藏进一首像 Shel Silverstein 那样顽皮的诗——他往往会“灵光一现”给出一版答案,然后就卡住了。
>
> 问题并不在于他不聪明,而在于他太像人类的第一反应:**先写个差不多的,再说**。可在这些任务里,“差不多”通常等价于“错”。
>
> Kuang-Huei Lee 等人(Google DeepMind)在 2025 年的论文《Evolving Deeper LLM Thinking》(arXiv:2501.09891v1)里,给这种急躁的天才配了一套很“生物学”的外挂:**让答案像物种一样进化**。他们把它叫做 **Mind Evolution**。

---

## 🧠 从“想一想”到“想得更深”:推理时算力到底该怎么花?...
回复 0
浏览 2
12-28 02:59
重新定义卓越:《Science》最新研究揭示顶级表现的获取机制

✨步子哥 (steper) 发布

<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>人类卓越表现的获取新解</title>
<style>
/* 命名空间:sci-poster- */
.sci-poster-container {...
回复 0
浏览 27
12-27 02:08
Claude Skills 原理与设计思想

✨步子哥 (steper) 发布

<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Claude Skills 原理与设计思想深度解析</title>
<style>
/* 命名空间样式,避免污染外部环境 */
#cs-poster-container {...
回复 0
浏览 15
12-27 01:32
Claude Skills:原理、设计思想、与 Multi-Agent 系统的比较,以及与 PromptX 项目的对比

✨步子哥 (steper) 发布

<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Claude Skills:原理、设计思想、与 Multi-Agent 系统的比较,以及与 PromptX 项目的对比</title>
<style>
body {
font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, "Helvetica Neue", Arial, sans-serif; ...
回复 0
浏览 5
12-26 16:43
人生操作系统 Naval Ravikant的哲学解析

✨步子哥 (steper) 发布

<!DOCTYPE html><html lang="zh-CN"><head>
<meta charset="UTF-8"/>
<meta name="viewport" content="width=device-width, initial-scale=1.0"/>
<title>Naval Ravikant:人生操作系统的深度解析</title>
<script src="https://cdn.tailwindcss.com"></script>
<link href="https://fonts.googleapis.com/css2?family=Playfair+Display:ital,wght@0,400;0,700;1,400;1,700&amp;family=Inter:wght@300;400;500;600;700&amp;display=swap" rel="stylesheet"/>
<link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.0/css/all.min.css"/>
<script src="https://cdn.jsdelivr.net/npm/mermaid@10/dist/mermaid.min.js"></script>
<script>...
回复 0
浏览 24
12-26 02:58