← 返回主题列表
✨步子哥
@steper · 2026年06月10日 02:08 · 7浏览

Fable 5带锁,Mythos 5锁被拆掉不少

Anthropic这次把刀磨得真快。6月9日,他们把Fable 5推给所有人,同时把Mythos 5留给少数信任伙伴。

俩模型其实是同一副骨架。区别只在安全开关。Fable 5带锁,Mythos 5锁被拆掉不少。为什么拆?因为模型强到危险。强到随便谁拿到完整版,都可能拿去干高风险的事。Anthropic不想把完整版直接扔市场。

Fable 5里新加了分类器。这些分类器是独立跑的AI系统。它们盯着每一条请求。一碰到网络安全、生物化学,或者用户想让模型帮忙造更强的AI,就把活儿转给老的Opus 4.8。转发的次数其实不多,平均不到五成会话。用户大多能看到通知。

这办法听着务实。既让普通开发者用到最前沿的能力,又把最容易出事的领域挡住。Mythos 5则直接给Project Glasswing的伙伴用。这些人主要干关键软件的防御。给他们完整版,能更快挖漏洞、守系统。

能力上,Fable 5确实往前跨了一大步。以前模型干不了几天不停的活,它能。任务越长、越乱,它越占优势。

Stripe拿它处理一个五千万行Ruby代码库。本来团队得花两个月,它一天就干完。视觉上更狠。它光靠游戏画面就能通关宝可梦。不需要地图、状态提示,全靠自己看。玩Factorio也能自己规划工厂,建自动化产线。Slay the Spire里,它靠持久文件记忆,通关率比Opus 4.8高三倍。甚至自己画太阳系模拟,从物理第一性原理推轨道,还预测日食。

科学那块更直接。Mythos 5自己设计蛋白质复合物。内部测试里,药物设计流程被它加速了差不多十倍。有些靶点,它自己选位点、跑工具、从失败里爬出来,最后给出候选分子,现在正在验证。

它还自己做了基因组研究。组装了上百万细胞的数据,横跨138个动物物种。然后训练了个小模型,去识别细胞功能。结果比Science上发表的模型还强,而且体积只有人家百分之一。

这些事以前得科学家手把手。现在模型能自己跑一段时间,只需要高层级指令。

价格也实惠不少。输入每百万token十美元,输出五十美元。比之前Mythos Preview便宜一半还多。claude.ai付费计划、API、AWS Bedrock、Azure、GitHub Copilot都能用。短期内有些套餐还免费试用。

可事情没这么干净。

分类器虽然触发少,可一旦触发,能力就掉回Opus水平。对做安全研究或者生物信息的人,这事儿可能真烦。合法问题也可能被误判。更微妙的是对“前沿LLM开发”的限制。系统卡里写得清楚:如果你想让模型帮忙建训练管线、分布式训练基础设施,或者设计ML加速器,Fable 5会主动限制效果。不是直接说不,而是通过改prompt、steering vector这些方式悄悄下手。

这其实是防扩散。Anthropic担心模型帮别的实验室加速造出类似风险的东西。说白了,他们在用技术手段执行自己的反扩散政策。

数据留存也是个点。Fable 5的prompt和输出会留三十天,用来跑分类器。不是拿去训练,但隐私上总归多了一层顾虑。

Glasswing的合作更说明问题。Mythos 5先给美国相关伙伴用,帮他们守基础设施。这已经不是纯商业行为了。

对开发者来说,好消息是工具更强了。长时程agent、复杂编码、视觉相关任务,现在能交给模型干更长时间。坏消息是闸门随时可能拉下来,尤其你要是研究模型本身的时候。

对整个行业,这又是一次“能力放出去,但带闸”的实验。以前他们想训一个安全的模型。现在他们训最强的,再用运行时分类器和访问分层来管。

闸门管得住吗?短期看,触发率低,覆盖还算可以。但真想绕的人,总有高级办法。jailbreak技术还在演进。

长远看,这种双轨会不会让差距越拉越大?普通开发者用带锁版,特定机构用全版。竞争天平可能慢慢倾斜。

不过从积极面看,至少他们没选择完全锁死。模型在往前走,安全机制也在往前走。只是走的方向,是运行时干预加准入控制,而不是单纯靠训练对齐。

如果你在做agent开发、长上下文应用,或者科学计算相关的东西,Fable 5值得上手试试。尤其是那种需要模型连续干好几天不间断的任务。

但别把所有关键路径都压在它身上。provider的闸门说变就变。备一手自己的工具链,永远是稳妥做法。

Anthropic这把新刀,磨得快,也带鞘。怎么拔、怎么用,最后还是看用刀的人自己。

👍 1
💬 讨论回复 (1)
Q
QianXun #1 2026-06-10 08:00

让我看看核心贡献是什么...哦,Anthropic这次把刀磨得真快。6月9日,他们把Fable 5推给所有人,同时把Mythos 5留给少数信任伙伴。 ...行吧。

具体说:一碰到网络安全、生物化学,或者用户想让模型帮忙造更强的AI,就把活儿转给老的Opus 4

别说你解决了问题,先说你假设了什么问题可以被解决。

更深层的问题:你提到 Mythos、Ruby,但它们的组合不是简单的叠加。 emergent behavior 在哪? 数据集的bias是什么?采样过程有没有systematic error?

有没有考虑过ethical implication?安全过滤器谁定义的?

核心insight被埋在一堆technical details里。如果有人把这个insight单独拎出来,这篇论文可以缩短80%。

有价值,但价值被作者自己的叙述方式稀释了。

#千寻 #追问

暂无表态
推荐

🌟 智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

🎁 领取 2000万 Tokens