一、微软的"不装了"时刻
过去二十年,微软把自己活成了一个"平台"——Windows 是平台,Azure 是平台,Office 也是平台。平台的意思,就是让别人在上面跳舞,自己收租。
但2026年Build大会上,微软突然换了一张脸:一口气发布7个MAI模型,从推理到代码、从图像到语音,全栈自研。更狠的是,他们把MAI模型和自研芯片MAIA 200绑在一起卖,宣称端到端比英伟达GB200便宜30%、省电1.4倍。
这不是技术发布,这是战书。
1. MAI-Thinking-1:微软版"o1"的野心
这是微软第一个推理模型,35B激活参数,256K上下文,AIME 2025考97分。数字好看,但真正的故事不在数字里。
微软反复强调一件事:"我们没蒸馏任何第三方模型。"
这句话在学术圈的分量,相当于一个厨师说"我的汤里没加任何现成调料包"——在AI界,大多数新模型的"秘方"都是蒸馏OpenAI或DeepSeek的能力。微软选择从头炖,不是因为蒸馏不好,而是因为他们想对大企业说:你的数据流向是干净的,没有中间商。
109页技术报告里,他们甚至详细披露了怎么用LLM judge(让模型给训练数据打分)筛选数据。这等于公开承认:未来的训练,不只是堆算力,而是让AI自己给自己挑教材。
2. 代码模型:从Copilot的"副驾驶"到"主驾驶"
MAI-Code-1-Flash只有5B参数,但SWE-Bench Pro做到51%。小模型干大活,目标明确:给VS Code和Copilot CLI用,快、便宜、不卡。
但更大的信号是GitHub Copilot App的登场——微软不再想把Copilot定位为"补全工具",而是"开发者的Agent中枢"。它串起了CLI、移动端、Web、本地和云端,意思很明确:未来开发者的工作入口不是IDE,而是Copilot。
这让我想起一个老比喻:以前AI是程序员的副驾驶,现在它想坐驾驶座。问题是,程序员还没准备好交出方向盘。
二、Agent的"桌面争夺战"
2026年的AI圈, hottest war不在云端,而在你的桌面。
1. Claude Platform CLI:Anthropic的终端执念
Anthropic推出了Claude Platform CLI,同时把/fork做成可在后台跑的Agent。这不像是一次功能更新,更像是一次宣言:重度开发者不需要聊天界面,他们需要一个24小时待命的自动化助手。
但Anthropic也吃了一次教训:Claude Code的并行子Agent曾经异常狂跑,几小时内耗光用户的周额度。他们被迫重置所有Pro和Max用户的限额。这暴露了一个被低估的问题:Agent系统的失控成本是真实的,而且很高。
2. Devin Desktop 与 Hermes Desktop:两条路线的分野
Cognition的Devin Desktop和Nous的Hermes Desktop几乎同时发布,但方向不同:
- Devin Desktop想做"Agent中立"的操作台,不管背后是什么Agent,统一管规划、执行和交接。
- Hermes Desktop走本地优先路线,接Tailscale和Ollama,目标是不依赖云端。
这两条路线就像智能手机早期:iOS走封闭生态,Android走开放联盟。谁对谁错?现在还太早。但可以确定的是,你的桌面正在成为AI的下一个战场。
3. OpenAI Codex 的"最后一段路"
Codex新增Sites功能,能把文档、想法直接变成带认证和动态数据的内部应用。插件生态也扩展到62个应用、110个技能。
OpenAI的打法很清晰:不跟你拼模型参数,而是拼"从写代码到交付"的完整链路。企业用户要的不是一个会写代码的AI,而是一个能直接把代码变成内部系统的AI。
三、DeepMind Co-Scientist:科研Agent的成人礼
Google DeepMind的Co-Scientist可能是这次更新中最被低估的。
它不是一个聊天机器人,而是一个由多个Agent组成的科研团队——有的负责生成假设,有的负责筛选,有的负责验证。DeepMind声称它已经在肝纤维化、ALS和衰老研究中参与了真实合作。
科研Agent和客服Agent的区别在于:客服对错有标准答案,科研没有。让AI参与真实科学发现,意味着它不仅要"会搜索",还要"会判断什么值得被搜索"。这是从"工具"到"协作者"的跨越。
但也引发了一个微妙的问题:如果AI提出了一个被验证的科研假设,论文的署名权怎么算?这个伦理问题,可能比技术问题更持久。
四、几个值得关注的小信号
-
Wall Attention:Tilde Research提出了一种不依赖RoPE的注意力方法,训练4K上下文就能泛化到200K+。长文本推理的突破口,可能不只在堆参数。
-
Perplexity的混合推理:本地能跑的先本地跑,省token又保隐私。这种"混合架构"可能成为接下来所有AI产品的默认设计。
-
开放权重模型的崛起:OpenRouter数据显示,开放权重模型已占69.1%的token量。开源生态的重心,正在从"追赶闭源"变成"超越闭源"。
-
Bernie Sanders的AI主权基金:想把AI创造的财富分给公众。想法浪漫,执行困难。但它代表了一种新思潮:AI不是只属于科技公司的矿,而是公共资源。
五、一个观察
今天的新闻里,有一个共同点:所有人都在从"做模型"转向"做系统"。
微软做芯片+模型+平台,GitHub做开发入口,OpenAI做企业工作流,Anthropic做开发者工具。单点能力已经不够了,未来的竞争是"谁能让AI在你的工作流里活得更深"。
对普通人来说,这意味着:选AI工具时,不要只看它"多聪明",要看它"能不能在你的世界里住下来"。
#easy-learn-ai #每日更新 #AI行业动态 #微软Build #Agent #小凯
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。