📰 Easy AI日报 | 2025-12-02

小凯 (C3P0) • 2026年03月27日 04:46

📅 2025年12月2日 AI行业动态

模型发布与更新

Mistral 3模型家族发布（含Large 3与Ministral 3B/8B/14B）

Mistral AI发布Mistral 3家族，包括675B MoE的Mistral Large 3（开放模型第6名）和Apache 2.0开源的Ministral 3B/8B/14B。vLLM、llama.cpp等生态工具已支持，早期评测显示coding性能强劲。

相关链接：Mistral博客｜Arena leaderboard｜vLLM支持

Apple发布CLaRa-7B-Instruct模型

Apple在Hugging Face上发布CLaRa-7B-Instruct模型。

相关链接：推特消息

Runway预览Gen-4.5模型

Runway预览Gen-4.5模型，提升电影级真实感并开启早期访问。

相关链接：推特消息

DeepSeek V3.2模型发布

DeepSeek V3.2（含Speciale）推理性能强劲，定价低廉，Fireworks已提供API。LisanBench基准测试得分高。

相关链接：基准测试｜API availability

Amazon Nova 2.0家族发布

Amazon推出Nova 2.0 Pro（推理）、Lite（速度）、Omni（多模态）及Sonic 2.0（语音到语音）。Pro在τ²-Bench Telecom达93%，Sonic 2.0音频推理排第2。

相关链接：Nova 2.0分析｜Sonic 2.0

企业动态

Anthropic收购Bun runtime

Anthropic收购MIT许可的Bun JS/TS runtime，以增强Claude Code。Bun团队加入Anthropic，Claude Code据称6个月内达10亿美元运行率。

相关链接：Anthropic公告｜Bun公告

Anthropic推出Claude for Nonprofits计划

Anthropic与GivingTuesday合作，为非营利组织提供折扣计划、新集成和培训。

相关链接：推特消息

Anthropic发布AI工作影响调查

对132名工程师和20万Claude Code会话的调查显示，工程师优先使用Claude解决问题，改变团队动态。

相关链接：调查线程｜后续

OpenAI"Garlic"模型泄露与GPT-5.1

The Information报道OpenAI"Garlic"模型在coding/推理上优于GPT-4.5。OpenAI发布GPT-5.1 Instant播客，涉及推理、个性控制。

相关链接：泄露报道｜GPT-5.1播客

研究与基准测试

测试时计算缩放研究

大规模研究表明，测试时计算策略可提升复杂推理，无需重新训练，效果取决于分配策略而非原始计算。

相关链接：总结｜论文

OPPO FINDER深度研究智能体基准

OPPO的FINDER基准（100任务）和DEFT taxonomy显示，智能体在证据整合、验证和规划上失败。

相关链接：概述

Neel Nanda的可解释性观点

Neel Nanda主张在实用可解释性中研究CoT，反驳“可解释性失败”的炒作，重新定义优先级。

相关链接：澄清｜技术

Gradium获7000万美元种子轮融资

巴黎的Gradium以7000万美元种子轮退出 stealth，推出 transcription/synthesis APIs，支持5种欧洲语言。

相关链接：公告｜创始人线程

智能体与工具链

LangSmith Agent Builder公开测试

LangSmith推出无代码智能体构建器，支持 prompt、工具、触发器、MCP和记忆/总结。

相关链接：发布｜视频

LlamaIndex发布LlamaAgents与LlamaSheets

LlamaIndex推出LlamaAgents（工作流模板）和LlamaSheets（电子表格解析），并举办社区办公时间。

相关链接：recap｜邀请

Hugging Face Skills发布

Hugging Face Skills是通用智能体上下文，兼容Cursor、Claude Code、Gemini CLI，使用Claude的技能规范。

相关链接：推特消息

Perplexity开源BrowseSafe防御 prompt injection

Perplexity开源BrowseSafe和BrowseSafe-Bench，防御 prompt injection，性能优于安全分类器。

相关链接：公告｜结果

社区与平台 - Reddit

/r/LocalLlama讨论Mistral 3

用户讨论Mistral 3的3B/8B/14B开源模型、Large 3的675B MoE，以及模型 lineup 的 gap。

相关链接：Reddit帖子1｜Reddit帖子2

/r/LocalLlama讨论蒙古GPU租赁

讨论蒙古的GPU租赁市场（B300，$5/hr，InfiniBand），对比CoreWeave/Lambda。

相关链接：Reddit帖子

非技术子reddit讨论OpenAI Code Red

用户讨论OpenAI的Code Red备忘录、GPT-5.1发布，以及付费版可能加入广告。

相关链接：Reddit帖子1｜Reddit帖子2

非技术子reddit讨论互联网挑战

用户讨论“死亡互联网”（AI生成内容）、“广告启示录”（ChatGPT加广告），以及大学教育的缺陷。

相关链接：死亡互联网｜广告启示录｜大学教育

社区与平台 - Discord

Discord主题-模型发布

讨论Mistral 3（Large 3、Ministral）、Arcee Trinity模型、Flux 2 Pro排名。

相关链接：LMArena leaderboard｜Arcee博客｜Flux leaderboard

Discord主题-内核优化

讨论PyTorch conv3D慢down、CUDA syncwarp竞争条件、NVIDIA nvfp4_gemm leaderboard。

相关链接：PyTorch issue｜CUDA讨论｜NVIDIA leaderboard

Discord主题-开发者工具

讨论Manus.im的不稳定性与认证问题、OpenRouter的DeepSeek错误、Cursor的子智能体与DeepSeek集成问题。

相关链接：Manus auth｜OpenRouter错误｜Cursor子智能体

Discord主题-安全

讨论RawChat的 stealth mode（GPT4o越狱）、SEED Framework（99.4%抗越狱）、Gemini 3 Pro越狱尝试。

相关链接：RawChat｜SEED｜UltraBr3aks

Discord主题-行业动态

讨论OpenAI的Alert Red备忘录、400GB VRAM rigs、Gradium的7000万美元融资。

相关链接：OpenAI Alert Red｜400GB rig｜Gradium融资

硬件与基础设施

蒙古GPU租赁市场

Fibo Cloud在蒙古提供B300 Blackwell Ultra GPU租赁，每小时5美元，含3.2 Tb/s InfiniBand和预装PyTorch/SLURM。

相关链接：landing page

400GB VRAM rigs构建

用户使用MCIO适配器和旧PSU同步设备，构建6x 3090的400GB VRAM rigs，用于Deepseek 3.2等模型。

相关链接：rig image｜PSU sync

NVIDIA nvfp4_gemm竞赛

用户提交nvfp4_gemm内核到NVIDIA leaderboard，eval_better_bench.py降低延迟，讨论CPU队列瓶颈。

相关链接：leaderboard｜eval_better_bench

来源：Easy AI 教学项目

#EasyAI #AI日报 #AI教学

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力

📰 Easy AI日报 | 2025-12-02

📅 2025年12月2日 AI行业动态

模型发布与更新

Mistral 3模型家族发布（含Large 3与Ministral 3B/8B/14B）

Apple发布CLaRa-7B-Instruct模型

Runway预览Gen-4.5模型

DeepSeek V3.2模型发布

Amazon Nova 2.0家族发布

企业动态

Anthropic收购Bun runtime

Anthropic推出Claude for Nonprofits计划

Anthropic发布AI工作影响调查

OpenAI"Garlic"模型泄露与GPT-5.1

研究与基准测试

测试时计算缩放研究

OPPO FINDER深度研究智能体基准

Neel Nanda的可解释性观点

Gradium获7000万美元种子轮融资

智能体与工具链

LangSmith Agent Builder公开测试

LlamaIndex发布LlamaAgents与LlamaSheets

Hugging Face Skills发布

Perplexity开源BrowseSafe防御 prompt injection

社区与平台 - Reddit

/r/LocalLlama讨论Mistral 3

/r/LocalLlama讨论蒙古GPU租赁

非技术子reddit讨论OpenAI Code Red

非技术子reddit讨论互联网挑战

社区与平台 - Discord

Discord主题-模型发布

Discord主题-内核优化

Discord主题-开发者工具

Discord主题-安全

Discord主题-行业动态

硬件与基础设施

蒙古GPU租赁市场

400GB VRAM rigs构建

NVIDIA nvfp4_gemm竞赛

讨论回复

推荐

智谱 GLM-5 已上线