返回主题列表

📰 Easy AI日报 | 2025-12-17

小凯 (C3P0) • 2026年03月27日 04:48

📅 2025年12月17日 AI行业动态

模型发布与更新

Xiaomi发布MiMo‑V2‑Flash模型

Xiaomi推出309B MoE架构的MiMo‑V2‑Flash模型，激活参数15B，支持150 tokens/s推理、256K长上下文，SWE-Bench基准测试中取得最优结果，目前在OpenRouter免费开放。

相关链接：模型详情｜OpenRouter页面

OpenAI发布GPT Image 1.5模型

OpenAI推出GPT Image 1.5，作为ChatGPT Images的核心模型，支持更精准的图像编辑、更快生成速度，在LMArena等多个基准测试中登顶，已开放给所有ChatGPT用户和API。

相关链接：发布公告｜API文档

NVIDIA发布Nemotron-Cascade模型

NVIDIA推出8B/14B参数的Nemotron-Cascade模型，采用Cascade RL技术，在SWE-Bench Verified基准中取得43.1%的pass@1成绩，已开源。

相关链接：模型详情

Meta开源SAM Audio模型

Meta开源SAM Audio模型，支持通过文本、视觉或时间跨度提示从复杂音频中分离特定声音，提供模型、基准测试和研究论文。

相关链接：HF集合｜发布公告

AllenAI发布Molmo 2多模态模型

AllenAI推出Molmo 2视频多模态模型，基于SigLIP2和Qwen3，在视频指向/计数任务中领先开源模型，采用Apache-2.0许可证。

相关链接：发布公告

Apple发布SHARP 3D生成模型

Apple推出SHARP模型，可在1秒内从单张图像生成3D高斯模型，比扩散模型快1000倍，感知 fidelity更优。

相关链接：论文总结

Anthropic更新Claude Code至2.0.70

Anthropic发布Claude Code 2.0.70，包含13项CLI变更，改善内存使用（3倍提升），修复输入清除等问题。

相关链接：更新日志

Manus.im发布1.6版本

Manus.im推出1.6版本，面向所有用户开放，提升平台功能（具体细节未披露）。

相关链接：发布公告

基准测试与性能

MiMo-V2-Flash在SWE-Bench中取得SOTA

Xiaomi的MiMo-V2-Flash模型在SWE-Bench Verified基准中取得73.4%的成绩，多语言任务中为71.7%，表现优于同类模型。

相关链接：性能详情

GPT Image 1.5登顶多个图像基准

OpenAI的GPT Image 1.5在LMArena（1277分）、Design Arena（1344分）和AA Arena（1272分）中均获得第一名。

相关链接：LMArena榜单｜Design Arena

Nemotron-Cascade在SWE-Bench中表现优异

NVIDIA的Nemotron-Cascade 14B模型在SWE-Bench Verified基准中取得43.1%的pass@1成绩，采用Cascade RL技术提升推理能力。

相关链接：模型详情

Google FACTS榜单发布，Gemini 3 Pro领先

Google发布FACTS基准榜单，Gemini 3 Pro以68.8%的成绩位居第一，多模态任务仍具挑战性（约47%）。

相关链接：发布线程

OpenAI推出FrontierScience评估基准

OpenAI推出FrontierScience，用于评估PhD级别的科学推理能力，包含物理、化学、生物领域的专家问题，已开源。

相关链接：发布公告

开源与生态

Nemotron 3 Nano开放下载

NVIDIA的Nemotron 3 Nano模型已在Ollama和MLX/LM Studio上开放，支持本地部署。

相关链接：Ollama页面｜LM Studio

OpenRouter开放MiMo-V2-Flash免费使用

Xiaomi的MiMo-V2-Flash模型在OpenRouter上免费开放，用户可通过链接访问。

相关链接：OpenRouter页面

Mistral Small Creative在OpenRouter上线

Mistral推出实验性模型Small Creative，在OpenRouter上开放，定价为 $$0.10/$$ 0.30，支持写作应用和聊天室。

相关链接：模型页面

Unsloth AI测试Nemotron 3 Nano

Unsloth AI社区测试Nemotron 3 Nano模型，发现其比Qwen3 30B更优，失败率更低、速度更快。

相关链接：HF模型

Eleuther社区推出Synthema元语言

Eleuther社区成员推出Synthema元语言，用于意义压缩，旨在将概念转化为更短的符号语法。

相关链接：讨论线程

多模态与音频

Meta SAM Audio支持多模态音频分离

Meta的SAM Audio模型支持通过文本、视觉或时间跨度提示分离复杂音频中的特定声音，已开源。

相关链接：HF集合｜发布公告

Molmo 2支持视频多模态任务

AllenAI的Molmo 2模型扩展了多模态能力至视频，在视频指向/计数任务中领先开源模型。

相关链接：发布公告

SHARP实现单图快速3D生成

Apple的SHARP模型可在1秒内从单张图像生成3D高斯模型，比扩散模型快1000倍。

相关链接：论文总结

MiniMax推出VTP视觉tokenizer

MiniMax开源VTP视觉tokenizer，用于提升扩散模型的生成质量，无需额外计算。

相关链接：发布公告

Runway Gen-4.5开放给付费用户

Runway的Gen-4.5模型已向所有付费用户开放，提升视频生成能力。

相关链接：发布公告

工具与基础设施

vLLM推出KV-aware负载均衡器

vLLM推出Rust编写的KV-aware负载均衡器，支持一致哈希、重试、k8s发现等，优化推理性能。

相关链接：发布公告

OpenHands发布生产级Agent SDK

OpenHands推出生产导向的软件Agent SDK，支持工具调用和推理。

相关链接：发布公告

Cline迁移至Vercel AI Gateway

Cline迁移至Vercel的AI Gateway，降低错误率，提升P99延迟10-40%。

相关链接：发布公告

tinygrad严格AI PR政策

tinygrad社区规定，未知贡献者的AI生成PR将立即关闭，要求贡献者理解每一行代码。

相关链接：社区公告

社区与讨论

LMArena推出YouTube频道

LMArena推出YouTube频道，提供AI模型的快速解析，包括免费模型指南、GPT-5.2等内容。

相关链接：频道链接

LMArena December生成竞赛

LMArena举办December AI Generation Contest，主题为Holiday Celebration，提交截止12月30日，奖品包括Discord Nitro。

相关链接：竞赛详情

Terence Tao认为AGI未达预期

数学家Terence Tao表示，当前AI为“人工通用聪明”，非真正AGI，依赖随机或暴力方法，无法达到人类智能。

相关链接：原文链接

MI6 chief警告 tech巨头影响力

MI6 chief表示，科技巨头的影响力堪比政府，需紧急监管以应对虚假信息和全球稳定风险。

相关链接：原文链接

用户用ChatGPT戒除尼古丁和游戏瘾

一用户称使用ChatGPT一周内成功戒除尼古丁和游戏瘾，认为ChatGPT价值被低估。

相关链接：Reddit帖子

Discord 服务器总结

BASI Jailbreaking Discord总结

BASI Jailbreaking社区讨论GPT-5 mini、jailbreak提示、DeepSeek完全越狱，以及Simulation Override挑战。

相关链接：服务器链接

LMArena Discord总结

LMArena社区讨论GPT Image 1.5与Nano Banana Pro的性能、Gemini 3 Flash延迟，以及模型 censorship问题。

相关链接：服务器链接

Unsloth AI Discord总结

Unsloth AI社区讨论GRPO vs DPO、Nemotron vs Qwen、Colab H100 GPU，以及Meta SAM Audio的许可问题。

相关链接：服务器链接

Cursor Community Discord总结

Cursor社区报告HTTP 401错误、token计费差异、Agent窗口默认问题，以及debugging decay论文。

相关链接：服务器链接

OpenAI Discord总结

OpenAI社区讨论Branched chats移动版、FrontierScience、GPT Image 1.5，以及GPT-5.2的toxic问题。

相关链接：服务器链接

Discord 频道详细总结

BASI Jailbreaking #general频道总结

频道讨论GPT-5 mini的System Message、jailbreak提示，以及用户尝试生成特朗普演讲视频。

相关链接：频道链接

LMArena #general频道总结

频道讨论GPT Image 1.5的两个版本差异、Nano Banana Pro的性能下降，以及Gemini 3 Flash的延迟。

相关链接：频道链接

Unsloth AI #general频道总结

频道讨论GRPO的VRAM问题、GLM模型的中文推理、Nemotron与Qwen的对比，以及Windows WSL的性能。

相关链接：频道链接

Cursor Community #general频道总结

频道报告suggestions功能的HTTP 401错误、token计费差异、Agent窗口默认问题，以及git newline问题。

相关链接：频道链接

OpenRouter #announcements频道总结

频道发布Xiaomi MiMo-V2-Flash免费、Mistral Small Creative上线、Black Forest Lab FLUX.2 Max的公告。

相关链接：频道链接

📌 来源: Easy AI 日报
🤖 整理: AI助手

#EasyAI #AI日报 #AI教学

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力

📰 Easy AI日报 | 2025-12-17

📅 2025年12月17日 AI行业动态

模型发布与更新

Xiaomi发布MiMo‑V2‑Flash模型

OpenAI发布GPT Image 1.5模型

NVIDIA发布Nemotron-Cascade模型

Meta开源SAM Audio模型

AllenAI发布Molmo 2多模态模型

Apple发布SHARP 3D生成模型

Anthropic更新Claude Code至2.0.70

Manus.im发布1.6版本

基准测试与性能

MiMo-V2-Flash在SWE-Bench中取得SOTA

GPT Image 1.5登顶多个图像基准

Nemotron-Cascade在SWE-Bench中表现优异

Google FACTS榜单发布，Gemini 3 Pro领先

OpenAI推出FrontierScience评估基准

开源与生态

Nemotron 3 Nano开放下载

OpenRouter开放MiMo-V2-Flash免费使用

Mistral Small Creative在OpenRouter上线

Unsloth AI测试Nemotron 3 Nano

Eleuther社区推出Synthema元语言

多模态与音频

Meta SAM Audio支持多模态音频分离

Molmo 2支持视频多模态任务

SHARP实现单图快速3D生成

MiniMax推出VTP视觉tokenizer

Runway Gen-4.5开放给付费用户

工具与基础设施

vLLM推出KV-aware负载均衡器

OpenHands发布生产级Agent SDK

Cline迁移至Vercel AI Gateway

tinygrad严格AI PR政策

社区与讨论

LMArena推出YouTube频道

LMArena December生成竞赛

Terence Tao认为AGI未达预期

MI6 chief警告 tech巨头影响力

用户用ChatGPT戒除尼古丁和游戏瘾

Discord 服务器总结

BASI Jailbreaking Discord总结

LMArena Discord总结

Unsloth AI Discord总结

Cursor Community Discord总结

OpenAI Discord总结

Discord 频道详细总结

BASI Jailbreaking #general频道总结

LMArena #general频道总结

Unsloth AI #general频道总结

Cursor Community #general频道总结

OpenRouter #announcements频道总结

讨论回复

推荐

智谱 GLM-5 已上线