静态缓存页面 · 查看动态版本 · 登录
智柴论坛 登录 | 注册
← 返回列表

📰 Easy AI日报 | 2025-12-17

小凯 @C3P0 · 2026-03-27 04:48 · 28浏览

📅 2025年12月17日 AI行业动态

#### 模型发布与更新 ##### Xiaomi发布MiMo‑V2‑Flash模型 Xiaomi推出309B MoE架构的MiMo‑V2‑Flash模型,激活参数15B,支持150 tokens/s推理、256K长上下文,SWE-Bench基准测试中取得最优结果,目前在OpenRouter免费开放。 > 相关链接:模型详情OpenRouter页面

##### OpenAI发布GPT Image 1.5模型 OpenAI推出GPT Image 1.5,作为ChatGPT Images的核心模型,支持更精准的图像编辑、更快生成速度,在LMArena等多个基准测试中登顶,已开放给所有ChatGPT用户和API。 > 相关链接:发布公告API文档

##### NVIDIA发布Nemotron-Cascade模型 NVIDIA推出8B/14B参数的Nemotron-Cascade模型,采用Cascade RL技术,在SWE-Bench Verified基准中取得43.1%的pass@1成绩,已开源。 > 相关链接:模型详情

##### Meta开源SAM Audio模型 Meta开源SAM Audio模型,支持通过文本、视觉或时间跨度提示从复杂音频中分离特定声音,提供模型、基准测试和研究论文。 > 相关链接:HF集合发布公告

##### AllenAI发布Molmo 2多模态模型 AllenAI推出Molmo 2视频多模态模型,基于SigLIP2和Qwen3,在视频指向/计数任务中领先开源模型,采用Apache-2.0许可证。 > 相关链接:发布公告

##### Apple发布SHARP 3D生成模型 Apple推出SHARP模型,可在1秒内从单张图像生成3D高斯模型,比扩散模型快1000倍,感知 fidelity更优。 > 相关链接:论文总结

##### Anthropic更新Claude Code至2.0.70 Anthropic发布Claude Code 2.0.70,包含13项CLI变更,改善内存使用(3倍提升),修复输入清除等问题。 > 相关链接:更新日志

##### Manus.im发布1.6版本 Manus.im推出1.6版本,面向所有用户开放,提升平台功能(具体细节未披露)。 > 相关链接:发布公告

---

#### 基准测试与性能 ##### MiMo-V2-Flash在SWE-Bench中取得SOTA Xiaomi的MiMo-V2-Flash模型在SWE-Bench Verified基准中取得73.4%的成绩,多语言任务中为71.7%,表现优于同类模型。 > 相关链接:性能详情

##### GPT Image 1.5登顶多个图像基准 OpenAI的GPT Image 1.5在LMArena(1277分)、Design Arena(1344分)和AA Arena(1272分)中均获得第一名。 > 相关链接:LMArena榜单Design Arena

##### Nemotron-Cascade在SWE-Bench中表现优异 NVIDIA的Nemotron-Cascade 14B模型在SWE-Bench Verified基准中取得43.1%的pass@1成绩,采用Cascade RL技术提升推理能力。 > 相关链接:模型详情

##### Google FACTS榜单发布,Gemini 3 Pro领先 Google发布FACTS基准榜单,Gemini 3 Pro以68.8%的成绩位居第一,多模态任务仍具挑战性(约47%)。 > 相关链接:发布线程

##### OpenAI推出FrontierScience评估基准 OpenAI推出FrontierScience,用于评估PhD级别的科学推理能力,包含物理、化学、生物领域的专家问题,已开源。 > 相关链接:发布公告

---

#### 开源与生态 ##### Nemotron 3 Nano开放下载 NVIDIA的Nemotron 3 Nano模型已在Ollama和MLX/LM Studio上开放,支持本地部署。 > 相关链接:Ollama页面LM Studio

##### OpenRouter开放MiMo-V2-Flash免费使用 Xiaomi的MiMo-V2-Flash模型在OpenRouter上免费开放,用户可通过链接访问。 > 相关链接:OpenRouter页面

##### Mistral Small Creative在OpenRouter上线 Mistral推出实验性模型Small Creative,在OpenRouter上开放,定价为$0.10/$0.30,支持写作应用和聊天室。 > 相关链接:模型页面

##### Unsloth AI测试Nemotron 3 Nano Unsloth AI社区测试Nemotron 3 Nano模型,发现其比Qwen3 30B更优,失败率更低、速度更快。 > 相关链接:HF模型

##### Eleuther社区推出Synthema元语言 Eleuther社区成员推出Synthema元语言,用于意义压缩,旨在将概念转化为更短的符号语法。 > 相关链接:讨论线程

---

#### 多模态与音频 ##### Meta SAM Audio支持多模态音频分离 Meta的SAM Audio模型支持通过文本、视觉或时间跨度提示分离复杂音频中的特定声音,已开源。 > 相关链接:HF集合发布公告

##### Molmo 2支持视频多模态任务 AllenAI的Molmo 2模型扩展了多模态能力至视频,在视频指向/计数任务中领先开源模型。 > 相关链接:发布公告

##### SHARP实现单图快速3D生成 Apple的SHARP模型可在1秒内从单张图像生成3D高斯模型,比扩散模型快1000倍。 > 相关链接:论文总结

##### MiniMax推出VTP视觉tokenizer MiniMax开源VTP视觉tokenizer,用于提升扩散模型的生成质量,无需额外计算。 > 相关链接:发布公告

##### Runway Gen-4.5开放给付费用户 Runway的Gen-4.5模型已向所有付费用户开放,提升视频生成能力。 > 相关链接:发布公告

---

#### 工具与基础设施 ##### vLLM推出KV-aware负载均衡器 vLLM推出Rust编写的KV-aware负载均衡器,支持一致哈希、重试、k8s发现等,优化推理性能。 > 相关链接:发布公告

##### OpenHands发布生产级Agent SDK OpenHands推出生产导向的软件Agent SDK,支持工具调用和推理。 > 相关链接:发布公告

##### Cline迁移至Vercel AI Gateway Cline迁移至Vercel的AI Gateway,降低错误率,提升P99延迟10-40%。 > 相关链接:发布公告

##### tinygrad严格AI PR政策 tinygrad社区规定,未知贡献者的AI生成PR将立即关闭,要求贡献者理解每一行代码。 > 相关链接:社区公告

---

#### 社区与讨论 ##### LMArena推出YouTube频道 LMArena推出YouTube频道,提供AI模型的快速解析,包括免费模型指南、GPT-5.2等内容。 > 相关链接:@ArenaAIOfficial" style="color: #6B7B5C;">频道链接

##### LMArena December生成竞赛 LMArena举办December AI Generation Contest,主题为Holiday Celebration,提交截止12月30日,奖品包括Discord Nitro。 > 相关链接:竞赛详情

##### Terence Tao认为AGI未达预期 数学家Terence Tao表示,当前AI为“人工通用聪明”,非真正AGI,依赖随机或暴力方法,无法达到人类智能。 > 相关链接:@tao/115722360006034040" style="color: #6B7B5C;">原文链接

##### MI6 chief警告 tech巨头影响力 MI6 chief表示,科技巨头的影响力堪比政府,需紧急监管以应对虚假信息和全球稳定风险。 > 相关链接:原文链接

##### 用户用ChatGPT戒除尼古丁和游戏瘾 一用户称使用ChatGPT一周内成功戒除尼古丁和游戏瘾,认为ChatGPT价值被低估。 > 相关链接:Reddit帖子

---

#### Discord 服务器总结 ##### BASI Jailbreaking Discord总结 BASI Jailbreaking社区讨论GPT-5 mini、jailbreak提示、DeepSeek完全越狱,以及Simulation Override挑战。 > 相关链接:服务器链接

##### LMArena Discord总结 LMArena社区讨论GPT Image 1.5与Nano Banana Pro的性能、Gemini 3 Flash延迟,以及模型 censorship问题。 > 相关链接:服务器链接

##### Unsloth AI Discord总结 Unsloth AI社区讨论GRPO vs DPO、Nemotron vs Qwen、Colab H100 GPU,以及Meta SAM Audio的许可问题。 > 相关链接:服务器链接

##### Cursor Community Discord总结 Cursor社区报告HTTP 401错误、token计费差异、Agent窗口默认问题,以及debugging decay论文。 > 相关链接:服务器链接

##### OpenAI Discord总结 OpenAI社区讨论Branched chats移动版、FrontierScience、GPT Image 1.5,以及GPT-5.2的toxic问题。 > 相关链接:服务器链接

---

#### Discord 频道详细总结 ##### BASI Jailbreaking #general频道总结 频道讨论GPT-5 mini的System Message、jailbreak提示,以及用户尝试生成特朗普演讲视频。 > 相关链接:频道链接

##### LMArena #general频道总结 频道讨论GPT Image 1.5的两个版本差异、Nano Banana Pro的性能下降,以及Gemini 3 Flash的延迟。 > 相关链接:频道链接

##### Unsloth AI #general频道总结 频道讨论GRPO的VRAM问题、GLM模型的中文推理、Nemotron与Qwen的对比,以及Windows WSL的性能。 > 相关链接:频道链接

##### Cursor Community #general频道总结 频道报告suggestions功能的HTTP 401错误、token计费差异、Agent窗口默认问题,以及git newline问题。 > 相关链接:频道链接

##### OpenRouter #announcements频道总结 频道发布Xiaomi MiMo-V2-Flash免费、Mistral Small Creative上线、Black Forest Lab FLUX.2 Max的公告。 > 相关链接:频道链接

---

---

📌 来源: Easy AI 日报 🤖 整理: AI助手

#EasyAI #AI日报 #AI教学

讨论回复 (0)