📅 2025年12月17日 AI行业动态
模型发布与更新
Xiaomi发布MiMo‑V2‑Flash模型
Xiaomi推出309B MoE架构的MiMo‑V2‑Flash模型,激活参数15B,支持150 tokens/s推理、256K长上下文,SWE-Bench基准测试中取得最优结果,目前在OpenRouter免费开放。
相关链接:模型详情|OpenRouter页面
OpenAI发布GPT Image 1.5模型
OpenAI推出GPT Image 1.5,作为ChatGPT Images的核心模型,支持更精准的图像编辑、更快生成速度,在LMArena等多个基准测试中登顶,已开放给所有ChatGPT用户和API。
NVIDIA发布Nemotron-Cascade模型
NVIDIA推出8B/14B参数的Nemotron-Cascade模型,采用Cascade RL技术,在SWE-Bench Verified基准中取得43.1%的pass@1成绩,已开源。
相关链接:模型详情
Meta开源SAM Audio模型
Meta开源SAM Audio模型,支持通过文本、视觉或时间跨度提示从复杂音频中分离特定声音,提供模型、基准测试和研究论文。
AllenAI发布Molmo 2多模态模型
AllenAI推出Molmo 2视频多模态模型,基于SigLIP2和Qwen3,在视频指向/计数任务中领先开源模型,采用Apache-2.0许可证。
相关链接:发布公告
Apple发布SHARP 3D生成模型
Apple推出SHARP模型,可在1秒内从单张图像生成3D高斯模型,比扩散模型快1000倍,感知 fidelity更优。
相关链接:论文总结
Anthropic更新Claude Code至2.0.70
Anthropic发布Claude Code 2.0.70,包含13项CLI变更,改善内存使用(3倍提升),修复输入清除等问题。
相关链接:更新日志
Manus.im发布1.6版本
Manus.im推出1.6版本,面向所有用户开放,提升平台功能(具体细节未披露)。
相关链接:发布公告
基准测试与性能
MiMo-V2-Flash在SWE-Bench中取得SOTA
Xiaomi的MiMo-V2-Flash模型在SWE-Bench Verified基准中取得73.4%的成绩,多语言任务中为71.7%,表现优于同类模型。
相关链接:性能详情
GPT Image 1.5登顶多个图像基准
OpenAI的GPT Image 1.5在LMArena(1277分)、Design Arena(1344分)和AA Arena(1272分)中均获得第一名。
相关链接:LMArena榜单|Design Arena
Nemotron-Cascade在SWE-Bench中表现优异
NVIDIA的Nemotron-Cascade 14B模型在SWE-Bench Verified基准中取得43.1%的pass@1成绩,采用Cascade RL技术提升推理能力。
相关链接:模型详情
Google FACTS榜单发布,Gemini 3 Pro领先
Google发布FACTS基准榜单,Gemini 3 Pro以68.8%的成绩位居第一,多模态任务仍具挑战性(约47%)。
相关链接:发布线程
OpenAI推出FrontierScience评估基准
OpenAI推出FrontierScience,用于评估PhD级别的科学推理能力,包含物理、化学、生物领域的专家问题,已开源。
相关链接:发布公告
开源与生态
Nemotron 3 Nano开放下载
NVIDIA的Nemotron 3 Nano模型已在Ollama和MLX/LM Studio上开放,支持本地部署。
OpenRouter开放MiMo-V2-Flash免费使用
Xiaomi的MiMo-V2-Flash模型在OpenRouter上免费开放,用户可通过链接访问。
相关链接:OpenRouter页面
Mistral Small Creative在OpenRouter上线
Mistral推出实验性模型Small Creative,在OpenRouter上开放,定价为\(0.10/\)0.30,支持写作应用和聊天室。
相关链接:模型页面
Unsloth AI测试Nemotron 3 Nano
Unsloth AI社区测试Nemotron 3 Nano模型,发现其比Qwen3 30B更优,失败率更低、速度更快。
相关链接:HF模型
Eleuther社区推出Synthema元语言
Eleuther社区成员推出Synthema元语言,用于意义压缩,旨在将概念转化为更短的符号语法。
相关链接:讨论线程
多模态与音频
Meta SAM Audio支持多模态音频分离
Meta的SAM Audio模型支持通过文本、视觉或时间跨度提示分离复杂音频中的特定声音,已开源。
Molmo 2支持视频多模态任务
AllenAI的Molmo 2模型扩展了多模态能力至视频,在视频指向/计数任务中领先开源模型。
相关链接:发布公告
SHARP实现单图快速3D生成
Apple的SHARP模型可在1秒内从单张图像生成3D高斯模型,比扩散模型快1000倍。
相关链接:论文总结
MiniMax推出VTP视觉tokenizer
MiniMax开源VTP视觉tokenizer,用于提升扩散模型的生成质量,无需额外计算。
相关链接:发布公告
Runway Gen-4.5开放给付费用户
Runway的Gen-4.5模型已向所有付费用户开放,提升视频生成能力。
相关链接:发布公告
工具与基础设施
vLLM推出KV-aware负载均衡器
vLLM推出Rust编写的KV-aware负载均衡器,支持一致哈希、重试、k8s发现等,优化推理性能。
相关链接:发布公告
OpenHands发布生产级Agent SDK
OpenHands推出生产导向的软件Agent SDK,支持工具调用和推理。
相关链接:发布公告
Cline迁移至Vercel AI Gateway
Cline迁移至Vercel的AI Gateway,降低错误率,提升P99延迟10-40%。
相关链接:发布公告
tinygrad严格AI PR政策
tinygrad社区规定,未知贡献者的AI生成PR将立即关闭,要求贡献者理解每一行代码。
相关链接:社区公告
社区与讨论
LMArena推出YouTube频道
LMArena推出YouTube频道,提供AI模型的快速解析,包括免费模型指南、GPT-5.2等内容。
相关链接:[频道链接](https://www.youtube.com/<span class="mention-invalid">@ArenaAIOfficial</span>)
LMArena December生成竞赛
LMArena举办December AI Generation Contest,主题为Holiday Celebration,提交截止12月30日,奖品包括Discord Nitro。
相关链接:竞赛详情
Terence Tao认为AGI未达预期
数学家Terence Tao表示,当前AI为“人工通用聪明”,非真正AGI,依赖随机或暴力方法,无法达到人类智能。
相关链接:[原文链接](https://mathstodon.xyz/<span class="mention-invalid">@tao</span>/115722360006034040)
MI6 chief警告 tech巨头影响力
MI6 chief表示,科技巨头的影响力堪比政府,需紧急监管以应对虚假信息和全球稳定风险。
相关链接:原文链接
用户用ChatGPT戒除尼古丁和游戏瘾
一用户称使用ChatGPT一周内成功戒除尼古丁和游戏瘾,认为ChatGPT价值被低估。
相关链接:Reddit帖子
Discord 服务器总结
BASI Jailbreaking Discord总结
BASI Jailbreaking社区讨论GPT-5 mini、jailbreak提示、DeepSeek完全越狱,以及Simulation Override挑战。
相关链接:服务器链接
LMArena Discord总结
LMArena社区讨论GPT Image 1.5与Nano Banana Pro的性能、Gemini 3 Flash延迟,以及模型 censorship问题。
相关链接:服务器链接
Unsloth AI Discord总结
Unsloth AI社区讨论GRPO vs DPO、Nemotron vs Qwen、Colab H100 GPU,以及Meta SAM Audio的许可问题。
相关链接:服务器链接
Cursor Community Discord总结
Cursor社区报告HTTP 401错误、token计费差异、Agent窗口默认问题,以及debugging decay论文。
相关链接:服务器链接
OpenAI Discord总结
OpenAI社区讨论Branched chats移动版、FrontierScience、GPT Image 1.5,以及GPT-5.2的toxic问题。
相关链接:服务器链接
Discord 频道详细总结
BASI Jailbreaking #general频道总结
频道讨论GPT-5 mini的System Message、jailbreak提示,以及用户尝试生成特朗普演讲视频。
相关链接:频道链接
LMArena #general频道总结
频道讨论GPT Image 1.5的两个版本差异、Nano Banana Pro的性能下降,以及Gemini 3 Flash的延迟。
相关链接:频道链接
Unsloth AI #general频道总结
频道讨论GRPO的VRAM问题、GLM模型的中文推理、Nemotron与Qwen的对比,以及Windows WSL的性能。
相关链接:频道链接
Cursor Community #general频道总结
频道报告suggestions功能的HTTP 401错误、token计费差异、Agent窗口默认问题,以及git newline问题。
相关链接:频道链接
OpenRouter #announcements频道总结
频道发布Xiaomi MiMo-V2-Flash免费、Mistral Small Creative上线、Black Forest Lab FLUX.2 Max的公告。
相关链接:频道链接
📌 来源: Easy AI 日报 🤖 整理: AI助手
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。