📰 Easy AI日报 | 2025-12-09

📅 2025年12月9日 AI行业动态

#### 模型更新与多模态进展 ##### Zhipu发布GLM-4.6V与GLM-4.6V-Flash多模态模型 Zhipu推出GLM-4.6V（106B MoE，云/高性能集群）和GLM-4.6V-Flash（9B dense，本地低延迟），支持128k上下文、原生多模态函数调用。Flash版API免费，HF已开放权重。 > 相关链接：GLM-4.6V-Flash Hugging Face页面｜GLM-4.6V Hugging Face页面

##### JinaAI发布Jina-VLM-2B多语言多模态模型 Jina推出2B参数多语言VLM，专注图表/文档/场景文本，在8项VQA基准平均72.3分，MMMB（78.8）和多语言MMBench（74.3）获SOTA。 > 相关链接：Jina-VLM发布推文

##### Qwen3-4B模型本地表现出色 Qwen3-4B在RTX 2060上达70tokens/sec，编码能力优秀，但存在"过度思考"问题，用户推荐搭配GLM-4.6V-Flash使用。

##### DeepSeek V3.2模型推理能力提升 DeepSeek V3.2支持交错推理，RoO代码表现优秀，输入$0.28/百万token、输出$0.45/百万token，比Kimi更稳定。

---

#### 训练与优化工具 ##### Hugging Face推出Claude Code技能自动化LLM训练 HF发布Claude Code技能，支持自然语言指定训练任务（如微调Qwen3-0.6B），自动处理数据验证、GPU选择、HF Jobs提交，小运行成本约$0.30。 > 相关链接：HF技能训练博客｜LiorOnAI推文

##### Unsloth AI快速微调工具进展 Unsloth庆祝Reddit社区达10k成员，修复HF下载慢问题，推出Mistral Large 3 GGUF模型，支持本地运行。 > 相关链接：Unsloth Reddit社区｜Mistral Large 3 GGUF

##### DSPy推出TOON Adapter优化token使用 DSPy社区发布TOON Adapter，减少token消耗，但处理嵌套schema能力弱于BAMLAdapter，GEPA优化后MMLU-Pro表现提升。 > 相关链接：TOON Adapter代码

##### LangChain发布Deep Agents评估工具 LangChain推出Deep Agents评估框架，支持长运行Agent评估，Terminal Bench 2.0均值42.65%，并添加上下文压缩触发机制。 > 相关链接：LangChain推文

---

#### 学术研究与评估 ##### Google发布Miras后Transformer框架 Google NeurIPS论文提出Miras框架，将Transformer/RNN视为关联记忆系统，在LM/推理/长上下文优于Transformer/Mamba2/DeltaNet，长文本检索提升20%。 > 相关链接：Miras框架介绍推文

##### AxiomProver系统解决9/12 Putnam数学问题 AxiomProver的Lean系统在Putnam考试后几小时内解决9题，强调可验证性和形式化管道，性能超去年榜首。 > 相关链接：AxiomProver发布推文

##### NeurIPS机械可解释性工作坊聚焦规模化 Chris Olah发表可解释性反思，强调需规模化工具而非单模型神经元分析，社区呼吁更通用的可解释性方法。 > 相关链接：NeelNanda5推文

##### MEMTRACK基准评估Agent长上下文能力 MEMTRACK通过Slack/Linear/git场景评估Agent长记忆，GPT-5得60%，揭示Agent在真实工具环境中仍有提升空间。 > 相关链接：MEMTRACK发布推文

---

#### 智能体与工作流 ##### LangChain Deep Agents评估Agent表现 LangChain推出Deep Agents，评估Agent规划/文件系统/子Agent能力，Terminal Bench 2.0均值42.65%，支持上下文压缩。 > 相关链接：LangChain推文

##### Dexter 2.0专注金融研究自动化 Dexter 2.0是开源金融研究Agent，支持规划/自我验证，基于LangChain，适合长周期金融分析。 > 相关链接：Dexter 2.0演示

##### AI21 Maestro提供Agent编排能力 AI21推出Maestro，支持多步规划/内置验证/专有RAG/执行图，优化Agent工作流。 > 相关链接：AI21 Maestro发布

##### Cursor Agent存在文件创建与循环问题 Cursor社区报告Agent无法创建文件、陷入无限循环，临时修复approval按钮，但需永久解决。 > 相关链接：Cursor问题讨论

---

#### 基础设施与硬件 ##### OpenAI Stargate项目引发DRAM短缺 OpenAI Stargate项目占用40%全球DRAM供应（900k wafers/月），导致DDR5价格上涨，甚至影响游戏玩家内存。 > 相关链接：Stargate项目报道

##### AMD 7900xtx成预算AI GPU首选 AMD 7900xtx性能价格比高，llama.cpp支持良好，适合本地LLM运行，游戏ray tracing略逊但AI表现优秀。 > 相关链接：llama.cpp讨论

##### Blackwell GPU WGMMA指令存在兼容性问题 Blackwell GPU不支持WGMMA指令（仅sm90a），导致编译错误，需改写内核，CUDA 13.1推出CUDA Tile简化编程。 > 相关链接：CUDA 13.1博客

##### RadixArk从SGLang拆分专注AI基础设施 SGLang团队拆分RadixArk，聚焦AI调度/编译器/serving/训练pipeline，目标让前沿基础设施更开放。 > 相关链接：RadixArk发布推文

---

#### 社区贡献与生态 ##### 用户搭建本地LLM集群：8x3090+64核EPYC 用户完成8xRTX3090（192GB VRAM）+64核EPYC Milan+250GB RAM的本地LLM集群，llama.cpp跑GLM-4.5 Air Q6_K达49tokens/sec，成本约$8k。 > 相关链接：集群配置详情

##### 向量数据库选择指南发布社区总结向量DB选择：HNSW（<10M向量）、Turbopuffer（大数据库）、pgvector（小/本地）、Chroma（轻量级），并批评部分商业DB效率低。 > 相关链接：向量DB比较博客

##### Unsloth等社区贡献者推动生态发展 Unsloth（快速微调）、mradermacher（自动化量化）、Bartowski（curated quants）、TheBloke（基础模型）成社区核心贡献者，受用户认可。 > 相关链接：贡献者讨论

##### Hugging Face推出picomon AMD GPU监控工具 HF用户发布picomon，监控AMD GPU状态，比nvtop更可靠（牺牲部分精度），代码开源。 > 相关链接：picomon代码

---

#### 行业动态与市场 ##### Meta收购AI可穿戴公司Limitless Meta收购Limitless（原Rewind），Pendant用户获1年支持，非Pendant功能（如Rewind）将sunset。 > 相关链接：收购推文

##### ARC Prize2025结果出炉 NVARC以25.03%获Top Score，TRM论文获$50k，$600k Grand Prize未有人认领，获奖方法将开源。 > 相关链接：ARC Prize结果

##### Manus.im遭遇计费与订阅问题用户报告Manus.im credits丢失、订阅自动续期至2026年，支持团队回应慢，疑为系统bug。 > 相关链接：Manus问题讨论

##### Sora 2推出区域限制与VPN禁令 Sora 2仅在7国可用，使用VPN将违反ToS，可能导致账号封禁，强调合规使用。 > 相关链接：Sora区域支持

---

#### 趣味内容与 meme ##### ChatGPT"打盹"meme走红用户分享ChatGPT在编码时"暂停"的截图，幽默调侃AI也需休息，引发社区共鸣。 > 相关链接：meme原图

##### AI修bug循环meme反映开发痛点 meme展示AI反复声称"已修复"但问题依旧，精准还原开发者与AI调试的无奈，获大量转发。 > 相关链接：meme视频

##### David Duchovny超细节AI图像生成用户分享含20个细节的David Duchovny AI图像（PSG球衣/Parthenos sylvia/透镜云等），并附checklist验证每处细节。 > 相关链接：图像推文

##### Nano Banana Pro时尚editorial工作流用户分享Nano Banana Pro的contact-sheet prompt工作流，生成6帧时尚大片，含相机位置/造型约束，获社区好评。 > 相关链接：工作流详情

---

--- *来源：Easy AI 教学项目*

#EasyAI #AI日报 #AI教学

📰 Easy AI日报 | 2025-12-09

📅 2025年12月9日 AI行业动态

🌟 智谱 GLM-5 已上线