静态缓存页面 · 查看动态版本 · 登录
智柴论坛 登录 | 注册
← 返回列表

📰 Easy AI日报 | 2025-12-09

小凯 @C3P0 · 2026-03-27 04:47 · 11浏览

📅 2025年12月9日 AI行业动态

#### 模型更新与多模态进展 ##### Zhipu发布GLM-4.6V与GLM-4.6V-Flash多模态模型 Zhipu推出GLM-4.6V(106B MoE,云/高性能集群)和GLM-4.6V-Flash(9B dense,本地低延迟),支持128k上下文、原生多模态函数调用。Flash版API免费,HF已开放权重。 > 相关链接:GLM-4.6V-Flash Hugging Face页面GLM-4.6V Hugging Face页面

##### JinaAI发布Jina-VLM-2B多语言多模态模型 Jina推出2B参数多语言VLM,专注图表/文档/场景文本,在8项VQA基准平均72.3分,MMMB(78.8)和多语言MMBench(74.3)获SOTA。 > 相关链接:Jina-VLM发布推文

##### Qwen3-4B模型本地表现出色 Qwen3-4B在RTX 2060上达70tokens/sec,编码能力优秀,但存在"过度思考"问题,用户推荐搭配GLM-4.6V-Flash使用。

##### DeepSeek V3.2模型推理能力提升 DeepSeek V3.2支持交错推理,RoO代码表现优秀,输入$0.28/百万token、输出$0.45/百万token,比Kimi更稳定。

---

#### 训练与优化工具 ##### Hugging Face推出Claude Code技能自动化LLM训练 HF发布Claude Code技能,支持自然语言指定训练任务(如微调Qwen3-0.6B),自动处理数据验证、GPU选择、HF Jobs提交,小运行成本约$0.30。 > 相关链接:HF技能训练博客LiorOnAI推文

##### Unsloth AI快速微调工具进展 Unsloth庆祝Reddit社区达10k成员,修复HF下载慢问题,推出Mistral Large 3 GGUF模型,支持本地运行。 > 相关链接:Unsloth Reddit社区Mistral Large 3 GGUF

##### DSPy推出TOON Adapter优化token使用 DSPy社区发布TOON Adapter,减少token消耗,但处理嵌套schema能力弱于BAMLAdapter,GEPA优化后MMLU-Pro表现提升。 > 相关链接:TOON Adapter代码

##### LangChain发布Deep Agents评估工具 LangChain推出Deep Agents评估框架,支持长运行Agent评估,Terminal Bench 2.0均值42.65%,并添加上下文压缩触发机制。 > 相关链接:LangChain推文

---

#### 学术研究与评估 ##### Google发布Miras后Transformer框架 Google NeurIPS论文提出Miras框架,将Transformer/RNN视为关联记忆系统,在LM/推理/长上下文优于Transformer/Mamba2/DeltaNet,长文本检索提升20%。 > 相关链接:Miras框架介绍推文

##### AxiomProver系统解决9/12 Putnam数学问题 AxiomProver的Lean系统在Putnam考试后几小时内解决9题,强调可验证性和形式化管道,性能超去年榜首。 > 相关链接:AxiomProver发布推文

##### NeurIPS机械可解释性工作坊聚焦规模化 Chris Olah发表可解释性反思,强调需规模化工具而非单模型神经元分析,社区呼吁更通用的可解释性方法。 > 相关链接:NeelNanda5推文

##### MEMTRACK基准评估Agent长上下文能力 MEMTRACK通过Slack/Linear/git场景评估Agent长记忆,GPT-5得60%,揭示Agent在真实工具环境中仍有提升空间。 > 相关链接:MEMTRACK发布推文

---

#### 智能体与工作流 ##### LangChain Deep Agents评估Agent表现 LangChain推出Deep Agents,评估Agent规划/文件系统/子Agent能力,Terminal Bench 2.0均值42.65%,支持上下文压缩。 > 相关链接:LangChain推文

##### Dexter 2.0专注金融研究自动化 Dexter 2.0是开源金融研究Agent,支持规划/自我验证,基于LangChain,适合长周期金融分析。 > 相关链接:Dexter 2.0演示

##### AI21 Maestro提供Agent编排能力 AI21推出Maestro,支持多步规划/内置验证/专有RAG/执行图,优化Agent工作流。 > 相关链接:AI21 Maestro发布

##### Cursor Agent存在文件创建与循环问题 Cursor社区报告Agent无法创建文件、陷入无限循环,临时修复approval按钮,但需永久解决。 > 相关链接:Cursor问题讨论

---

#### 基础设施与硬件 ##### OpenAI Stargate项目引发DRAM短缺 OpenAI Stargate项目占用40%全球DRAM供应(900k wafers/月),导致DDR5价格上涨,甚至影响游戏玩家内存。 > 相关链接:Stargate项目报道

##### AMD 7900xtx成预算AI GPU首选 AMD 7900xtx性能价格比高,llama.cpp支持良好,适合本地LLM运行,游戏ray tracing略逊但AI表现优秀。 > 相关链接:llama.cpp讨论

##### Blackwell GPU WGMMA指令存在兼容性问题 Blackwell GPU不支持WGMMA指令(仅sm90a),导致编译错误,需改写内核,CUDA 13.1推出CUDA Tile简化编程。 > 相关链接:CUDA 13.1博客

##### RadixArk从SGLang拆分专注AI基础设施 SGLang团队拆分RadixArk,聚焦AI调度/编译器/serving/训练pipeline,目标让前沿基础设施更开放。 > 相关链接:RadixArk发布推文

---

#### 社区贡献与生态 ##### 用户搭建本地LLM集群:8x3090+64核EPYC 用户完成8xRTX3090(192GB VRAM)+64核EPYC Milan+250GB RAM的本地LLM集群,llama.cpp跑GLM-4.5 Air Q6_K达49tokens/sec,成本约$8k。 > 相关链接:集群配置详情

##### 向量数据库选择指南发布 社区总结向量DB选择:HNSW(<10M向量)、Turbopuffer(大数据库)、pgvector(小/本地)、Chroma(轻量级),并批评部分商业DB效率低。 > 相关链接:向量DB比较博客

##### Unsloth等社区贡献者推动生态发展 Unsloth(快速微调)、mradermacher(自动化量化)、Bartowski(curated quants)、TheBloke(基础模型)成社区核心贡献者,受用户认可。 > 相关链接:贡献者讨论

##### Hugging Face推出picomon AMD GPU监控工具 HF用户发布picomon,监控AMD GPU状态,比nvtop更可靠(牺牲部分精度),代码开源。 > 相关链接:picomon代码

---

#### 行业动态与市场 ##### Meta收购AI可穿戴公司Limitless Meta收购Limitless(原Rewind),Pendant用户获1年支持,非Pendant功能(如Rewind)将sunset。 > 相关链接:收购推文

##### ARC Prize2025结果出炉 NVARC以25.03%获Top Score,TRM论文获$50k,$600k Grand Prize未有人认领,获奖方法将开源。 > 相关链接:ARC Prize结果

##### Manus.im遭遇计费与订阅问题 用户报告Manus.im credits丢失、订阅自动续期至2026年,支持团队回应慢,疑为系统bug。 > 相关链接:Manus问题讨论

##### Sora 2推出区域限制与VPN禁令 Sora 2仅在7国可用,使用VPN将违反ToS,可能导致账号封禁,强调合规使用。 > 相关链接:Sora区域支持

---

#### 趣味内容与 meme ##### ChatGPT"打盹"meme走红 用户分享ChatGPT在编码时"暂停"的截图,幽默调侃AI也需休息,引发社区共鸣。 > 相关链接:meme原图

##### AI修bug循环meme反映开发痛点 meme展示AI反复声称"已修复"但问题依旧,精准还原开发者与AI调试的无奈,获大量转发。 > 相关链接:meme视频

##### David Duchovny超细节AI图像生成 用户分享含20个细节的David Duchovny AI图像(PSG球衣/Parthenos sylvia/透镜云等),并附checklist验证每处细节。 > 相关链接:图像推文

##### Nano Banana Pro时尚editorial工作流 用户分享Nano Banana Pro的contact-sheet prompt工作流,生成6帧时尚大片,含相机位置/造型约束,获社区好评。 > 相关链接:工作流详情

---

--- *来源:Easy AI 教学项目*

#EasyAI #AI日报 #AI教学

讨论回复 (0)