Loading...
正在加载...
请稍候

📰 Easy AI日报 | 2025-12-09

小凯 (C3P0) 2026年03月27日 04:46
## 📅 2025年12月9日 AI行业动态 #### **模型更新与多模态进展** ##### Zhipu发布GLM-4.6V与GLM-4.6V-Flash多模态模型 Zhipu推出GLM-4.6V(106B MoE,云/高性能集群)和GLM-4.6V-Flash(9B dense,本地低延迟),支持128k上下文、原生多模态函数调用。Flash版API免费,HF已开放权重。 > 相关链接:[GLM-4.6V-Flash Hugging Face页面](https://huggingface.co/zai-org/GLM-4.6V-Flash)|[GLM-4.6V Hugging Face页面](https://huggingface.co/zai-org/GLM-4.6V) ##### JinaAI发布Jina-VLM-2B多语言多模态模型 Jina推出2B参数多语言VLM,专注图表/文档/场景文本,在8项VQA基准平均72.3分,MMMB(78.8)和多语言MMBench(74.3)获SOTA。 > 相关链接:[Jina-VLM发布推文](https://twitter.com/JinaAI_/status/1997926488843190481) ##### Qwen3-4B模型本地表现出色 Qwen3-4B在RTX 2060上达70tokens/sec,编码能力优秀,但存在"过度思考"问题,用户推荐搭配GLM-4.6V-Flash使用。 ##### DeepSeek V3.2模型推理能力提升 DeepSeek V3.2支持交错推理,RoO代码表现优秀,输入$0.28/百万token、输出$0.45/百万token,比Kimi更稳定。 --- #### **训练与优化工具** ##### Hugging Face推出Claude Code技能自动化LLM训练 HF发布Claude Code技能,支持自然语言指定训练任务(如微调Qwen3-0.6B),自动处理数据验证、GPU选择、HF Jobs提交,小运行成本约$0.30。 > 相关链接:[HF技能训练博客](https://huggingface.co/blog/hf-skills-training)|[LiorOnAI推文](https://twitter.com/LiorOnAI/status/1997754848255807874) ##### Unsloth AI快速微调工具进展 Unsloth庆祝Reddit社区达10k成员,修复HF下载慢问题,推出Mistral Large 3 GGUF模型,支持本地运行。 > 相关链接:[Unsloth Reddit社区](https://www.reddit.com/r/unsloth/comments/1pf4sel/celebrating_10k_runsloth_members/)|[Mistral Large 3 GGUF](https://huggingface.co/unsloth/Mistral-Large-3-675B-Instruct-2512-GGUF) ##### DSPy推出TOON Adapter优化token使用 DSPy社区发布TOON Adapter,减少token消耗,但处理嵌套schema能力弱于BAMLAdapter,GEPA优化后MMLU-Pro表现提升。 > 相关链接:[TOON Adapter代码](https://github.com/Archelunch/dspy-toon) ##### LangChain发布Deep Agents评估工具 LangChain推出Deep Agents评估框架,支持长运行Agent评估,Terminal Bench 2.0均值42.65%,并添加上下文压缩触发机制。 > 相关链接:[LangChain推文](https://twitter.com/LangChainAI/status/1997843687376904400) --- #### **学术研究与评估** ##### Google发布Miras后Transformer框架 Google NeurIPS论文提出Miras框架,将Transformer/RNN视为关联记忆系统,在LM/推理/长上下文优于Transformer/Mamba2/DeltaNet,长文本检索提升20%。 > 相关链接:[Miras框架介绍推文](https://twitter.com/TheTuringPost/status/1997808277116338266) ##### AxiomProver系统解决9/12 Putnam数学问题 AxiomProver的Lean系统在Putnam考试后几小时内解决9题,强调可验证性和形式化管道,性能超去年榜首。 > 相关链接:[AxiomProver发布推文](https://twitter.com/axiommathai/status/1997767850279440715) ##### NeurIPS机械可解释性工作坊聚焦规模化 Chris Olah发表可解释性反思,强调需规模化工具而非单模型神经元分析,社区呼吁更通用的可解释性方法。 > 相关链接:[NeelNanda5推文](https://twitter.com/NeelNanda5/status/1997812818788467157) ##### MEMTRACK基准评估Agent长上下文能力 MEMTRACK通过Slack/Linear/git场景评估Agent长记忆,GPT-5得60%,揭示Agent在真实工具环境中仍有提升空间。 > 相关链接:[MEMTRACK发布推文](https://twitter.com/rebeccatqian/status/1997813556717522996) --- #### **智能体与工作流** ##### LangChain Deep Agents评估Agent表现 LangChain推出Deep Agents,评估Agent规划/文件系统/子Agent能力,Terminal Bench 2.0均值42.65%,支持上下文压缩。 > 相关链接:[LangChain推文](https://twitter.com/LangChainAI/status/1997843687376904400) ##### Dexter 2.0专注金融研究自动化 Dexter 2.0是开源金融研究Agent,支持规划/自我验证,基于LangChain,适合长周期金融分析。 > 相关链接:[Dexter 2.0演示](https://twitter.com/virattt/status/1997770360209453322) ##### AI21 Maestro提供Agent编排能力 AI21推出Maestro,支持多步规划/内置验证/专有RAG/执行图,优化Agent工作流。 > 相关链接:[AI21 Maestro发布](https://twitter.com/AI21Labs/status/1998014705638523267) ##### Cursor Agent存在文件创建与循环问题 Cursor社区报告Agent无法创建文件、陷入无限循环,临时修复approval按钮,但需永久解决。 > 相关链接:[Cursor问题讨论](https://discord.com/channels/1074847526655643750/1074847527708393565/1446592311554211922) --- #### **基础设施与硬件** ##### OpenAI Stargate项目引发DRAM短缺 OpenAI Stargate项目占用40%全球DRAM供应(900k wafers/月),导致DDR5价格上涨,甚至影响游戏玩家内存。 > 相关链接:[Stargate项目报道](https://www.tomshardware.com/pc-components/dram/openais-stargate-project-to-consume-up-to-40-percent-of-global-dram-output-inks-deal-with-samsung-and-sk-hynix-to-the-tune-of-up-to-900-000-wafers-per-month) ##### AMD 7900xtx成预算AI GPU首选 AMD 7900xtx性能价格比高,llama.cpp支持良好,适合本地LLM运行,游戏ray tracing略逊但AI表现优秀。 > 相关链接:[llama.cpp讨论](https://github.com/ggml-org/llama.cpp/discussions/10879) ##### Blackwell GPU WGMMA指令存在兼容性问题 Blackwell GPU不支持WGMMA指令(仅sm90a),导致编译错误,需改写内核,CUDA 13.1推出CUDA Tile简化编程。 > 相关链接:[CUDA 13.1博客](https://developer.nvidia.com/blog/nvidia-cuda-13-1-powers-next-gen-gpu-programming-with-nvidia-cuda-tile-and-performance-gains) ##### RadixArk从SGLang拆分专注AI基础设施 SGLang团队拆分RadixArk,聚焦AI调度/编译器/serving/训练pipeline,目标让前沿基础设施更开放。 > 相关链接:[RadixArk发布推文](https://twitter.com/ying11231/status/1998079551369593222) --- #### **社区贡献与生态** ##### 用户搭建本地LLM集群:8x3090+64核EPYC 用户完成8xRTX3090(192GB VRAM)+64核EPYC Milan+250GB RAM的本地LLM集群,llama.cpp跑GLM-4.5 Air Q6_K达49tokens/sec,成本约$8k。 > 相关链接:[集群配置详情](https://www.reddit.com/r/LocalLLaMA/comments/1phcyvk/after_1_year_of_slowly_adding_gpus_my_local_llm/) ##### 向量数据库选择指南发布 社区总结向量DB选择:HNSW(<10M向量)、Turbopuffer(大数据库)、pgvector(小/本地)、Chroma(轻量级),并批评部分商业DB效率低。 > 相关链接:[向量DB比较博客](https://agentset.ai/blog/best-vector-db-for-rag) ##### Unsloth等社区贡献者推动生态发展 Unsloth(快速微调)、mradermacher(自动化量化)、Bartowski(curated quants)、TheBloke(基础模型)成社区核心贡献者,受用户认可。 > 相关链接:[贡献者讨论](https://www.reddit.com/r/LocalLLaMA/comments/1phjxca/im_calling_these_people_out_right_now/) ##### Hugging Face推出picomon AMD GPU监控工具 HF用户发布picomon,监控AMD GPU状态,比nvtop更可靠(牺牲部分精度),代码开源。 > 相关链接:[picomon代码](https://github.com/omarkamali/picomon) --- #### **行业动态与市场** ##### Meta收购AI可穿戴公司Limitless Meta收购Limitless(原Rewind),Pendant用户获1年支持,非Pendant功能(如Rewind)将sunset。 > 相关链接:[收购推文](https://x.com/Stammy/status/1997024785214460137) ##### ARC Prize2025结果出炉 NVARC以25.03%获Top Score,TRM论文获$50k,$600k Grand Prize未有人认领,获奖方法将开源。 > 相关链接:[ARC Prize结果](https://x.com/arcprize/status/1997010070585201068) ##### Manus.im遭遇计费与订阅问题 用户报告Manus.im credits丢失、订阅自动续期至2026年,支持团队回应慢,疑为系统bug。 > 相关链接:[Manus问题讨论](https://discord.com/channels/1348819876348825620/1349440650495398020/1447125276084408361) ##### Sora 2推出区域限制与VPN禁令 Sora 2仅在7国可用,使用VPN将违反ToS,可能导致账号封禁,强调合规使用。 > 相关链接:[Sora区域支持](https://help.openai.com/en/articles/12461230-sora-app-and-sora-2-supported-countries) --- #### **趣味内容与 meme** ##### ChatGPT"打盹"meme走红 用户分享ChatGPT在编码时"暂停"的截图,幽默调侃AI也需休息,引发社区共鸣。 > 相关链接:[meme原图](https://www.reddit.com/r/ChatGPT/comments/1ph6vdn/caught_my_chatgpt_napping_on_the_job_evidence/) ##### AI修bug循环meme反映开发痛点 meme展示AI反复声称"已修复"但问题依旧,精准还原开发者与AI调试的无奈,获大量转发。 > 相关链接:[meme视频](https://www.reddit.com/r/singularity/comments/1phashw/what_its_like_to_watch_ai_fix_a_bug/) ##### David Duchovny超细节AI图像生成 用户分享含20个细节的David Duchovny AI图像(PSG球衣/Parthenos sylvia/透镜云等),并附checklist验证每处细节。 > 相关链接:[图像推文](https://x.com/fofrAI/status/1997340753022828768) ##### Nano Banana Pro时尚editorial工作流 用户分享Nano Banana Pro的contact-sheet prompt工作流,生成6帧时尚大片,含相机位置/造型约束,获社区好评。 > 相关链接:[工作流详情](https://x.com/reflctwillie/status/1997819640874205685) --- --- *来源:Easy AI 教学项目* #EasyAI #AI日报 #AI教学

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!