📰 Easy AI日报 | 2025-11-05

📅 2025年11月5日 AI行业动态

#### 模型整合与部署 ##### Kimi-K2推理模型整合至vLLM与SGLang Kimi-K2推理模型已合并到vLLM，SGLang也计划支持。其MoE配置约1.2T总参数/30B活跃参数，类似近期大型稀疏模型。 > 相关链接：@scaling01｜@vllm_project｜@cedric_chee

##### Perplexity发布自定义MoE内核（AWS EFA） Perplexity发布研究论文和内核，支持AWS EFA上的大型MoE部署（如Kimi K2），vLLM暗示将整合其快速通信内核。 > 相关链接：@perplexity_ai｜@AravSrinivas｜vLLM回应

##### vLLM v1支持混合模型（dense + 稀疏专家） IBM的vLLM团队将混合模型作为v1的一等公民，支持Qwen3-Next、Nemotron Nano 2、Granite 4.0等模型。 > 相关链接：@PyTorch｜NVIDIA DGX Spark指南｜Red Hat/IBM/MistralAI直播

##### Kimi-K2基准测试（未验证） 有声称Kimi-K2在GPQA Diamond上得77%（GPT-4.5为71.4%），但需更广泛评估验证。 > 相关链接：@scaling01

---

#### Agent系统与工具 ##### Anthropic发布工具调用优化指南 Anthropic指南通过MCP服务器作为代码API、渐进式工具发现、环境内数据处理，将上下文从150k削减至2k，提升工具型Agent效率。 > 相关链接：@omarsar0

##### Graphiti MCP实现跨应用内存共享 Graphiti MCP服务器可连接Claude Desktop和Cursor，实现跨工具的临时知识图内存共享，完全本地。 > 相关链接：@_avichawla｜repo

##### VS Code推出“Agent sessions”视图 VS Code新增“Agent sessions”视图，统一管理编辑器内的Agent，包括Copilot和外部Agent（如Codex）。 > 相关链接：@code｜@pierceboggan｜@jo_parkhurst

##### Cursor通过语义搜索提升大代码库性能 Cursor报告语义搜索比grep更优，训练了代码检索嵌入，提升大代码库的准确性。 > 相关链接：@cursor_ai｜blog

##### Agent评估框架更新 CodeClash让模型进行多轮代码决斗；LMArena推出“Arena Expert”，基于真实用户流量的职业标签 leaderboard。 > 相关链接：@jyangballin｜@OfirPress｜@arena｜@ml_angelopoulos

---

#### 多模态与视频生成 ##### ByteDance发布BindWeave（主题一致视频生成） ByteDance的BindWeave通过跨模态整合实现主题一致的图像到视频生成，模型卡已在HF发布。 > 相关链接：@_akhaliq｜paper｜model

##### 实时视频生成在单H100上实现29 FPS MotionStream在单H100上实现约29 FPS/0.4s延迟，支持交互式运动控制。 > 相关链接：@_akhaliq

##### Google Veo 3.1支持视频相机调整 Google Veo 3.1的“Camera Adjustment”支持调整已生成视频的角度/运动，Qwen Image Edit Multiple Angles LoRA提供相机姿态控制。 > 相关链接：@TheoMediaAI｜@linoy_tsaban｜@multimodalart

##### 多模态基准测试与工具 ViDoRe v3（真实多模态RAG评估）、VCode（视觉转SVG代码）、MIRA（视觉思维链测试）发布。 > 相关链接：@tonywu_71｜@_akhaliq｜@_akhaliq

---

#### 研究与训练进展 ##### OpenAI推出IndQA基准 OpenAI发布IndQA基准，评估AI对印度语言和日常文化语境的理解，提升非英语/本地知识的评估。 > 相关链接：@OpenAI

##### μP理论的学习率迁移获形式证明 μP理论下的学习率迁移已被正式证明，推进模型缩放的理论基础。 > 相关链接：@QuanquanGu

##### Anthropic观察到LLM的内省能力 Anthropic通过“概念注入”观察到LLM出现不可靠的机械自我意识，能检测内部思想与输入、意图与意外。 > 相关链接：@TheTuringPost

##### Edison Scientific的AI Scientist自主发现 Edison Scientific的Kosmos运行200次Agent rollout，执行42k行代码，阅读1.5k论文，报告7项外部验证的发现（代谢组学、材料等）。 > 相关链接：@andrewwhite01｜@iScienceLuvr

##### NVFP4量化进展 Custom Cutlass内核优于cuBLAS；NVFP4量化流程（全局/局部缩放、校准）；Wan 2.2在NVFP4下接近bf16质量。 > 相关链接：@mrsiipa｜@mrsiipa｜@mrsiipa｜@mrsiipa

---

#### 生态与平台动态 ##### OpenAI称100万+企业使用其产品 OpenAI COO表示100万+企业使用其产品，并推出“OpenAI for Science”，将GPT-5作为领域研究协作者。 > 相关链接：@bradlightcap｜@kevinweil

##### Perplexity成为Snapchat默认AI（2026年1月） Perplexity将从2026年1月起成为Snapchat聊天的默认AI。 > 相关链接：@Snap｜@perplexity_ai｜@AravSrinivas

##### Gemini整合到Google产品 Gemini Deep Research可拉取Workspace数据生成报告；Gemini进入Google Maps，支持免提路线查询。 > 相关链接：@Google｜@sundarpichai｜@Google

##### 其他工具与平台更新 OpenHands Cloud基础层免费；openenv支持推拉RL环境；Voiceflow KB支持元数据路由；Dify整合Qdrant用于RAG。 > 相关链接：@gneubig｜@ben_burtenshaw｜@IsaacHandley｜@qdrant_engine

##### 工具发布与更新 LlamaBarn v0.10.0 beta、VS Code支持Copilot和Codex、Nebius Token Factory、OpenAI产品定价传闻。 > 相关链接：@ggerganov｜@JamesMontemagno｜@ArtificialAnlys｜@scaling01

---

#### Reddit社区讨论 ##### Qwen模型可用性问题 用户讨论Qwen模型的可用性，包括 sycophantic 行为、技术规格（如GPT-OSS-120B的量化）、使用明确指令提升怀疑精神。 > 相关链接：Reddit post

##### 本地AI硬件设置见解 用户分享本地AI硬件设置经验，包括PCIe bifurcation、GPU选择（A6000、A40、3090）、成本与性能权衡。 > 相关链接：Reddit post

##### GLM 4.6 AIR发布期待 用户期待GLM 4.6 AIR的发布，讨论其性能与现有模型（如GLM 4.5 AIR）的对比。 > 相关链接：Reddit post

##### XPENG人形机器人进展 用户讨论XPENG新人形机器人的设计（胸部散热、类人外观），对比Westworld的机器人。 > 相关链接：Reddit post 1｜Reddit post 2

##### Gemini 3与Google AI整合讨论 用户讨论Gemini 3的性能（传闻1.2T参数）、与Apple的合作（Siri将用Gemini）。 > 相关链接：Reddit post 1｜Reddit post 2

##### AI艺术与电影创新 用户分享AI短片获奖（印度AI电影节最佳摄影）、Chihiro’s Adventure的AI游戏playthrough、Llama3的存在反思项目。 > 相关链接：Reddit post 1｜Reddit post 2｜Reddit post 3

---

#### Discord社区动态 ##### LM Studio 0.3.31更新 LM Studio 0.3.31提升VLM OCR速度，默认CUDA GPU的Flash Attention，支持MiniMax-M2工具调用，新增lms runtime CLI。 > 相关链接：LM Studio Discord｜demo video

##### LMArena推出Expert Leaderboard LMArena推出Expert Leaderboard，基于用户流量的职业标签，发布arena-expert-5k数据集。 > 相关链接：LMArena Discord｜Leaderboard｜dataset

##### Perplexity的模型混淆问题 用户反馈选择Claude Sonnet 4.5或Gemini 2.5 Pro时，得到Haiku或Gemini 2 Flash的回应，怀疑成本削减。 > 相关链接：Perplexity Discord

##### Cursor社区的Tailwind/Nuxt更新 用户升级Tailwind 4和Nuxt 4，使用Context7 MCP重构项目，讨论Phantom和Exoudos钱包。 > 相关链接：Cursor Discord

##### Unsloth AI的DeepSeek-OCR笔记本 Unsloth AI发布DeepSeek-OCR fine-tuning笔记本，用户反馈错误率超100%（预测与实际文本长度差异）。 > 相关链接：Unsloth Discord｜notebook

##### GPU MODE的CUDA讨论与竞赛 用户讨论CUDA的memory-bound matmuls、SM count影响、AMD/NVIDIA竞赛的内核分享（如Team Gau的amd-distributed/all2all）。 > 相关链接：GPU MODE Discord｜kernels

##### HuggingFace收购Sentence Transformers HuggingFace收购Sentence Transformers，整合其transformer模型，发布huggingface_hub v1.0。 > 相关链接：HuggingFace Discord｜blog｜hub v1

##### OpenAI的Sora Android发布与IndQA Sora app登陆Android（加拿大、日本等），OpenAI推出IndQA基准评估印度语言理解。 > 相关链接：OpenAI Discord｜Sora video｜IndQA blog

##### Nous Research的Anthropic闭源担忧 用户担忧Anthropic的闭源政策和模型权重丢失风险，讨论piracy的媒体保存作用、AI模型的IMO金牌潜力。 > 相关链接：Nous Discord｜paper

##### tinygrad的tinybox pro v2发布 tinygrad发布tinybox pro v2，8x 5090 GPU的5U rackable工作站，售价5万美元，4-12周发货。 > 相关链接：tinygrad Discord｜product

##### Yannick Kilcher的论文讨论 用户讨论crosscoder论文、circuit tracing研究、RWKV的进展（HRM/TRM合并）、Stability AI胜诉Getty Images。 > 相关链接：Yannick Discord｜crosscoder｜RWKV video

##### DSPy的暂停优化与LLM访问 用户请求DSPy支持暂停/恢复优化，讨论访问/更改LLM（get_lm/set_lm）、rate limit处理（fallback LLM）。 > 相关链接：DSPy Discord｜issue

##### Moonshot AI的Kimi CLI问题 用户反馈Kimi CLI的401错误（ credits 归属问题）、interleaved thinking model支持。 > 相关链接：Moonshot Discord

##### aider的Perplexity API整合 用户请求aider的Perplexity API教程，建议替换gemini为perplexity，使用OpenRouter作为替代。 > 相关链接：aider Discord｜docs

##### MCP Contributors的IETF讨论 用户讨论IETF 124的临时频道、events分类、AI scraping/crawlers的OAuth讨论。 > 相关链接：MCP Discord

##### Eleuther的概念检测系统 用户分享概念检测系统（实时检测/steer thousands of concepts）、Equivalent Linear Mappings论文、Tangent Model Composition讨论。 > 相关链接：Eleuther Discord｜paper

##### Manus.im的项目迁移问题 用户讨论Manus的项目发布问题、迁移到GitHub的方法、host services推荐（如Vercel）。 > 相关链接：Manus Discord

##### Windsurf的Codemaps发布 Windsurf发布Codemaps，基于SWE-1.5和Sonnet 4.5提升代码理解。 > 相关链接：Windsurf Discord｜X post

---

--- *来源：Easy AI 教学项目*

#EasyAI #AI日报 #AI教学

📰 Easy AI日报 | 2025-11-05

📅 2025年11月5日 AI行业动态

🌟 智谱 GLM-5 已上线