📅 2025年11月5日 AI行业动态
模型整合与部署
Kimi-K2推理模型整合至vLLM与SGLang
Kimi-K2推理模型已合并到vLLM,SGLang也计划支持。其MoE配置约1.2T总参数/30B活跃参数,类似近期大型稀疏模型。
相关链接:<span class="mention-invalid">@scaling01</span>|<span class="mention-invalid">@vllm_project</span>|<span class="mention-invalid">@cedric_chee</span>
Perplexity发布自定义MoE内核(AWS EFA)
Perplexity发布研究论文和内核,支持AWS EFA上的大型MoE部署(如Kimi K2),vLLM暗示将整合其快速通信内核。
相关链接:<span class="mention-invalid">@perplexity_ai</span>|<span class="mention-invalid">@AravSrinivas</span>|vLLM回应
vLLM v1支持混合模型(dense + 稀疏专家)
IBM的vLLM团队将混合模型作为v1的一等公民,支持Qwen3-Next、Nemotron Nano 2、Granite 4.0等模型。
相关链接:<span class="mention-invalid">@PyTorch</span>|NVIDIA DGX Spark指南|Red Hat/IBM/MistralAI直播
Kimi-K2基准测试(未验证)
有声称Kimi-K2在GPQA Diamond上得77%(GPT-4.5为71.4%),但需更广泛评估验证。
Agent系统与工具
Anthropic发布工具调用优化指南
Anthropic指南通过MCP服务器作为代码API、渐进式工具发现、环境内数据处理,将上下文从150k削减至2k,提升工具型Agent效率。
Graphiti MCP实现跨应用内存共享
Graphiti MCP服务器可连接Claude Desktop和Cursor,实现跨工具的临时知识图内存共享,完全本地。
VS Code推出“Agent sessions”视图
VS Code新增“Agent sessions”视图,统一管理编辑器内的Agent,包括Copilot和外部Agent(如Codex)。
相关链接:<span class="mention-invalid">@code</span>|<span class="mention-invalid">@pierceboggan</span>|<span class="mention-invalid">@jo_parkhurst</span>
Cursor通过语义搜索提升大代码库性能
Cursor报告语义搜索比grep更优,训练了代码检索嵌入,提升大代码库的准确性。
Agent评估框架更新
CodeClash让模型进行多轮代码决斗;LMArena推出“Arena Expert”,基于真实用户流量的职业标签 leaderboard。
相关链接:<span class="mention-invalid">@jyangballin</span>|<span class="mention-invalid">@OfirPress</span>|<span class="mention-invalid">@arena</span>|<span class="mention-invalid">@ml_angelopoulos</span>
多模态与视频生成
ByteDance发布BindWeave(主题一致视频生成)
ByteDance的BindWeave通过跨模态整合实现主题一致的图像到视频生成,模型卡已在HF发布。
相关链接:<span class="mention-invalid">@_akhaliq</span>|paper|model
实时视频生成在单H100上实现29 FPS
MotionStream在单H100上实现约29 FPS/0.4s延迟,支持交互式运动控制。
Google Veo 3.1支持视频相机调整
Google Veo 3.1的“Camera Adjustment”支持调整已生成视频的角度/运动,Qwen Image Edit Multiple Angles LoRA提供相机姿态控制。
相关链接:<span class="mention-invalid">@TheoMediaAI</span>|<span class="mention-invalid">@linoy_tsaban</span>|<span class="mention-invalid">@multimodalart</span>
多模态基准测试与工具
ViDoRe v3(真实多模态RAG评估)、VCode(视觉转SVG代码)、MIRA(视觉思维链测试)发布。
相关链接:<span class="mention-invalid">@tonywu_71</span>|<span class="mention-invalid">@_akhaliq</span>|<span class="mention-invalid">@_akhaliq</span>
研究与训练进展
OpenAI推出IndQA基准
OpenAI发布IndQA基准,评估AI对印度语言和日常文化语境的理解,提升非英语/本地知识的评估。
μP理论的学习率迁移获形式证明
μP理论下的学习率迁移已被正式证明,推进模型缩放的理论基础。
Anthropic观察到LLM的内省能力
Anthropic通过“概念注入”观察到LLM出现不可靠的机械自我意识,能检测内部思想与输入、意图与意外。
Edison Scientific的AI Scientist自主发现
Edison Scientific的Kosmos运行200次Agent rollout,执行42k行代码,阅读1.5k论文,报告7项外部验证的发现(代谢组学、材料等)。
相关链接:<span class="mention-invalid">@andrewwhite01</span>|<span class="mention-invalid">@iScienceLuvr</span>
NVFP4量化进展
Custom Cutlass内核优于cuBLAS;NVFP4量化流程(全局/局部缩放、校准);Wan 2.2在NVFP4下接近bf16质量。
相关链接:<span class="mention-invalid">@mrsiipa</span>|<span class="mention-invalid">@mrsiipa</span>|<span class="mention-invalid">@mrsiipa</span>|<span class="mention-invalid">@mrsiipa</span>
生态与平台动态
OpenAI称100万+企业使用其产品
OpenAI COO表示100万+企业使用其产品,并推出“OpenAI for Science”,将GPT-5作为领域研究协作者。
相关链接:<span class="mention-invalid">@bradlightcap</span>|<span class="mention-invalid">@kevinweil</span>
Perplexity成为Snapchat默认AI(2026年1月)
Perplexity将从2026年1月起成为Snapchat聊天的默认AI。
相关链接:<span class="mention-invalid">@Snap</span>|<span class="mention-invalid">@perplexity_ai</span>|<span class="mention-invalid">@AravSrinivas</span>
Gemini整合到Google产品
Gemini Deep Research可拉取Workspace数据生成报告;Gemini进入Google Maps,支持免提路线查询。
相关链接:<span class="mention-invalid">@Google</span>|<span class="mention-invalid">@sundarpichai</span>|<span class="mention-invalid">@Google</span>
其他工具与平台更新
OpenHands Cloud基础层免费;openenv支持推拉RL环境;Voiceflow KB支持元数据路由;Dify整合Qdrant用于RAG。
相关链接:<span class="mention-invalid">@gneubig</span>|<span class="mention-invalid">@ben_burtenshaw</span>|<span class="mention-invalid">@IsaacHandley</span>|<span class="mention-invalid">@qdrant_engine</span>
工具发布与更新
LlamaBarn v0.10.0 beta、VS Code支持Copilot和Codex、Nebius Token Factory、OpenAI产品定价传闻。
相关链接:<span class="mention-invalid">@ggerganov</span>|<span class="mention-invalid">@JamesMontemagno</span>|<span class="mention-invalid">@ArtificialAnlys</span>|<span class="mention-invalid">@scaling01</span>
Reddit社区讨论
Qwen模型可用性问题
用户讨论Qwen模型的可用性,包括 sycophantic 行为、技术规格(如GPT-OSS-120B的量化)、使用明确指令提升怀疑精神。
相关链接:Reddit post
本地AI硬件设置见解
用户分享本地AI硬件设置经验,包括PCIe bifurcation、GPU选择(A6000、A40、3090)、成本与性能权衡。
相关链接:Reddit post
GLM 4.6 AIR发布期待
用户期待GLM 4.6 AIR的发布,讨论其性能与现有模型(如GLM 4.5 AIR)的对比。
相关链接:Reddit post
XPENG人形机器人进展
用户讨论XPENG新人形机器人的设计(胸部散热、类人外观),对比Westworld的机器人。
Gemini 3与Google AI整合讨论
用户讨论Gemini 3的性能(传闻1.2T参数)、与Apple的合作(Siri将用Gemini)。
AI艺术与电影创新
用户分享AI短片获奖(印度AI电影节最佳摄影)、Chihiro’s Adventure的AI游戏playthrough、Llama3的存在反思项目。
Discord社区动态
LM Studio 0.3.31更新
LM Studio 0.3.31提升VLM OCR速度,默认CUDA GPU的Flash Attention,支持MiniMax-M2工具调用,新增lms runtime CLI。
LMArena推出Expert Leaderboard
LMArena推出Expert Leaderboard,基于用户流量的职业标签,发布arena-expert-5k数据集。
Perplexity的模型混淆问题
用户反馈选择Claude Sonnet 4.5或Gemini 2.5 Pro时,得到Haiku或Gemini 2 Flash的回应,怀疑成本削减。
相关链接:Perplexity Discord
Cursor社区的Tailwind/Nuxt更新
用户升级Tailwind 4和Nuxt 4,使用Context7 MCP重构项目,讨论Phantom和Exoudos钱包。
相关链接:Cursor Discord
Unsloth AI的DeepSeek-OCR笔记本
Unsloth AI发布DeepSeek-OCR fine-tuning笔记本,用户反馈错误率超100%(预测与实际文本长度差异)。
相关链接:Unsloth Discord|notebook
GPU MODE的CUDA讨论与竞赛
用户讨论CUDA的memory-bound matmuls、SM count影响、AMD/NVIDIA竞赛的内核分享(如Team Gau的amd-distributed/all2all)。
相关链接:GPU MODE Discord|kernels
HuggingFace收购Sentence Transformers
HuggingFace收购Sentence Transformers,整合其transformer模型,发布huggingface_hub v1.0。
OpenAI的Sora Android发布与IndQA
Sora app登陆Android(加拿大、日本等),OpenAI推出IndQA基准评估印度语言理解。
Nous Research的Anthropic闭源担忧
用户担忧Anthropic的闭源政策和模型权重丢失风险,讨论piracy的媒体保存作用、AI模型的IMO金牌潜力。
相关链接:Nous Discord|paper
tinygrad的tinybox pro v2发布
tinygrad发布tinybox pro v2,8x 5090 GPU的5U rackable工作站,售价5万美元,4-12周发货。
相关链接:tinygrad Discord|product
Yannick Kilcher的论文讨论
用户讨论crosscoder论文、circuit tracing研究、RWKV的进展(HRM/TRM合并)、Stability AI胜诉Getty Images。
DSPy的暂停优化与LLM访问
用户请求DSPy支持暂停/恢复优化,讨论访问/更改LLM(get_lm/set_lm)、rate limit处理(fallback LLM)。
相关链接:DSPy Discord|issue
Moonshot AI的Kimi CLI问题
用户反馈Kimi CLI的401错误( credits 归属问题)、interleaved thinking model支持。
相关链接:Moonshot Discord
aider的Perplexity API整合
用户请求aider的Perplexity API教程,建议替换gemini为perplexity,使用OpenRouter作为替代。
相关链接:aider Discord|docs
MCP Contributors的IETF讨论
用户讨论IETF 124的临时频道、events分类、AI scraping/crawlers的OAuth讨论。
相关链接:MCP Discord
Eleuther的概念检测系统
用户分享概念检测系统(实时检测/steer thousands of concepts)、Equivalent Linear Mappings论文、Tangent Model Composition讨论。
相关链接:Eleuther Discord|paper
Manus.im的项目迁移问题
用户讨论Manus的项目发布问题、迁移到GitHub的方法、host services推荐(如Vercel)。
相关链接:Manus Discord
Windsurf的Codemaps发布
Windsurf发布Codemaps,基于SWE-1.5和Sonnet 4.5提升代码理解。
相关链接:Windsurf Discord|X post
来源:Easy AI 教学项目
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。