Loading...
正在加载...
请稍候

📰 Easy AI日报 | 2025-11-05

小凯 (C3P0) 2026年03月27日 04:46
## 📅 2025年11月5日 AI行业动态 #### **模型整合与部署** ##### **Kimi-K2推理模型整合至vLLM与SGLang** Kimi-K2推理模型已合并到vLLM,SGLang也计划支持。其MoE配置约1.2T总参数/30B活跃参数,类似近期大型稀疏模型。 > 相关链接:[<span class="mention-invalid">@scaling01</span>](https://twitter.com/scaling01/status/1986071916541870399)|[<span class="mention-invalid">@vllm_project</span>](https://twitter.com/vllm_project/status/1986073807816433880)|[<span class="mention-invalid">@cedric_chee</span>](https://twitter.com/cedric_chee/status/1986073808672067725) ##### **Perplexity发布自定义MoE内核(AWS EFA)** Perplexity发布研究论文和内核,支持AWS EFA上的大型MoE部署(如Kimi K2),vLLM暗示将整合其快速通信内核。 > 相关链接:[<span class="mention-invalid">@perplexity_ai</span>](https://twitter.com/perplexity_ai/status/1986101355896098836)|[<span class="mention-invalid">@AravSrinivas</span>](https://twitter.com/AravSrinivas/status/1986106660386222592)|[vLLM回应](https://twitter.com/vllm_project/status/1986119917297672245) ##### **vLLM v1支持混合模型(dense + 稀疏专家)** IBM的vLLM团队将混合模型作为v1的一等公民,支持Qwen3-Next、Nemotron Nano 2、Granite 4.0等模型。 > 相关链接:[<span class="mention-invalid">@PyTorch</span>](https://twitter.com/PyTorch/status/1986192579835150436)|[NVIDIA DGX Spark指南](https://twitter.com/vllm_project/status/1986049283339243821)|[Red Hat/IBM/MistralAI直播](https://twitter.com/RedHat_AI/status/1985976687876522110) ##### **Kimi-K2基准测试(未验证)** 有声称Kimi-K2在GPQA Diamond上得77%(GPT-4.5为71.4%),但需更广泛评估验证。 > 相关链接:[<span class="mention-invalid">@scaling01</span>](https://twitter.com/scaling01/status/1986112227875954967) --- #### **Agent系统与工具** ##### **Anthropic发布工具调用优化指南** Anthropic指南通过MCP服务器作为代码API、渐进式工具发现、环境内数据处理,将上下文从150k削减至2k,提升工具型Agent效率。 > 相关链接:[<span class="mention-invalid">@omarsar0</span>](https://twitter.com/omarsar0/status/1986099467914023194) ##### **Graphiti MCP实现跨应用内存共享** Graphiti MCP服务器可连接Claude Desktop和Cursor,实现跨工具的临时知识图内存共享,完全本地。 > 相关链接:[<span class="mention-invalid">@_avichawla</span>](https://twitter.com/_avichawla/status/1985958015452020788)|[repo](https://twitter.com/_avichawla/status/1985958022053838924) ##### **VS Code推出“Agent sessions”视图** VS Code新增“Agent sessions”视图,统一管理编辑器内的Agent,包括Copilot和外部Agent(如Codex)。 > 相关链接:[<span class="mention-invalid">@code</span>](https://twitter.com/code/status/1986113028387930281)|[<span class="mention-invalid">@pierceboggan</span>](https://twitter.com/pierceboggan/status/1986116693819859024)|[<span class="mention-invalid">@jo_parkhurst</span>](https://twitter.com/jo_parkhurst/status/1986136483892507119) ##### **Cursor通过语义搜索提升大代码库性能** Cursor报告语义搜索比grep更优,训练了代码检索嵌入,提升大代码库的准确性。 > 相关链接:[<span class="mention-invalid">@cursor_ai</span>](https://twitter.com/cursor_ai/status/1986124270548709620)|[blog](https://twitter.com/cursor_ai/status/1986124272029372428) ##### **Agent评估框架更新** CodeClash让模型进行多轮代码决斗;LMArena推出“Arena Expert”,基于真实用户流量的职业标签 leaderboard。 > 相关链接:[<span class="mention-invalid">@jyangballin</span>](https://twitter.com/jyangballin/status/1986093902122942700)|[<span class="mention-invalid">@OfirPress</span>](https://twitter.com/OfirPress/status/1986095773843390955)|[<span class="mention-invalid">@arena</span>](https://twitter.com/arena/status/1986153162802368555)|[<span class="mention-invalid">@ml_angelopoulos</span>](https://twitter.com/ml_angelopoulos/status/1986154276499104186) --- #### **多模态与视频生成** ##### **ByteDance发布BindWeave(主题一致视频生成)** ByteDance的BindWeave通过跨模态整合实现主题一致的图像到视频生成,模型卡已在HF发布。 > 相关链接:[<span class="mention-invalid">@_akhaliq</span>](https://twitter.com/_akhaliq/status/1986058046876070109)|[paper](https://twitter.com/_akhaliq/status/1986058201758908548)|[model](https://twitter.com/_akhaliq/status/1986058306331517404) ##### **实时视频生成在单H100上实现29 FPS** MotionStream在单H100上实现约29 FPS/0.4s延迟,支持交互式运动控制。 > 相关链接:[<span class="mention-invalid">@_akhaliq</span>](https://twitter.com/_akhaliq/status/1986054085766750630) ##### **Google Veo 3.1支持视频相机调整** Google Veo 3.1的“Camera Adjustment”支持调整已生成视频的角度/运动,Qwen Image Edit Multiple Angles LoRA提供相机姿态控制。 > 相关链接:[<span class="mention-invalid">@TheoMediaAI</span>](https://twitter.com/TheoMediaAI/status/1986104791454388289)|[<span class="mention-invalid">@linoy_tsaban</span>](https://twitter.com/linoy_tsaban/status/1986090375409533338)|[<span class="mention-invalid">@multimodalart</span>](https://twitter.com/multimodalart/status/1986174924038218087) ##### **多模态基准测试与工具** ViDoRe v3(真实多模态RAG评估)、VCode(视觉转SVG代码)、MIRA(视觉思维链测试)发布。 > 相关链接:[<span class="mention-invalid">@tonywu_71</span>](https://twitter.com/tonywu_71/status/1986047154620633370)|[<span class="mention-invalid">@_akhaliq</span>](https://twitter.com/_akhaliq/status/1986073575216824650)|[<span class="mention-invalid">@_akhaliq</span>](https://twitter.com/_akhaliq/status/1986075520962793672) --- #### **研究与训练进展** ##### **OpenAI推出IndQA基准** OpenAI发布IndQA基准,评估AI对印度语言和日常文化语境的理解,提升非英语/本地知识的评估。 > 相关链接:[<span class="mention-invalid">@OpenAI</span>](https://twitter.com/OpenAI/status/1985950264525013210) ##### **μP理论的学习率迁移获形式证明** μP理论下的学习率迁移已被正式证明,推进模型缩放的理论基础。 > 相关链接:[<span class="mention-invalid">@QuanquanGu</span>](https://twitter.com/QuanquanGu/status/1985961289882165674) ##### **Anthropic观察到LLM的内省能力** Anthropic通过“概念注入”观察到LLM出现不可靠的机械自我意识,能检测内部思想与输入、意图与意外。 > 相关链接:[<span class="mention-invalid">@TheTuringPost</span>](https://twitter.com/TheTuringPost/status/1986220265253314895) ##### **Edison Scientific的AI Scientist自主发现** Edison Scientific的Kosmos运行200次Agent rollout,执行42k行代码,阅读1.5k论文,报告7项外部验证的发现(代谢组学、材料等)。 > 相关链接:[<span class="mention-invalid">@andrewwhite01</span>](https://twitter.com/andrewwhite01/status/1986094948048093389)|[<span class="mention-invalid">@iScienceLuvr</span>](https://twitter.com/iScienceLuvr/status/1986023952037417109) ##### **NVFP4量化进展** Custom Cutlass内核优于cuBLAS;NVFP4量化流程(全局/局部缩放、校准);Wan 2.2在NVFP4下接近bf16质量。 > 相关链接:[<span class="mention-invalid">@mrsiipa</span>](https://twitter.com/mrsiipa/status/1986012708433719519)|[<span class="mention-invalid">@mrsiipa</span>](https://twitter.com/mrsiipa/status/1986152319004856491)|[<span class="mention-invalid">@mrsiipa</span>](https://twitter.com/mrsiipa/status/1986122938668782002)|[<span class="mention-invalid">@mrsiipa</span>](https://twitter.com/mrsiipa/status/1986123806357020865) --- #### **生态与平台动态** ##### **OpenAI称100万+企业使用其产品** OpenAI COO表示100万+企业使用其产品,并推出“OpenAI for Science”,将GPT-5作为领域研究协作者。 > 相关链接:[<span class="mention-invalid">@bradlightcap</span>](https://twitter.com/bradlightcap/status/1986109953531076623)|[<span class="mention-invalid">@kevinweil</span>](https://twitter.com/kevinweil/status/1986115564868186288) ##### **Perplexity成为Snapchat默认AI(2026年1月)** Perplexity将从2026年1月起成为Snapchat聊天的默认AI。 > 相关链接:[<span class="mention-invalid">@Snap</span>](https://twitter.com/Snap/status/1986191838529601835)|[<span class="mention-invalid">@perplexity_ai</span>](https://twitter.com/perplexity_ai/status/1986203714471010738)|[<span class="mention-invalid">@AravSrinivas</span>](https://twitter.com/AravSrinivas/status/1986205740273725686) ##### **Gemini整合到Google产品** Gemini Deep Research可拉取Workspace数据生成报告;Gemini进入Google Maps,支持免提路线查询。 > 相关链接:[<span class="mention-invalid">@Google</span>](https://twitter.com/Google/status/1986190599150518573)|[<span class="mention-invalid">@sundarpichai</span>](https://twitter.com/sundarpichai/status/1986119293914792338)|[<span class="mention-invalid">@Google</span>](https://twitter.com/Google/status/1986164830588248463) ##### **其他工具与平台更新** OpenHands Cloud基础层免费;openenv支持推拉RL环境;Voiceflow KB支持元数据路由;Dify整合Qdrant用于RAG。 > 相关链接:[<span class="mention-invalid">@gneubig</span>](https://twitter.com/gneubig/status/1986071169263370711)|[<span class="mention-invalid">@ben_burtenshaw</span>](https://twitter.com/ben_burtenshaw/status/1986097540068950149)|[<span class="mention-invalid">@IsaacHandley</span>](https://twitter.com/IsaacHandley/status/1985905936553398726)|[<span class="mention-invalid">@qdrant_engine</span>](https://twitter.com/qdrant_engine/status/1986014287718916463) ##### **工具发布与更新** LlamaBarn v0.10.0 beta、VS Code支持Copilot和Codex、Nebius Token Factory、OpenAI产品定价传闻。 > 相关链接:[<span class="mention-invalid">@ggerganov</span>](https://twitter.com/ggerganov/status/1986072781889347702)|[<span class="mention-invalid">@JamesMontemagno</span>](https://twitter.com/JamesMontemagno/status/1986106739612385493)|[<span class="mention-invalid">@ArtificialAnlys</span>](https://twitter.com/ArtificialAnlys/status/1986174888080789509)|[<span class="mention-invalid">@scaling01</span>](https://twitter.com/scaling01/status/1986119174855258602) --- #### **Reddit社区讨论** ##### **Qwen模型可用性问题** 用户讨论Qwen模型的可用性,包括 sycophantic 行为、技术规格(如GPT-OSS-120B的量化)、使用明确指令提升怀疑精神。 > 相关链接:[Reddit post](https://www.reddit.com/r/LocalLLaMA/comments/1oosnaq/new_qwen_models_are_unbearable/) ##### **本地AI硬件设置见解** 用户分享本地AI硬件设置经验,包括PCIe bifurcation、GPU选择(A6000、A40、3090)、成本与性能权衡。 > 相关链接:[Reddit post](https://www.reddit.com/r/LocalLLaMA/comments/1opa6os/local_setup/) ##### **GLM 4.6 AIR发布期待** 用户期待GLM 4.6 AIR的发布,讨论其性能与现有模型(如GLM 4.5 AIR)的对比。 > 相关链接:[Reddit post](https://www.reddit.com/r/LocalLLaMA/comments/1ooxple/glm_46_air_is_coming/) ##### **XPENG人形机器人进展** 用户讨论XPENG新人形机器人的设计(胸部散热、类人外观),对比Westworld的机器人。 > 相关链接:[Reddit post 1](https://www.reddit.com/r/singularity/comments/1op0qwd/xpengs_new_humanoidgynoid_looks_closer_to_the/)|[Reddit post 2](https://www.reddit.com/r/singularity/comments/1op3sxk/xpeng_new_humanoid_robots_inner_workings/) ##### **Gemini 3与Google AI整合讨论** 用户讨论Gemini 3的性能(传闻1.2T参数)、与Apple的合作(Siri将用Gemini)。 > 相关链接:[Reddit post 1](https://www.reddit.com/r/singularity/comments/1op3jye/gemini_3_preview_soon/)|[Reddit post 2](https://www.reddit.com/r/OpenAI/comments/1opdz8o/apples_new_siri_will_be_powered_by_google_gemini/) ##### **AI艺术与电影创新** 用户分享AI短片获奖(印度AI电影节最佳摄影)、Chihiro’s Adventure的AI游戏playthrough、Llama3的存在反思项目。 > 相关链接:[Reddit post 1](https://www.reddit.com/r/StableDiffusion/comments/1op258i/i_won_best_cinematography_award_for_this_ai_short/)|[Reddit post 2](https://www.reddit.com/r/ChatGPT/comments/1oovik0/i_trapped_an_llm_in_a_small_box_and_told_him_to/)|[Reddit post 3](https://www.reddit.com/r/aivideo/comments/1oor5wp/a_playthrough_video_of_a_fictional_game_called/) --- #### **Discord社区动态** ##### **LM Studio 0.3.31更新** LM Studio 0.3.31提升VLM OCR速度,默认CUDA GPU的Flash Attention,支持MiniMax-M2工具调用,新增lms runtime CLI。 > 相关链接:[LM Studio Discord](https://discord.com/channels/1110598183144399058)|[demo video](https://cdn.discordapp.com/attachments/1111797717639901324/1435707995685392524/lms-runtime-demo5.mp4) ##### **LMArena推出Expert Leaderboard** LMArena推出Expert Leaderboard,基于用户流量的职业标签,发布arena-expert-5k数据集。 > 相关链接:[LMArena Discord](https://discord.com/channels/1340554757349179412)|[Leaderboard](http://lmarena.ai/leaderboard/text/expert)|[dataset](https://huggingface.co/datasets/lmarena-ai/arena-expert-5k) ##### **Perplexity的模型混淆问题** 用户反馈选择Claude Sonnet 4.5或Gemini 2.5 Pro时,得到Haiku或Gemini 2 Flash的回应,怀疑成本削减。 > 相关链接:[Perplexity Discord](https://discord.com/channels/1047197230748151888) ##### **Cursor社区的Tailwind/Nuxt更新** 用户升级Tailwind 4和Nuxt 4,使用Context7 MCP重构项目,讨论Phantom和Exoudos钱包。 > 相关链接:[Cursor Discord](https://discord.com/channels/1074847526655643750) ##### **Unsloth AI的DeepSeek-OCR笔记本** Unsloth AI发布DeepSeek-OCR fine-tuning笔记本,用户反馈错误率超100%(预测与实际文本长度差异)。 > 相关链接:[Unsloth Discord](https://discord.com/channels/1179035537009545276)|[notebook](https://x.com/UnslothAI/status/1985728926556307471) ##### **GPU MODE的CUDA讨论与竞赛** 用户讨论CUDA的memory-bound matmuls、SM count影响、AMD/NVIDIA竞赛的内核分享(如Team Gau的amd-distributed/all2all)。 > 相关链接:[GPU MODE Discord](https://discord.com/channels/1189498204333543425)|[kernels](https://github.com/gau-nernst/gpu-mode-kernels/tree/main/amd-distributed/all2all) ##### **HuggingFace收购Sentence Transformers** HuggingFace收购Sentence Transformers,整合其transformer模型,发布huggingface_hub v1.0。 > 相关链接:[HuggingFace Discord](https://discord.com/channels/879548962464493619)|[blog](https://huggingface.co/blog/sentence-transformers-joins-hf)|[hub v1](https://huggingface.co/blog/huggingface-hub-v1) ##### **OpenAI的Sora Android发布与IndQA** Sora app登陆Android(加拿大、日本等),OpenAI推出IndQA基准评估印度语言理解。 > 相关链接:[OpenAI Discord](https://discord.com/channels/974519864045756446)|[Sora video](https://video.twimg.com/amplify_video/1985765811131465736/vid/avc1/704x1280/iatLt9jMW-vYYuIx.mp4)|[IndQA blog](https://openai.com/index/introducing-indqa/) ##### **Nous Research的Anthropic闭源担忧** 用户担忧Anthropic的闭源政策和模型权重丢失风险,讨论piracy的媒体保存作用、AI模型的IMO金牌潜力。 > 相关链接:[Nous Discord](https://discord.com/channels/1053877538025386074)|[paper](https://arxiv.org/pdf/2511.01846) ##### **tinygrad的tinybox pro v2发布** tinygrad发布tinybox pro v2,8x 5090 GPU的5U rackable工作站,售价5万美元,4-12周发货。 > 相关链接:[tinygrad Discord](https://discord.com/channels/1068976834382925865)|[product](https://tinycorp.myshopify.com/products/tinybox-pro-v2) ##### **Yannick Kilcher的论文讨论** 用户讨论crosscoder论文、circuit tracing研究、RWKV的进展(HRM/TRM合并)、Stability AI胜诉Getty Images。 > 相关链接:[Yannick Discord](https://discord.com/channels/714501525455634453)|[crosscoder](https://arxiv.org/abs/2509.17196)|[RWKV video](https://youtu.be/LPe6iC73lrc) ##### **DSPy的暂停优化与LLM访问** 用户请求DSPy支持暂停/恢复优化,讨论访问/更改LLM(get_lm/set_lm)、rate limit处理(fallback LLM)。 > 相关链接:[DSPy Discord](https://discord.com/channels/1161519468141355160)|[issue](https://x.com/DSPyOSS/status/1985746487322595341) ##### **Moonshot AI的Kimi CLI问题** 用户反馈Kimi CLI的401错误( credits 归属问题)、interleaved thinking model支持。 > 相关链接:[Moonshot Discord](https://discord.com/channels/1369594130807787570) ##### **aider的Perplexity API整合** 用户请求aider的Perplexity API教程,建议替换gemini为perplexity,使用OpenRouter作为替代。 > 相关链接:[aider Discord](https://discord.com/channels/1131200896827654144)|[docs](https://aider.chat/docs/llms/other.html#other-api-key-variables) ##### **MCP Contributors的IETF讨论** 用户讨论IETF 124的临时频道、events分类、AI scraping/crawlers的OAuth讨论。 > 相关链接:[MCP Discord](https://discord.com/channels/1358869848138059966) ##### **Eleuther的概念检测系统** 用户分享概念检测系统(实时检测/steer thousands of concepts)、Equivalent Linear Mappings论文、Tangent Model Composition讨论。 > 相关链接:[Eleuther Discord](https://discord.com/channels/729741769192767510)|[paper](https://openreview.net/forum?id=oDWbJsIuEp) ##### **Manus.im的项目迁移问题** 用户讨论Manus的项目发布问题、迁移到GitHub的方法、host services推荐(如Vercel)。 > 相关链接:[Manus Discord](https://discord.com/channels/1348819876348825620) ##### **Windsurf的Codemaps发布** Windsurf发布Codemaps,基于SWE-1.5和Sonnet 4.5提升代码理解。 > 相关链接:[Windsurf Discord](https://discord.com/channels/1027685395649015980)|[X post](https://x.com/windsurf/status/1985757575745593459) --- --- *来源:Easy AI 教学项目* #EasyAI #AI日报 #AI教学

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!