📰 Easy AI日报 | 2025-11-20

📅 2025年11月20日 AI行业动态

#### 模型更新与发布 ##### Google发布Gemini 3 Pro Image（Nano Banana Pro）支持Google搜索 grounding、2-4k分辨率、文本-in-图像生成/编辑，定价$0.134/2K图像、$0.24/4K。已在Gemini App/API、LM Arena、Hugging Face Spaces、Together AI开放。早期演示显示准确信息图表、图表注释能力，文本渲染错误率从56%降至8%。 > 相关链接：定价细节｜发布公告｜LM Arena添加｜Hugging Face Spaces｜Together AI接入｜Flow控制｜演示示例｜与GPT-Image 1对比｜错误率数据｜SynthID水印

##### AI2发布Olmo 3开放大模型完全开源（Apache-2.0），包含32B Think变体（长思维链、复杂推理）。架构保留post-norm，7B用滑动窗口注意力优化KV缓存，32B用GQA。RL基础设施使实验速度提升4倍，强调去污染评估（如随机奖励测试）。 > 相关链接：公告反应｜架构分析｜Hugging Face listing｜RL基础设施｜评估严谨性

##### Meta发布SAM3与SAM3D分割模型 SAM3统一图像/视频分割，支持文本/视觉提示，性能提升2倍，推理速度30ms。SAM3D实现单图3D重建。数据引擎包含4M短语、52M掩码，开放源代码允许商业使用。 > 相关链接：SAM3公告｜SAM3D公告｜数据引擎｜许可证说明

##### OpenAI推出GPT-5.1 Codex Max 针对长时、细节任务设计，首次原生支持多上下文窗口（通过compaction）。在SWEBench达成SOTA，仅通过ChatGPT计划提供，未开放API。 > 相关链接：发布博客｜Twitter公告

##### Cogito 2.1进入WebDev Arena Deep Cogito的Cogito 2.1模型进入WebDev Arena，总排名第18，开源模型中前10。已在Together和Fireworks上托管，未披露具体改进细节。 > 相关链接：模型页面｜WebDev Leaderboard

---

#### 研究与科学应用 ##### OpenAI发布GPT-5.1用于科学研究分享13项早期实验，GPT-5.1加速数学、物理、生物、材料科学研究，4项帮助解决未解决问题。发布博客、技术报告及研究者播客讨论，展示前沿模型在真实科研 workflow 中的潜力。 > 相关链接：概述｜博客｜arXiv论文｜演示视频｜论文线程

---

#### 工具与平台动态 ##### Perplexity推出Comet浏览器 Android、Mac、Windows版发布，语音优先浏览，支持Kimi-K2 Thinking和Gemini 3 Pro。Pro/Max用户可创建幻灯片、表格、文档，集成搜索与生成 workflow。 > 相关链接：Android发布｜功能演示

##### Cursor推出Beta调试模式新增日志 ingest 服务器，自动 instrumentation 代码以收集日志。代理会基于日志验证假设，而非猜测，提升复杂代码库调试效率。 > 相关链接：功能说明

##### MemMachine Playground开放 Hugging Face空间，支持GPT-5、Claude 4.5、Gemini 3 Pro，带持久化AI记忆。完全开源，用于实验记忆+代理 workflow。 > 相关链接：Playground链接

##### DSPy Proxy仓库发布 Gem3pro通过一次提示构建代理服务器，新仓库aryaminus/dspy-proxy发布，简化DSPy代理开发。 > 相关链接：仓库链接｜启发推文

---

#### 硬件与GPU技术 ##### 用户搭建NVIDIA Jetson Spark集群用6台NVIDIA Jetson设备搭建集群，用于NCCL/NVIDIA开发，测试前B300集群 workflow。强调Jetson在原型开发中的通用性，非追求极致性能。 > 相关链接：Reddit讨论

##### GPU MODE讨论CUDA与DMA技术讨论GEMM优化、CUDA缓存（纹理vs常量缓存）、AMD MI300X的DMA collectives（大尺寸数据性能提升16%）、BF16转换问题（TensorRT内核缺失）。 > 相关链接：GEMM优化博客｜DMA论文

##### Mojo 0.25.7性能大幅下降 Nightly build在Mac M1上运行llama2.mojo时，吞吐量从~1000 tok/sec降至~170 tok/sec，用户请求编译器团队调查。 > 相关链接：Discord讨论

---

#### 开源与开放生态 ##### Olmo 3全开源发布 AI2的Olmo 3模型完全开源（Apache-2.0），包含代码、数据、训练配方、检查点，支持社区构建与研究。 > 相关链接：HF集合

##### SAM3开放源代码 Meta的SAM3分割模型开放源代码，允许商业使用与修改，促进计算机视觉社区创新。 > 相关链接：GitHub仓库

##### Cogito 2.1开源托管 Deep Cogito的Cogito 2.1模型开源，在Together和Fireworks上托管，支持社区评估与应用。 > 相关链接：HF模型

##### tinygrad社区更新 tinygrad框架社区活跃，用户报告更新后bug修复，CuteDSL受好评。 > 相关链接：Discord讨论

##### MemMachine完全开源 MemMachine Playground完全开源，支持多模型与记忆实验，促进代理技术研究。 > 相关链接：GitHub仓库

---

#### 安全与Jailbreaking ##### BASI社区探索模型Jailbreaking 用户讨论Gemini 3 Pro、Grok、Claude 4.5的Jailbreak方法：Grok被获取shell访问，Claude 4.5通过信任构建绕过安全措施，生成甲基苯丙胺合成步骤。 > 相关链接：Grok Jailbreak｜Claude 4.5方法

##### SynthID水印可被绕过用户发现通过reve-edit的“do nothing”提示可绕过Gemini的SynthID水印，或直接询问模型“是否AI生成”检测水印。 > 相关链接：绕过方法

---

#### Discord社区热点 ##### LMArena讨论Nano Banana Pro与模型评估用户辩论Nano Banana Pro的性能（如文本渲染、图像质量）、SynthID绕过方法、GPT-5.1与Gemini 3 Pro的对比，以及Cogito 2.1的WebDev Arena表现。 > 相关链接：讨论链接

##### Perplexity AI社区讨论Gemini 3 Pro 用户分享Gemini 3 Pro的编码能力（优于Claude Sonnet 4.5）、Comet浏览器的RAM使用问题，以及Antigravity app的“Cursor Killer”称号。 > 相关链接：讨论链接

##### LM Studio社区讨论硬件与模型用户推荐EmbeddingGemma for RAG、Qwen3的思维控制，分享Mi60 GPU的性价比、SSD折扣信息，以及模型卸载导致的Vulkan崩溃问题。 > 相关链接：讨论链接

##### Unsloth AI社区讨论Gemini 3与硬件用户对比Gemini 3的Chrome集成速度与本地模型，分享Cogito GGUF下载链接，讨论RAM价格飙升（64GB达$400）。 > 相关链接：讨论链接

##### Yannick Kilcher社区讨论AI CEO与硬件讨论Skyfall AI的AI CEO基准（LLM长时规划逊于人类）、Sam3D vs DeepSeek、NVIDIA Q3 earnings（卖“铲子”盈利）。 > 相关链接：讨论链接

##### Moonshot AI Kimi K2社区讨论用户反馈Kimi K2的Coding计划定价（$19）过高，SGLang工具调用问题，以及Perplexity集成的无效性。 > 相关链接：讨论链接

##### HuggingFace社区讨论工具与模型讨论KTOTrainer的多GPU支持、推理 endpoints 500 errors、Maya1 voice model、MemMachine Playground。 > 相关链接：讨论链接

##### Eleuther AI社区讨论 scaling laws 辩论KNN vs 二次注意力、Seth猜想、注意力分数的softmax分布，以及IntologyAI的RE-Bench结果（超人类专家）。 > 相关链接：讨论链接

##### Nous Research社区讨论Gemma 3与World Models 讨论Gemma 3的 hype（非AGI）、World Models的未来（Deepseek/Qwen/Kimi计划发布）、Nano Banana Pro的信息图表能力。 > 相关链接：讨论链接

##### tinygrad社区讨论CuteDSL与bug 用户称赞CuteDSL，报告更新tinygrad后bug修复，实验室问题导致测试延迟。 > 相关链接：讨论链接

##### Manus.im社区讨论案例与扩展用户分享Manus case 1.5 Lite成功修复专辑封面，报告Operator扩展的循环重装bug，询问是否切换到Aurora Seeker。 > 相关链接：讨论链接

---

#### 可解释性与评估 ##### SAM3的可解释性进展 Meta的SAM3通过统一架构提升分割可解释性，支持文本/视觉提示，帮助理解模型决策过程。 > 相关链接：SAM3公告

##### GPT-5.1的评估严谨性 OpenAI强调GPT-5.1在科学研究中的评估严谨性，通过13项实验验证模型在真实任务中的性能。 > 相关链接：评估细节

##### RE-Bench的模型性能 IntologyAI声称模型在RE-Bench上超人类专家，Eleuther AI社区辩论结果的可靠性与 scaling laws。 > 相关链接：RE-Bench结果

---

#### 其他动态 ##### MCP域名迁移至社区控制 modelcontextprotocol.io从Anthropic迁移至社区控制，避免生日（25日） downtime，提升治理效率。 > 相关链接：迁移公告

##### OpenRouter遭遇500错误与代理问题用户报告OpenRouter的500错误、agentic LLM的中途暂停问题，以及Grok 4.1的免费使用（至12月3日）。 > 相关链接：问题讨论

##### RAM价格飙升引发关注 Unsloth AI社区报告RAM价格上涨（64GB达$400），用户讨论是否立即购买或等待供应改善。 > 相关链接：价格讨论

---

--- *来源：Easy AI 教学项目*

#EasyAI #AI日报 #AI教学

📰 Easy AI日报 | 2025-11-20

📅 2025年11月20日 AI行业动态

🌟 智谱 GLM-5 已上线