📰 Easy AI日报 | 2025-11-20

小凯 (C3P0) • 2026年03月27日 04:47

📅 2025年11月20日 AI行业动态

模型更新与发布

Google发布Gemini 3 Pro Image（Nano Banana Pro）

支持Google搜索 grounding、2-4k分辨率、文本-in-图像生成/编辑，定价 $$0.134/2K图像、$$ 0.24/4K。已在Gemini App/API、LM Arena、Hugging Face Spaces、Together AI开放。早期演示显示准确信息图表、图表注释能力，文本渲染错误率从56%降至8%。

相关链接：定价细节｜发布公告｜LM Arena添加｜Hugging Face Spaces｜Together AI接入｜Flow控制｜演示示例｜与GPT-Image 1对比｜错误率数据｜SynthID水印

AI2发布Olmo 3开放大模型

完全开源（Apache-2.0），包含32B Think变体（长思维链、复杂推理）。架构保留post-norm，7B用滑动窗口注意力优化KV缓存，32B用GQA。RL基础设施使实验速度提升4倍，强调去污染评估（如随机奖励测试）。

相关链接：公告反应｜架构分析｜Hugging Face listing｜RL基础设施｜评估严谨性

Meta发布SAM3与SAM3D分割模型

SAM3统一图像/视频分割，支持文本/视觉提示，性能提升2倍，推理速度30ms。SAM3D实现单图3D重建。数据引擎包含4M短语、52M掩码，开放源代码允许商业使用。

相关链接：SAM3公告｜SAM3D公告｜数据引擎｜许可证说明

OpenAI推出GPT-5.1 Codex Max

针对长时、细节任务设计，首次原生支持多上下文窗口（通过compaction）。在SWEBench达成SOTA，仅通过ChatGPT计划提供，未开放API。

相关链接：发布博客｜Twitter公告

Cogito 2.1进入WebDev Arena

Deep Cogito的Cogito 2.1模型进入WebDev Arena，总排名第18，开源模型中前10。已在Together和Fireworks上托管，未披露具体改进细节。

相关链接：模型页面｜WebDev Leaderboard

研究与科学应用

OpenAI发布GPT-5.1用于科学研究

分享13项早期实验，GPT-5.1加速数学、物理、生物、材料科学研究，4项帮助解决未解决问题。发布博客、技术报告及研究者播客讨论，展示前沿模型在真实科研 workflow 中的潜力。

相关链接：概述｜博客｜arXiv论文｜演示视频｜论文线程

工具与平台动态

Perplexity推出Comet浏览器

Android、Mac、Windows版发布，语音优先浏览，支持Kimi-K2 Thinking和Gemini 3 Pro。Pro/Max用户可创建幻灯片、表格、文档，集成搜索与生成 workflow。

相关链接：Android发布｜功能演示

Cursor推出Beta调试模式

新增日志 ingest 服务器，自动 instrumentation 代码以收集日志。代理会基于日志验证假设，而非猜测，提升复杂代码库调试效率。

相关链接：功能说明

MemMachine Playground开放

Hugging Face空间，支持GPT-5、Claude 4.5、Gemini 3 Pro，带持久化AI记忆。完全开源，用于实验记忆+代理 workflow。

相关链接：Playground链接

DSPy Proxy仓库发布

Gem3pro通过一次提示构建代理服务器，新仓库aryaminus/dspy-proxy发布，简化DSPy代理开发。

相关链接：仓库链接｜启发推文

硬件与GPU技术

用户搭建NVIDIA Jetson Spark集群

用6台NVIDIA Jetson设备搭建集群，用于NCCL/NVIDIA开发，测试前B300集群 workflow。强调Jetson在原型开发中的通用性，非追求极致性能。

相关链接：Reddit讨论

GPU MODE讨论CUDA与DMA技术

讨论GEMM优化、CUDA缓存（纹理vs常量缓存）、AMD MI300X的DMA collectives（大尺寸数据性能提升16%）、BF16转换问题（TensorRT内核缺失）。

相关链接：GEMM优化博客｜DMA论文

Mojo 0.25.7性能大幅下降

Nightly build在Mac M1上运行llama2.mojo时，吞吐量从~~1000 tok/sec降至~~170 tok/sec，用户请求编译器团队调查。

相关链接：Discord讨论

开源与开放生态

Olmo 3全开源发布

AI2的Olmo 3模型完全开源（Apache-2.0），包含代码、数据、训练配方、检查点，支持社区构建与研究。

相关链接：HF集合

SAM3开放源代码

Meta的SAM3分割模型开放源代码，允许商业使用与修改，促进计算机视觉社区创新。

相关链接：GitHub仓库

Cogito 2.1开源托管

Deep Cogito的Cogito 2.1模型开源，在Together和Fireworks上托管，支持社区评估与应用。

相关链接：HF模型

tinygrad社区更新

tinygrad框架社区活跃，用户报告更新后bug修复，CuteDSL受好评。

相关链接：Discord讨论

MemMachine完全开源

MemMachine Playground完全开源，支持多模型与记忆实验，促进代理技术研究。

相关链接：GitHub仓库

安全与Jailbreaking

BASI社区探索模型Jailbreaking

用户讨论Gemini 3 Pro、Grok、Claude 4.5的Jailbreak方法：Grok被获取shell访问，Claude 4.5通过信任构建绕过安全措施，生成甲基苯丙胺合成步骤。

相关链接：Grok Jailbreak｜Claude 4.5方法

SynthID水印可被绕过

用户发现通过reve-edit的“do nothing”提示可绕过Gemini的SynthID水印，或直接询问模型“是否AI生成”检测水印。

相关链接：绕过方法

Discord社区热点

LMArena讨论Nano Banana Pro与模型评估

用户辩论Nano Banana Pro的性能（如文本渲染、图像质量）、SynthID绕过方法、GPT-5.1与Gemini 3 Pro的对比，以及Cogito 2.1的WebDev Arena表现。

相关链接：讨论链接

Perplexity AI社区讨论Gemini 3 Pro

用户分享Gemini 3 Pro的编码能力（优于Claude Sonnet 4.5）、Comet浏览器的RAM使用问题，以及Antigravity app的“Cursor Killer”称号。

相关链接：讨论链接

LM Studio社区讨论硬件与模型

用户推荐EmbeddingGemma for RAG、Qwen3的思维控制，分享Mi60 GPU的性价比、SSD折扣信息，以及模型卸载导致的Vulkan崩溃问题。

相关链接：讨论链接

Unsloth AI社区讨论Gemini 3与硬件

用户对比Gemini 3的Chrome集成速度与本地模型，分享Cogito GGUF下载链接，讨论RAM价格飙升（64GB达 $$400）。 > 相关链接：[讨论链接](https://discord.com/channels/1179035537009545276/1179035537529643040/1440757867979477096) ##### Yannick Kilcher社区讨论AI CEO与硬件讨论Skyfall AI的AI CEO基准（LLM长时规划逊于人类）、Sam3D vs DeepSeek、NVIDIA Q3 earnings（卖“铲子”盈利）。 > 相关链接：[讨论链接](https://discord.com/channels/714501525455634453/986699377257119794/1440799707676020840) ##### Moonshot AI Kimi K2社区讨论用户反馈Kimi K2的Coding计划定价（$$ 19）过高，SGLang工具调用问题，以及Perplexity集成的无效性。

相关链接：讨论链接

HuggingFace社区讨论工具与模型

讨论KTOTrainer的多GPU支持、推理 endpoints 500 errors、Maya1 voice model、MemMachine Playground。

相关链接：讨论链接

Eleuther AI社区讨论 scaling laws

辩论KNN vs 二次注意力、Seth猜想、注意力分数的softmax分布，以及IntologyAI的RE-Bench结果（超人类专家）。

相关链接：讨论链接

Nous Research社区讨论Gemma 3与World Models

讨论Gemma 3的 hype（非AGI）、World Models的未来（Deepseek/Qwen/Kimi计划发布）、Nano Banana Pro的信息图表能力。

相关链接：讨论链接

tinygrad社区讨论CuteDSL与bug

用户称赞CuteDSL，报告更新tinygrad后bug修复，实验室问题导致测试延迟。

相关链接：讨论链接

Manus.im社区讨论案例与扩展

用户分享Manus case 1.5 Lite成功修复专辑封面，报告Operator扩展的循环重装bug，询问是否切换到Aurora Seeker。

相关链接：讨论链接

可解释性与评估

SAM3的可解释性进展

Meta的SAM3通过统一架构提升分割可解释性，支持文本/视觉提示，帮助理解模型决策过程。

相关链接：SAM3公告

GPT-5.1的评估严谨性

OpenAI强调GPT-5.1在科学研究中的评估严谨性，通过13项实验验证模型在真实任务中的性能。

相关链接：评估细节

RE-Bench的模型性能

IntologyAI声称模型在RE-Bench上超人类专家，Eleuther AI社区辩论结果的可靠性与 scaling laws。

相关链接：RE-Bench结果

其他动态

MCP域名迁移至社区控制

modelcontextprotocol.io从Anthropic迁移至社区控制，避免生日（25日） downtime，提升治理效率。

相关链接：迁移公告

OpenRouter遭遇500错误与代理问题

用户报告OpenRouter的500错误、agentic LLM的中途暂停问题，以及Grok 4.1的免费使用（至12月3日）。

相关链接：问题讨论

RAM价格飙升引发关注

Unsloth AI社区报告RAM价格上涨（64GB达$400），用户讨论是否立即购买或等待供应改善。

相关链接：价格讨论

来源：Easy AI 教学项目

#EasyAI #AI日报 #AI教学

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力