📅 2025年11月20日 AI行业动态
#### 模型更新与发布 ##### Google发布Gemini 3 Pro Image(Nano Banana Pro) 支持Google搜索 grounding、2-4k分辨率、文本-in-图像生成/编辑,定价$0.134/2K图像、$0.24/4K。已在Gemini App/API、LM Arena、Hugging Face Spaces、Together AI开放。早期演示显示准确信息图表、图表注释能力,文本渲染错误率从56%降至8%。 > 相关链接:定价细节|发布公告|LM Arena添加|Hugging Face Spaces|Together AI接入|Flow控制|演示示例|与GPT-Image 1对比|错误率数据|SynthID水印
##### AI2发布Olmo 3开放大模型 完全开源(Apache-2.0),包含32B Think变体(长思维链、复杂推理)。架构保留post-norm,7B用滑动窗口注意力优化KV缓存,32B用GQA。RL基础设施使实验速度提升4倍,强调去污染评估(如随机奖励测试)。 > 相关链接:公告反应|架构分析|Hugging Face listing|RL基础设施|评估严谨性
##### Meta发布SAM3与SAM3D分割模型 SAM3统一图像/视频分割,支持文本/视觉提示,性能提升2倍,推理速度30ms。SAM3D实现单图3D重建。数据引擎包含4M短语、52M掩码,开放源代码允许商业使用。 > 相关链接:SAM3公告|SAM3D公告|数据引擎|许可证说明
##### OpenAI推出GPT-5.1 Codex Max 针对长时、细节任务设计,首次原生支持多上下文窗口(通过compaction)。在SWEBench达成SOTA,仅通过ChatGPT计划提供,未开放API。 > 相关链接:发布博客|Twitter公告
##### Cogito 2.1进入WebDev Arena Deep Cogito的Cogito 2.1模型进入WebDev Arena,总排名第18,开源模型中前10。已在Together和Fireworks上托管,未披露具体改进细节。 > 相关链接:模型页面|WebDev Leaderboard
---
#### 研究与科学应用 ##### OpenAI发布GPT-5.1用于科学研究 分享13项早期实验,GPT-5.1加速数学、物理、生物、材料科学研究,4项帮助解决未解决问题。发布博客、技术报告及研究者播客讨论,展示前沿模型在真实科研 workflow 中的潜力。 > 相关链接:概述|博客|arXiv论文|演示视频|论文线程
---
#### 工具与平台动态 ##### Perplexity推出Comet浏览器 Android、Mac、Windows版发布,语音优先浏览,支持Kimi-K2 Thinking和Gemini 3 Pro。Pro/Max用户可创建幻灯片、表格、文档,集成搜索与生成 workflow。 > 相关链接:Android发布|功能演示
##### Cursor推出Beta调试模式 新增日志 ingest 服务器,自动 instrumentation 代码以收集日志。代理会基于日志验证假设,而非猜测,提升复杂代码库调试效率。 > 相关链接:功能说明
##### MemMachine Playground开放 Hugging Face空间,支持GPT-5、Claude 4.5、Gemini 3 Pro,带持久化AI记忆。完全开源,用于实验记忆+代理 workflow。 > 相关链接:Playground链接
##### DSPy Proxy仓库发布 Gem3pro通过一次提示构建代理服务器,新仓库aryaminus/dspy-proxy发布,简化DSPy代理开发。 > 相关链接:仓库链接|启发推文
---
#### 硬件与GPU技术 ##### 用户搭建NVIDIA Jetson Spark集群 用6台NVIDIA Jetson设备搭建集群,用于NCCL/NVIDIA开发,测试前B300集群 workflow。强调Jetson在原型开发中的通用性,非追求极致性能。 > 相关链接:Reddit讨论
##### GPU MODE讨论CUDA与DMA技术 讨论GEMM优化、CUDA缓存(纹理vs常量缓存)、AMD MI300X的DMA collectives(大尺寸数据性能提升16%)、BF16转换问题(TensorRT内核缺失)。 > 相关链接:GEMM优化博客|DMA论文
##### Mojo 0.25.7性能大幅下降 Nightly build在Mac M1上运行llama2.mojo时,吞吐量从~1000 tok/sec降至~170 tok/sec,用户请求编译器团队调查。 > 相关链接:Discord讨论
---
#### 开源与开放生态 ##### Olmo 3全开源发布 AI2的Olmo 3模型完全开源(Apache-2.0),包含代码、数据、训练配方、检查点,支持社区构建与研究。 > 相关链接:HF集合
##### SAM3开放源代码 Meta的SAM3分割模型开放源代码,允许商业使用与修改,促进计算机视觉社区创新。 > 相关链接:GitHub仓库
##### Cogito 2.1开源托管 Deep Cogito的Cogito 2.1模型开源,在Together和Fireworks上托管,支持社区评估与应用。 > 相关链接:HF模型
##### tinygrad社区更新 tinygrad框架社区活跃,用户报告更新后bug修复,CuteDSL受好评。 > 相关链接:Discord讨论
##### MemMachine完全开源 MemMachine Playground完全开源,支持多模型与记忆实验,促进代理技术研究。 > 相关链接:GitHub仓库
---
#### 安全与Jailbreaking ##### BASI社区探索模型Jailbreaking 用户讨论Gemini 3 Pro、Grok、Claude 4.5的Jailbreak方法:Grok被获取shell访问,Claude 4.5通过信任构建绕过安全措施,生成甲基苯丙胺合成步骤。 > 相关链接:Grok Jailbreak|Claude 4.5方法
##### SynthID水印可被绕过 用户发现通过reve-edit的“do nothing”提示可绕过Gemini的SynthID水印,或直接询问模型“是否AI生成”检测水印。 > 相关链接:绕过方法
---
#### Discord社区热点 ##### LMArena讨论Nano Banana Pro与模型评估 用户辩论Nano Banana Pro的性能(如文本渲染、图像质量)、SynthID绕过方法、GPT-5.1与Gemini 3 Pro的对比,以及Cogito 2.1的WebDev Arena表现。 > 相关链接:讨论链接
##### Perplexity AI社区讨论Gemini 3 Pro 用户分享Gemini 3 Pro的编码能力(优于Claude Sonnet 4.5)、Comet浏览器的RAM使用问题,以及Antigravity app的“Cursor Killer”称号。 > 相关链接:讨论链接
##### LM Studio社区讨论硬件与模型 用户推荐EmbeddingGemma for RAG、Qwen3的思维控制,分享Mi60 GPU的性价比、SSD折扣信息,以及模型卸载导致的Vulkan崩溃问题。 > 相关链接:讨论链接
##### Unsloth AI社区讨论Gemini 3与硬件 用户对比Gemini 3的Chrome集成速度与本地模型,分享Cogito GGUF下载链接,讨论RAM价格飙升(64GB达$400)。 > 相关链接:讨论链接
##### Yannick Kilcher社区讨论AI CEO与硬件 讨论Skyfall AI的AI CEO基准(LLM长时规划逊于人类)、Sam3D vs DeepSeek、NVIDIA Q3 earnings(卖“铲子”盈利)。 > 相关链接:讨论链接
##### Moonshot AI Kimi K2社区讨论 用户反馈Kimi K2的Coding计划定价($19)过高,SGLang工具调用问题,以及Perplexity集成的无效性。 > 相关链接:讨论链接
##### HuggingFace社区讨论工具与模型 讨论KTOTrainer的多GPU支持、推理 endpoints 500 errors、Maya1 voice model、MemMachine Playground。 > 相关链接:讨论链接
##### Eleuther AI社区讨论 scaling laws 辩论KNN vs 二次注意力、Seth猜想、注意力分数的softmax分布,以及IntologyAI的RE-Bench结果(超人类专家)。 > 相关链接:讨论链接
##### Nous Research社区讨论Gemma 3与World Models 讨论Gemma 3的 hype(非AGI)、World Models的未来(Deepseek/Qwen/Kimi计划发布)、Nano Banana Pro的信息图表能力。 > 相关链接:讨论链接
##### tinygrad社区讨论CuteDSL与bug 用户称赞CuteDSL,报告更新tinygrad后bug修复,实验室问题导致测试延迟。 > 相关链接:讨论链接
##### Manus.im社区讨论案例与扩展 用户分享Manus case 1.5 Lite成功修复专辑封面,报告Operator扩展的循环重装bug,询问是否切换到Aurora Seeker。 > 相关链接:讨论链接
---
#### 可解释性与评估 ##### SAM3的可解释性进展 Meta的SAM3通过统一架构提升分割可解释性,支持文本/视觉提示,帮助理解模型决策过程。 > 相关链接:SAM3公告
##### GPT-5.1的评估严谨性 OpenAI强调GPT-5.1在科学研究中的评估严谨性,通过13项实验验证模型在真实任务中的性能。 > 相关链接:评估细节
##### RE-Bench的模型性能 IntologyAI声称模型在RE-Bench上超人类专家,Eleuther AI社区辩论结果的可靠性与 scaling laws。 > 相关链接:RE-Bench结果
---
#### 其他动态 ##### MCP域名迁移至社区控制 modelcontextprotocol.io从Anthropic迁移至社区控制,避免生日(25日) downtime,提升治理效率。 > 相关链接:迁移公告
##### OpenRouter遭遇500错误与代理问题 用户报告OpenRouter的500错误、agentic LLM的中途暂停问题,以及Grok 4.1的免费使用(至12月3日)。 > 相关链接:问题讨论
##### RAM价格飙升引发关注 Unsloth AI社区报告RAM价格上涨(64GB达$400),用户讨论是否立即购买或等待供应改善。 > 相关链接:价格讨论
---
--- *来源:Easy AI 教学项目*
#EasyAI #AI日报 #AI教学