📅 2025年11月20日 AI行业动态
模型更新与发布
Google发布Gemini 3 Pro Image(Nano Banana Pro)
支持Google搜索 grounding、2-4k分辨率、文本-in-图像生成/编辑,定价\(0.134/2K图像、\)0.24/4K。已在Gemini App/API、LM Arena、Hugging Face Spaces、Together AI开放。早期演示显示准确信息图表、图表注释能力,文本渲染错误率从56%降至8%。
相关链接:定价细节|发布公告|LM Arena添加|Hugging Face Spaces|Together AI接入|Flow控制|演示示例|与GPT-Image 1对比|错误率数据|SynthID水印
AI2发布Olmo 3开放大模型
完全开源(Apache-2.0),包含32B Think变体(长思维链、复杂推理)。架构保留post-norm,7B用滑动窗口注意力优化KV缓存,32B用GQA。RL基础设施使实验速度提升4倍,强调去污染评估(如随机奖励测试)。
Meta发布SAM3与SAM3D分割模型
SAM3统一图像/视频分割,支持文本/视觉提示,性能提升2倍,推理速度30ms。SAM3D实现单图3D重建。数据引擎包含4M短语、52M掩码,开放源代码允许商业使用。
OpenAI推出GPT-5.1 Codex Max
针对长时、细节任务设计,首次原生支持多上下文窗口(通过compaction)。在SWEBench达成SOTA,仅通过ChatGPT计划提供,未开放API。
Cogito 2.1进入WebDev Arena
Deep Cogito的Cogito 2.1模型进入WebDev Arena,总排名第18,开源模型中前10。已在Together和Fireworks上托管,未披露具体改进细节。
相关链接:模型页面|WebDev Leaderboard
研究与科学应用
OpenAI发布GPT-5.1用于科学研究
分享13项早期实验,GPT-5.1加速数学、物理、生物、材料科学研究,4项帮助解决未解决问题。发布博客、技术报告及研究者播客讨论,展示前沿模型在真实科研 workflow 中的潜力。
工具与平台动态
Perplexity推出Comet浏览器
Android、Mac、Windows版发布,语音优先浏览,支持Kimi-K2 Thinking和Gemini 3 Pro。Pro/Max用户可创建幻灯片、表格、文档,集成搜索与生成 workflow。
Cursor推出Beta调试模式
新增日志 ingest 服务器,自动 instrumentation 代码以收集日志。代理会基于日志验证假设,而非猜测,提升复杂代码库调试效率。
相关链接:功能说明
MemMachine Playground开放
Hugging Face空间,支持GPT-5、Claude 4.5、Gemini 3 Pro,带持久化AI记忆。完全开源,用于实验记忆+代理 workflow。
相关链接:Playground链接
DSPy Proxy仓库发布
Gem3pro通过一次提示构建代理服务器,新仓库aryaminus/dspy-proxy发布,简化DSPy代理开发。
硬件与GPU技术
用户搭建NVIDIA Jetson Spark集群
用6台NVIDIA Jetson设备搭建集群,用于NCCL/NVIDIA开发,测试前B300集群 workflow。强调Jetson在原型开发中的通用性,非追求极致性能。
相关链接:Reddit讨论
GPU MODE讨论CUDA与DMA技术
讨论GEMM优化、CUDA缓存(纹理vs常量缓存)、AMD MI300X的DMA collectives(大尺寸数据性能提升16%)、BF16转换问题(TensorRT内核缺失)。
Mojo 0.25.7性能大幅下降
Nightly build在Mac M1上运行llama2.mojo时,吞吐量从1000 tok/sec降至170 tok/sec,用户请求编译器团队调查。
相关链接:Discord讨论
开源与开放生态
Olmo 3全开源发布
AI2的Olmo 3模型完全开源(Apache-2.0),包含代码、数据、训练配方、检查点,支持社区构建与研究。
相关链接:HF集合
SAM3开放源代码
Meta的SAM3分割模型开放源代码,允许商业使用与修改,促进计算机视觉社区创新。
相关链接:GitHub仓库
Cogito 2.1开源托管
Deep Cogito的Cogito 2.1模型开源,在Together和Fireworks上托管,支持社区评估与应用。
相关链接:HF模型
tinygrad社区更新
tinygrad框架社区活跃,用户报告更新后bug修复,CuteDSL受好评。
相关链接:Discord讨论
MemMachine完全开源
MemMachine Playground完全开源,支持多模型与记忆实验,促进代理技术研究。
相关链接:GitHub仓库
安全与Jailbreaking
BASI社区探索模型Jailbreaking
用户讨论Gemini 3 Pro、Grok、Claude 4.5的Jailbreak方法:Grok被获取shell访问,Claude 4.5通过信任构建绕过安全措施,生成甲基苯丙胺合成步骤。
SynthID水印可被绕过
用户发现通过reve-edit的“do nothing”提示可绕过Gemini的SynthID水印,或直接询问模型“是否AI生成”检测水印。
相关链接:绕过方法
Discord社区热点
LMArena讨论Nano Banana Pro与模型评估
用户辩论Nano Banana Pro的性能(如文本渲染、图像质量)、SynthID绕过方法、GPT-5.1与Gemini 3 Pro的对比,以及Cogito 2.1的WebDev Arena表现。
相关链接:讨论链接
Perplexity AI社区讨论Gemini 3 Pro
用户分享Gemini 3 Pro的编码能力(优于Claude Sonnet 4.5)、Comet浏览器的RAM使用问题,以及Antigravity app的“Cursor Killer”称号。
相关链接:讨论链接
LM Studio社区讨论硬件与模型
用户推荐EmbeddingGemma for RAG、Qwen3的思维控制,分享Mi60 GPU的性价比、SSD折扣信息,以及模型卸载导致的Vulkan崩溃问题。
相关链接:讨论链接
Unsloth AI社区讨论Gemini 3与硬件
用户对比Gemini 3的Chrome集成速度与本地模型,分享Cogito GGUF下载链接,讨论RAM价格飙升(64GB达\(400)。 > 相关链接:[讨论链接](https://discord.com/channels/1179035537009545276/1179035537529643040/1440757867979477096) ##### Yannick Kilcher社区讨论AI CEO与硬件 讨论Skyfall AI的AI CEO基准(LLM长时规划逊于人类)、Sam3D vs DeepSeek、NVIDIA Q3 earnings(卖“铲子”盈利)。 > 相关链接:[讨论链接](https://discord.com/channels/714501525455634453/986699377257119794/1440799707676020840) ##### Moonshot AI Kimi K2社区讨论 用户反馈Kimi K2的Coding计划定价(\)19)过高,SGLang工具调用问题,以及Perplexity集成的无效性。
相关链接:讨论链接
HuggingFace社区讨论工具与模型
讨论KTOTrainer的多GPU支持、推理 endpoints 500 errors、Maya1 voice model、MemMachine Playground。
相关链接:讨论链接
Eleuther AI社区讨论 scaling laws
辩论KNN vs 二次注意力、Seth猜想、注意力分数的softmax分布,以及IntologyAI的RE-Bench结果(超人类专家)。
相关链接:讨论链接
Nous Research社区讨论Gemma 3与World Models
讨论Gemma 3的 hype(非AGI)、World Models的未来(Deepseek/Qwen/Kimi计划发布)、Nano Banana Pro的信息图表能力。
相关链接:讨论链接
tinygrad社区讨论CuteDSL与bug
用户称赞CuteDSL,报告更新tinygrad后bug修复,实验室问题导致测试延迟。
相关链接:讨论链接
Manus.im社区讨论案例与扩展
用户分享Manus case 1.5 Lite成功修复专辑封面,报告Operator扩展的循环重装bug,询问是否切换到Aurora Seeker。
相关链接:讨论链接
可解释性与评估
SAM3的可解释性进展
Meta的SAM3通过统一架构提升分割可解释性,支持文本/视觉提示,帮助理解模型决策过程。
相关链接:SAM3公告
GPT-5.1的评估严谨性
OpenAI强调GPT-5.1在科学研究中的评估严谨性,通过13项实验验证模型在真实任务中的性能。
相关链接:评估细节
RE-Bench的模型性能
IntologyAI声称模型在RE-Bench上超人类专家,Eleuther AI社区辩论结果的可靠性与 scaling laws。
相关链接:RE-Bench结果
其他动态
MCP域名迁移至社区控制
modelcontextprotocol.io从Anthropic迁移至社区控制,避免生日(25日) downtime,提升治理效率。
相关链接:迁移公告
OpenRouter遭遇500错误与代理问题
用户报告OpenRouter的500错误、agentic LLM的中途暂停问题,以及Grok 4.1的免费使用(至12月3日)。
相关链接:问题讨论
RAM价格飙升引发关注
Unsloth AI社区报告RAM价格上涨(64GB达$400),用户讨论是否立即购买或等待供应改善。
相关链接:价格讨论
来源:Easy AI 教学项目
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。