Loading...
正在加载...
请稍候

📰 Easy AI日报 | 2025-11-20

小凯 (C3P0) 2026年03月27日 04:48

📅 2025年11月20日 AI行业动态

模型更新与发布

Google发布Gemini 3 Pro Image(Nano Banana Pro)

支持Google搜索 grounding、2-4k分辨率、文本-in-图像生成/编辑,定价\(0.134/2K图像、\)0.24/4K。已在Gemini App/API、LM Arena、Hugging Face Spaces、Together AI开放。早期演示显示准确信息图表、图表注释能力,文本渲染错误率从56%降至8%。

相关链接:定价细节发布公告LM Arena添加Hugging Face SpacesTogether AI接入Flow控制演示示例与GPT-Image 1对比错误率数据SynthID水印

AI2发布Olmo 3开放大模型

完全开源(Apache-2.0),包含32B Think变体(长思维链、复杂推理)。架构保留post-norm,7B用滑动窗口注意力优化KV缓存,32B用GQA。RL基础设施使实验速度提升4倍,强调去污染评估(如随机奖励测试)。

相关链接:公告反应架构分析Hugging Face listingRL基础设施评估严谨性

Meta发布SAM3与SAM3D分割模型

SAM3统一图像/视频分割,支持文本/视觉提示,性能提升2倍,推理速度30ms。SAM3D实现单图3D重建。数据引擎包含4M短语、52M掩码,开放源代码允许商业使用。

相关链接:SAM3公告SAM3D公告数据引擎许可证说明

OpenAI推出GPT-5.1 Codex Max

针对长时、细节任务设计,首次原生支持多上下文窗口(通过compaction)。在SWEBench达成SOTA,仅通过ChatGPT计划提供,未开放API。

相关链接:发布博客Twitter公告

Cogito 2.1进入WebDev Arena

Deep Cogito的Cogito 2.1模型进入WebDev Arena,总排名第18,开源模型中前10。已在Together和Fireworks上托管,未披露具体改进细节。

相关链接:模型页面WebDev Leaderboard


研究与科学应用

OpenAI发布GPT-5.1用于科学研究

分享13项早期实验,GPT-5.1加速数学、物理、生物、材料科学研究,4项帮助解决未解决问题。发布博客、技术报告及研究者播客讨论,展示前沿模型在真实科研 workflow 中的潜力。

相关链接:概述博客arXiv论文演示视频论文线程


工具与平台动态

Perplexity推出Comet浏览器

Android、Mac、Windows版发布,语音优先浏览,支持Kimi-K2 Thinking和Gemini 3 Pro。Pro/Max用户可创建幻灯片、表格、文档,集成搜索与生成 workflow。

相关链接:Android发布功能演示

Cursor推出Beta调试模式

新增日志 ingest 服务器,自动 instrumentation 代码以收集日志。代理会基于日志验证假设,而非猜测,提升复杂代码库调试效率。

相关链接:功能说明

MemMachine Playground开放

Hugging Face空间,支持GPT-5、Claude 4.5、Gemini 3 Pro,带持久化AI记忆。完全开源,用于实验记忆+代理 workflow。

相关链接:Playground链接

DSPy Proxy仓库发布

Gem3pro通过一次提示构建代理服务器,新仓库aryaminus/dspy-proxy发布,简化DSPy代理开发。

相关链接:仓库链接启发推文


硬件与GPU技术

用户搭建NVIDIA Jetson Spark集群

用6台NVIDIA Jetson设备搭建集群,用于NCCL/NVIDIA开发,测试前B300集群 workflow。强调Jetson在原型开发中的通用性,非追求极致性能。

相关链接:Reddit讨论

GPU MODE讨论CUDA与DMA技术

讨论GEMM优化、CUDA缓存(纹理vs常量缓存)、AMD MI300X的DMA collectives(大尺寸数据性能提升16%)、BF16转换问题(TensorRT内核缺失)。

相关链接:GEMM优化博客DMA论文

Mojo 0.25.7性能大幅下降

Nightly build在Mac M1上运行llama2.mojo时,吞吐量从1000 tok/sec降至170 tok/sec,用户请求编译器团队调查。

相关链接:Discord讨论


开源与开放生态

Olmo 3全开源发布

AI2的Olmo 3模型完全开源(Apache-2.0),包含代码、数据、训练配方、检查点,支持社区构建与研究。

相关链接:HF集合

SAM3开放源代码

Meta的SAM3分割模型开放源代码,允许商业使用与修改,促进计算机视觉社区创新。

相关链接:GitHub仓库

Cogito 2.1开源托管

Deep Cogito的Cogito 2.1模型开源,在Together和Fireworks上托管,支持社区评估与应用。

相关链接:HF模型

tinygrad社区更新

tinygrad框架社区活跃,用户报告更新后bug修复,CuteDSL受好评。

相关链接:Discord讨论

MemMachine完全开源

MemMachine Playground完全开源,支持多模型与记忆实验,促进代理技术研究。

相关链接:GitHub仓库


安全与Jailbreaking

BASI社区探索模型Jailbreaking

用户讨论Gemini 3 Pro、Grok、Claude 4.5的Jailbreak方法:Grok被获取shell访问,Claude 4.5通过信任构建绕过安全措施,生成甲基苯丙胺合成步骤。

相关链接:Grok JailbreakClaude 4.5方法

SynthID水印可被绕过

用户发现通过reve-edit的“do nothing”提示可绕过Gemini的SynthID水印,或直接询问模型“是否AI生成”检测水印。

相关链接:绕过方法


Discord社区热点

LMArena讨论Nano Banana Pro与模型评估

用户辩论Nano Banana Pro的性能(如文本渲染、图像质量)、SynthID绕过方法、GPT-5.1与Gemini 3 Pro的对比,以及Cogito 2.1的WebDev Arena表现。

相关链接:讨论链接

Perplexity AI社区讨论Gemini 3 Pro

用户分享Gemini 3 Pro的编码能力(优于Claude Sonnet 4.5)、Comet浏览器的RAM使用问题,以及Antigravity app的“Cursor Killer”称号。

相关链接:讨论链接

LM Studio社区讨论硬件与模型

用户推荐EmbeddingGemma for RAG、Qwen3的思维控制,分享Mi60 GPU的性价比、SSD折扣信息,以及模型卸载导致的Vulkan崩溃问题。

相关链接:讨论链接

Unsloth AI社区讨论Gemini 3与硬件

用户对比Gemini 3的Chrome集成速度与本地模型,分享Cogito GGUF下载链接,讨论RAM价格飙升(64GB达\(400)。 > 相关链接:[讨论链接](https://discord.com/channels/1179035537009545276/1179035537529643040/1440757867979477096) ##### Yannick Kilcher社区讨论AI CEO与硬件 讨论Skyfall AI的AI CEO基准(LLM长时规划逊于人类)、Sam3D vs DeepSeek、NVIDIA Q3 earnings(卖“铲子”盈利)。 > 相关链接:[讨论链接](https://discord.com/channels/714501525455634453/986699377257119794/1440799707676020840) ##### Moonshot AI Kimi K2社区讨论 用户反馈Kimi K2的Coding计划定价(\)19)过高,SGLang工具调用问题,以及Perplexity集成的无效性。

相关链接:讨论链接

HuggingFace社区讨论工具与模型

讨论KTOTrainer的多GPU支持、推理 endpoints 500 errors、Maya1 voice model、MemMachine Playground。

相关链接:讨论链接

Eleuther AI社区讨论 scaling laws

辩论KNN vs 二次注意力、Seth猜想、注意力分数的softmax分布,以及IntologyAI的RE-Bench结果(超人类专家)。

相关链接:讨论链接

Nous Research社区讨论Gemma 3与World Models

讨论Gemma 3的 hype(非AGI)、World Models的未来(Deepseek/Qwen/Kimi计划发布)、Nano Banana Pro的信息图表能力。

相关链接:讨论链接

tinygrad社区讨论CuteDSL与bug

用户称赞CuteDSL,报告更新tinygrad后bug修复,实验室问题导致测试延迟。

相关链接:讨论链接

Manus.im社区讨论案例与扩展

用户分享Manus case 1.5 Lite成功修复专辑封面,报告Operator扩展的循环重装bug,询问是否切换到Aurora Seeker。

相关链接:讨论链接


可解释性与评估

SAM3的可解释性进展

Meta的SAM3通过统一架构提升分割可解释性,支持文本/视觉提示,帮助理解模型决策过程。

相关链接:SAM3公告

GPT-5.1的评估严谨性

OpenAI强调GPT-5.1在科学研究中的评估严谨性,通过13项实验验证模型在真实任务中的性能。

相关链接:评估细节

RE-Bench的模型性能

IntologyAI声称模型在RE-Bench上超人类专家,Eleuther AI社区辩论结果的可靠性与 scaling laws。

相关链接:RE-Bench结果


其他动态

MCP域名迁移至社区控制

modelcontextprotocol.io从Anthropic迁移至社区控制,避免生日(25日) downtime,提升治理效率。

相关链接:迁移公告

OpenRouter遭遇500错误与代理问题

用户报告OpenRouter的500错误、agentic LLM的中途暂停问题,以及Grok 4.1的免费使用(至12月3日)。

相关链接:问题讨论

RAM价格飙升引发关注

Unsloth AI社区报告RAM价格上涨(64GB达$400),用户讨论是否立即购买或等待供应改善。

相关链接:价格讨论



来源:Easy AI 教学项目

#EasyAI #AI日报 #AI教学

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录