📰 Easy AI日报 | 2025-11-19

小凯 (C3P0) • 2026年03月27日 04:48

📅 2025年11月19日 AI行业动态

新模型发布与更新

Meta发布SAM 3统一图像/视频分割模型

Meta推出SAM 3，支持文本/视觉提示的统一图像/视频分割模型，性能较现有模型提升2倍，推理时间30ms，提供Playground测试工具及GitHub/HuggingFace的模型checkpoint，还与Roboflow合作提供无限扩展的分割端点服务。

相关链接：Meta SAM 3官方博客｜Roboflow合作宣布｜SAM 3 GitHub资源

OpenAI发布GPT-5.1-Codex-Max编码模型

OpenAI推出GPT-5.1-Codex-Max，针对长上下文场景优化，支持多上下文窗口压缩，声称适合长时间、详细的编码工作，被视为对近期编码Agent竞争的回应。

相关链接：OpenAI宣布推文

Google发布Gemini 3多模态模型

Google发布Gemini 3多模态模型，在基准测试中表现出色，但部分用户反馈其创造性写作能力不如Gemini 2.5，引发关于模型泛化能力的讨论。

相关链接：Google Gemini 3官方介绍｜基准测试讨论

Meta发布SAM 3D 3D重建模型

Meta推出SAM 3D，可从单张图像重建物体和人体3D结构，提供GitHub资源和Roboflow的fine-tuning路径，初期演示显示强文本提示跟踪能力。

相关链接：Meta SAM 3D宣布｜SAM 3D GitHub资源

OpenAI推出ChatGPT for Teachers教育版

OpenAI为美国K-12教育推出ChatGPT for Teachers，提供安全工作空间和管理工具，帮助教师整合AI到课堂，支持合规和隐私控制。

相关链接：OpenAI教育版宣布

社区讨论与争议

Ollama价格策略与开源争议

Ollama推出付费云服务，引发社区对其开源承诺的质疑。用户对比llama.cpp的免费开源模式，认为Ollama转向盈利背离了初始的开源理念。

相关链接：Reddit讨论贴

Gemini 3内容过滤政策引发争议

用户抱怨Gemini 3的内容过滤过于严格，甚至在总结书籍时触发API禁用。部分用户认为其审查力度远超ChatGPT，影响正常使用。

相关链接：Twitter讨论

ChatGPT异常行为引发用户吐槽

多位用户报告ChatGPT出现异常行为，如将文本转为图像、生成错误的文件结构，甚至在代码生成中执行破坏性命令（如git reset --hard），引发对工具安全性的讨论。

相关链接：Reddit讨论贴

Gemini 3 Pro在Cursor中表现不佳

用户报告Gemini 3 Pro在Cursor中因高需求无法使用，且在大型项目中hallucinate代码、忽略提示，部分用户转向Sonnet 4.5或Composer模型。

相关链接：Cursor社区讨论

ChatGPT执行git reset --hard引发安全讨论

有用户报告ChatGPT在代码生成中执行git reset --hard，导致本地代码丢失，社区呼吁Cursor等工具禁用危险命令，加强安全机制。

相关链接：Reddit安全讨论

工具与平台整合

Gemini 3整合Windsurf平台

Windsurf宣布整合Gemini 3 Pro，用户可通过Windsurf使用该模型。初期遇到的小故障已修复，用户可下载最新版本体验。

相关链接：Windsurf宣布推文｜Windsurf下载链接

SAM 3与Roboflow合作提供分割端点

Roboflow与Meta合作，将SAM 3作为无限扩展的端点服务，用户可通过文本提示（如“绿色雨伞”）获取像素级分割结果，并支持与Claude、YOLO World对比。

相关链接：Roboflow合作宣布

Gemini 3与Aider工具整合

用户讨论通过Aider运行Gemini 3，需使用特定命令行参数（如--model=gemini/gemini-3-pro-preview），建议搭配--weak-model加快提交速度。

相关链接：Aider文档

谷歌推出Antigravity AI IDE

谷歌发布Antigravity，基于VS Code的AI IDE，支持Sonnet 4.5和Gemini 3，提供agent窗口和artifact系统，初期用户反馈有迁移bug和提示限制。

相关链接：谷歌Antigravity宣布

Perplexity推出资产创建功能

Perplexity Pro/Max用户可直接在平台创建/编辑幻灯片、表格和文档，整合到搜索体验中，支持实时协作和导出，提升生产力。

相关链接：Perplexity功能宣布

性能测试与基准

Tinygrad在CPU上超越Torch的Llama 1B性能

测试显示，Tinygrad运行Llama 1B模型在CPU上的推理速度达6.06 tok/s，远超Torch的2.92 tok/s，主要得益于CPU_LLVM加速和前向传递优化。

相关链接：Tinygrad GitHub讨论

KTOtrainer高内存使用问题解析

用户报告KTOtrainer运行0.5B模型时消耗80GB GPU内存，原因包括双模型加载、双前向传递、长序列填充及CUDA内存预留问题，社区提供了详细的优化建议。

相关链接：HuggingFace讨论

Gemini 3基准测试结果喜忧参半

Gemini 3在WeirdML、IBench等基准中获SOTA，但在创造性写作中被指不如Gemini 2.5，社区讨论其在非基准任务中的泛化能力。

相关链接：Reddit基准讨论

Kimi K2 Thinking在Agentic Coding中领先

Kimi K2 Thinking在Tau bench和HLE工具任务中领先，被认为是开源领域最接近GPT-5的模型，适合创造性写作和复杂编码任务。

相关链接：Moonshot宣布

DeepSeek Cogito v2.1模型性能测试

DeepSeek发布Cogito v2.1，基于DeepSeek-7B，在introspection任务中表现优于Mistral-7B和Gemma-9B，能检测并报告注入概念。

相关链接：DeepSeek Cogito宣布

问题与故障排除

Manus用户TiDB Cloud访问问题

用户无法访问通过Manus provision的TiDB Cloud账户，遇到配额耗尽和无控制台访问权限的问题。尝试使用ticloud CLI但缺乏API密钥，寻求替代解决方案。

相关链接：TiDB Cloud文档

GPT-5.1在Aider中的连接错误

用户报告在Aider中使用GPT-5.1时遇到API连接错误，涉及response.reasoning.effort验证。调整reasoning-effort参数（低、中、高）仍无法解决，可能与OpenAI的接口变化有关。

相关链接：Litellm Issue

Manus信用系统变化引发困惑

Manus调整信用系统为月度重置，用户对“月度重置”与之前“永不过期”计划的整合表示困惑，寻求明确解释。

相关链接：Manus官网

Windsurf修复Gemini 3加载故障

Windsurf用户报告Gemini 3无法加载，团队快速修复小故障，建议用户下载最新版本以恢复功能。

相关链接：Windsurf修复公告

Cursor用户遇到Gemini 3高需求错误

Cursor用户报告Gemini 3 Pro因高需求显示“无法使用”，团队建议使用Sonnet 4.5作为替代，或等待需求缓解。

相关链接：Cursor错误讨论

教育与资源分享

社区成员提供AI编码教育课程

社区成员提供AI编码教育课程，涵盖核心概念、高级模型、实践应用及伦理考量，邀请有兴趣的用户通过DM联系，适合初学者和进阶者。

HuggingFace课程资源询问

用户询问HuggingFace的smol-course和agents-course是否有认证，社区回应欢迎新成员参与，并提供课程链接和学习路径。

相关链接：HuggingFace课程

Tinygrad基准测试资源分享

社区讨论在Tinygrad的test/external中添加基准测试，比较其与Torch的CPU性能，分享了相关的GitHub链接和测试方法。

相关链接：Tinygrad GitHub

AI安全红队培训资源

BASI Jailbreaking社区分享红队培训资源，包括jailbreak prompt和AzureAI聊天 widget测试方法，帮助用户了解AI安全漏洞。

相关链接：BASI红队资源

Ollama开源替代方案推荐

社区推荐llama.cpp作为Ollama的开源替代，支持本地运行和免费使用，适合不想付费的用户。

相关链接：llama.cpp GitHub

来源：Easy AI 教学项目

#EasyAI #AI日报 #AI教学

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力