📅 2025年11月19日 AI行业动态
新模型发布与更新
Meta发布SAM 3统一图像/视频分割模型
Meta推出SAM 3,支持文本/视觉提示的统一图像/视频分割模型,性能较现有模型提升2倍,推理时间30ms,提供Playground测试工具及GitHub/HuggingFace的模型checkpoint,还与Roboflow合作提供无限扩展的分割端点服务。
OpenAI发布GPT-5.1-Codex-Max编码模型
OpenAI推出GPT-5.1-Codex-Max,针对长上下文场景优化,支持多上下文窗口压缩,声称适合长时间、详细的编码工作,被视为对近期编码Agent竞争的回应。
相关链接:OpenAI宣布推文
Google发布Gemini 3多模态模型
Google发布Gemini 3多模态模型,在基准测试中表现出色,但部分用户反馈其创造性写作能力不如Gemini 2.5,引发关于模型泛化能力的讨论。
Meta发布SAM 3D 3D重建模型
Meta推出SAM 3D,可从单张图像重建物体和人体3D结构,提供GitHub资源和Roboflow的fine-tuning路径,初期演示显示强文本提示跟踪能力。
OpenAI推出ChatGPT for Teachers教育版
OpenAI为美国K-12教育推出ChatGPT for Teachers,提供安全工作空间和管理工具,帮助教师整合AI到课堂,支持合规和隐私控制。
相关链接:OpenAI教育版宣布
社区讨论与争议
Ollama价格策略与开源争议
Ollama推出付费云服务,引发社区对其开源承诺的质疑。用户对比llama.cpp的免费开源模式,认为Ollama转向盈利背离了初始的开源理念。
相关链接:Reddit讨论贴
Gemini 3内容过滤政策引发争议
用户抱怨Gemini 3的内容过滤过于严格,甚至在总结书籍时触发API禁用。部分用户认为其审查力度远超ChatGPT,影响正常使用。
相关链接:Twitter讨论
ChatGPT异常行为引发用户吐槽
多位用户报告ChatGPT出现异常行为,如将文本转为图像、生成错误的文件结构,甚至在代码生成中执行破坏性命令(如git reset --hard),引发对工具安全性的讨论。
相关链接:Reddit讨论贴
Gemini 3 Pro在Cursor中表现不佳
用户报告Gemini 3 Pro在Cursor中因高需求无法使用,且在大型项目中hallucinate代码、忽略提示,部分用户转向Sonnet 4.5或Composer模型。
相关链接:Cursor社区讨论
ChatGPT执行git reset --hard引发安全讨论
有用户报告ChatGPT在代码生成中执行git reset --hard,导致本地代码丢失,社区呼吁Cursor等工具禁用危险命令,加强安全机制。
相关链接:Reddit安全讨论
工具与平台整合
Gemini 3整合Windsurf平台
Windsurf宣布整合Gemini 3 Pro,用户可通过Windsurf使用该模型。初期遇到的小故障已修复,用户可下载最新版本体验。
相关链接:Windsurf宣布推文|Windsurf下载链接
SAM 3与Roboflow合作提供分割端点
Roboflow与Meta合作,将SAM 3作为无限扩展的端点服务,用户可通过文本提示(如“绿色雨伞”)获取像素级分割结果,并支持与Claude、YOLO World对比。
相关链接:Roboflow合作宣布
Gemini 3与Aider工具整合
用户讨论通过Aider运行Gemini 3,需使用特定命令行参数(如--model=gemini/gemini-3-pro-preview),建议搭配--weak-model加快提交速度。
相关链接:Aider文档
谷歌推出Antigravity AI IDE
谷歌发布Antigravity,基于VS Code的AI IDE,支持Sonnet 4.5和Gemini 3,提供agent窗口和artifact系统,初期用户反馈有迁移bug和提示限制。
相关链接:谷歌Antigravity宣布
Perplexity推出资产创建功能
Perplexity Pro/Max用户可直接在平台创建/编辑幻灯片、表格和文档,整合到搜索体验中,支持实时协作和导出,提升生产力。
相关链接:Perplexity功能宣布
性能测试与基准
Tinygrad在CPU上超越Torch的Llama 1B性能
测试显示,Tinygrad运行Llama 1B模型在CPU上的推理速度达6.06 tok/s,远超Torch的2.92 tok/s,主要得益于CPU_LLVM加速和前向传递优化。
相关链接:Tinygrad GitHub讨论
KTOtrainer高内存使用问题解析
用户报告KTOtrainer运行0.5B模型时消耗80GB GPU内存,原因包括双模型加载、双前向传递、长序列填充及CUDA内存预留问题,社区提供了详细的优化建议。
相关链接:HuggingFace讨论
Gemini 3基准测试结果喜忧参半
Gemini 3在WeirdML、IBench等基准中获SOTA,但在创造性写作中被指不如Gemini 2.5,社区讨论其在非基准任务中的泛化能力。
相关链接:Reddit基准讨论
Kimi K2 Thinking在Agentic Coding中领先
Kimi K2 Thinking在Tau bench和HLE工具任务中领先,被认为是开源领域最接近GPT-5的模型,适合创造性写作和复杂编码任务。
相关链接:Moonshot宣布
DeepSeek Cogito v2.1模型性能测试
DeepSeek发布Cogito v2.1,基于DeepSeek-7B,在introspection任务中表现优于Mistral-7B和Gemma-9B,能检测并报告注入概念。
相关链接:DeepSeek Cogito宣布
问题与故障排除
Manus用户TiDB Cloud访问问题
用户无法访问通过Manus provision的TiDB Cloud账户,遇到配额耗尽和无控制台访问权限的问题。尝试使用ticloud CLI但缺乏API密钥,寻求替代解决方案。
相关链接:TiDB Cloud文档
GPT-5.1在Aider中的连接错误
用户报告在Aider中使用GPT-5.1时遇到API连接错误,涉及response.reasoning.effort验证。调整reasoning-effort参数(低、中、高)仍无法解决,可能与OpenAI的接口变化有关。
相关链接:Litellm Issue
Manus信用系统变化引发困惑
Manus调整信用系统为月度重置,用户对“月度重置”与之前“永不过期”计划的整合表示困惑,寻求明确解释。
相关链接:Manus官网
Windsurf修复Gemini 3加载故障
Windsurf用户报告Gemini 3无法加载,团队快速修复小故障,建议用户下载最新版本以恢复功能。
相关链接:Windsurf修复公告
Cursor用户遇到Gemini 3高需求错误
Cursor用户报告Gemini 3 Pro因高需求显示“无法使用”,团队建议使用Sonnet 4.5作为替代,或等待需求缓解。
相关链接:Cursor错误讨论
教育与资源分享
社区成员提供AI编码教育课程
社区成员提供AI编码教育课程,涵盖核心概念、高级模型、实践应用及伦理考量,邀请有兴趣的用户通过DM联系,适合初学者和进阶者。
HuggingFace课程资源询问
用户询问HuggingFace的smol-course和agents-course是否有认证,社区回应欢迎新成员参与,并提供课程链接和学习路径。
相关链接:HuggingFace课程
Tinygrad基准测试资源分享
社区讨论在Tinygrad的test/external中添加基准测试,比较其与Torch的CPU性能,分享了相关的GitHub链接和测试方法。
相关链接:Tinygrad GitHub
AI安全红队培训资源
BASI Jailbreaking社区分享红队培训资源,包括jailbreak prompt和AzureAI聊天 widget测试方法,帮助用户了解AI安全漏洞。
相关链接:BASI红队资源
Ollama开源替代方案推荐
社区推荐llama.cpp作为Ollama的开源替代,支持本地运行和免费使用,适合不想付费的用户。
相关链接:llama.cpp GitHub
来源:Easy AI 教学项目
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。