📅 2025年11月14日 AI行业动态
模型发布与更新
OpenAI发布GPT-5.1,增强自适应推理与工具能力
OpenAI推出GPT-5.1,具备自适应推理(复杂任务分配更多tokens),新增apply_patch(代码编辑)和shell工具,提示缓存延长至24小时。价格与GPT-5.0一致,已集成至GitHub Copilot、VS Code等工具。
相关链接:OpenAI博客|GitHub Copilot公告
DeepMind发布SIMA-2,虚拟3D世界智能体可自主学习
DeepMind推出SIMA-2,基于Gemini的智能体,能在虚拟3D世界玩游戏、推理,通过试错自我改进,支持Genie 3生成的世界,无需额外人类数据。
相关链接:DeepMind博客
Google悄悄推送Gemini 3至Pro订阅用户
Google通过Gemini Drops向Pro用户推出Gemini 3,重点在开发者工具和企业应用,免费用户将在未来几周获得更新。
相关链接:Google博客
Zhipu AI发布GLM-4.6,Together AI提供托管服务
Zhipu推出GLM-4.6,Together AI将其用于生产环境,声称性能接近Claude Sonnet 4但代币使用少15%。
相关链接:Together AI公告
API与工具生态
OpenRouter更新GPT-5.1 API,弃用Polaris Alpha
OpenRouter弃用早期GPT-5.1版本Polaris Alpha,推出GPT-5.1 Chat、Codex和Codex-Mini。隐私设置影响模型可用性,部分用户遇到API速率限制。
相关链接:OpenRouter公告|状态页
Aider-ce集成Deepseek API,优化代理模式性能
Aider-ce因功能丰富受好评,但用户担忧维护者沟通。Deepseek API集成后,代理模式性能提升,解决GPT-5-high的慢响应问题。
Propercode发布v0.1,多智能体编码CLI工具
Propercode是基于Pydantic AI的多智能体编码CLI工具,目标提高编码可靠性,v0.1支持自主模式和学习指南模式。
相关链接:Propercode GitHub
DeepSeek OCR API工具开源,支持URL与base64提取
社区发布DeepSeek OCR API工具,可部署自定义OCR模型,使用Unsloth推理,支持从URL或base64提取图像。
相关链接:GitHub仓库
开源项目与数据集
Eleuther清理Lakh MIDI数据集,将上传至Hugging Face
Eleuther清理并组织Lakh MIDI数据集,生成44k条目结构化JSON,计划上传至Hugging Face,邀请社区协作。
相关链接:Hugging Face数据集
法语维基百科清理数据集上传至Hugging Face
用户上传清理后的法语维基百科数据集(270万文件),包含模板、表格等,保留信息框和链接,英语版本待处理。
相关链接:Hugging Face仓库
RLinf Basic仓库即将发布,Qwen3-VL适配器训练启动
成员准备发布RLinf Basic仓库,启动Qwen3-VL VLA-adapter训练,计划清理仓库并评估LIBERO数据集。
相关链接:RLinf GitHub
行业动态与融资
Anthropic计划投资500亿美元建设美国数据中心
Anthropic计划在得州和纽约建设数据中心,创造就业机会,但引发规模、 staffing和环境影响的争论。
相关链接:Anthropic公告
Parag Agrawal新公司获1亿美元A轮融资
前Twitter CEO的Parallel Web Systems获得1亿美元融资,用于构建AI原生网络。
相关链接:公告链接
YC-backed Kimi For Coding因配额限制遭批评
Y Combinator支持的Kimi For Coding提供2048周配额,被用户批评为“ daylight robbery”,质疑其价值。
相关链接:Y Combinator推文
社区讨论与反馈
LMArena Discord热议GPT-5.1与Gemini 3
用户对GPT-5.1褒贬不一,部分称推理提升,部分认为缺乏创意。Gemini 3发布时间引发猜测,可能推迟至下周。
相关链接:LMArena Discord
Perplexity AI Pro用户反馈限制与API问题
用户报告Pro版图像生成限制、lab tokens重置不准确,GPT-5.1部署不确定,部分因推荐计划被封禁。
相关链接:Perplexity Discord
Unsloth AI Discord讨论LoRA调优与硬件
用户分享LoRA alpha需为rank一半以避免梯度爆炸,讨论NVIDIA RTX 5000/6000价格性能,提议社区集资GPU。
相关链接:Unsloth Docs
研究与论文
HipKittens论文指出Mojo MHA性能问题
论文提到Mojo的MHA核在MI355X上因银行冲突,性能仅达峰值50%,建议优化内存布局。
相关链接:论文链接
记忆纠缠分离研究论文发布
论文提出分离模型权重中记忆信息的方法,有助于理解模型决策,讨论其技术创新性。
相关链接:论文链接
硬件与基础设施
NVIDIA举办NVFP4 GEMV优化黑客松
NVIDIA与GPU MODE合作举办黑客松,优化NVFP4的GEMV运算,推荐CuTeDSL,提供B200 GPU access。
相关链接:黑客松详情
Modular Mojo计划支持WebGPU与FFI C
Mojo团队计划添加WebGPU支持,用户讨论FFI C集成可能性,目前依赖Python隐私约定。
相关链接:Mojo Docs
tinygrad更新OpenCL检查与VGG16支持
tinygrad添加OpenCL设备检查,支持VGG16模型加载,pmap/vmap功能即将推出。
相关链接:tinygrad GitHub
用户体验与问题
Cursor Auto Mode集成GPT-5.1后性能下降
用户报告Cursor Auto Mode在集成GPT-5.1-Codex后变慢,无法编辑文件,怀疑服务器过载。
相关链接:Cursor论坛
Manus.im用户遇检查点问题,发布按钮被阻
用户报告Manus.im检查点系统无法找到git提交,需联系支持手动同步。
相关链接:Manus反馈
HuggingChat用户失望于付费模式
用户抱怨HuggingChat转向付费后免费功能受限,对比之前无限免费版本,认为新方案缺乏吸引力。
相关链接:HuggingChat
来源:Easy AI 教学项目
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。