📅 2025年11月13日 AI行业动态
模型更新与发布
OpenAI发布GPT-5.1模型
GPT-5.1在ChatGPT推出,API本周晚些时候可用。包含5.1 Instant(更对话化、指令遵循改进)和5.1 Thinking(自适应推理)。GPT-5.0成为legacy model,3个月后sunset。
相关链接:OpenAI公告
WeiboAI模型发布
基于qwen2.5的1.5B参数模型,初期性能好,但1-2轮后漂移,能背诵Quora内容。
相关链接:相关推文
Gemini 3 Pro传闻
社区期待Gemini 3 Pro下周发布,测试显示性能接近人类,GPT-5.1对比下显得不足。
Kimi K2模型性能
Kimi K2在one-shot编码任务中表现好,API配额易耗尽,建议cursor-like计划。
相关链接:演示视频
AI应用与案例
Code Arena上线用于编码评估
评估模型的编码能力,支持Claude、GPT-5等,需规划、调试、部署应用。
相关链接:Twitter公告
Perceptron推出Physical AI平台
API和Python SDK,支持Isaac-0.1和Qwen3VL-235B,用于多模态感知与动作,免费访问Isaac本周。
相关链接:Perceptron公告
Waymo扩展自动驾驶范围
Phoenix、LA、SF Bay Area的高速公路,连接SF和San Jose,SJC curbside。
相关链接:Waymo公告|Jeff Dean推文
用户用ChatGPT赢得监护权
无律师用户用ChatGPT准备法律文件,赢full custody,对方有assault记录。
相关链接:Reddit帖子
Dawn报纸用ChatGPT写文章
巴基斯坦Dawn用ChatGPT写文章,引发AI内容担忧,编辑导致内容扭曲(30 em dashes)。
相关链接:Reddit帖子
UBTech发布自充电人形机器人
1.12亿美元订单,年底交付500台,用于工厂。
相关链接:SCMP文章
工具与框架
LangChain推出Agent治理中间件
人类-in-the-loop(暂停执行需用户批准)和工具调用限制(防止滥用)。
相关链接:人类-in-the-loop|工具调用限制
LlamaIndex发布SEC Agent模板
多步Agent分类文件、提取schema、审核,用于SEC filings。
相关链接:Twitter公告
Cursor推出Max模式提升性能
读取整个文件,超过200k context成本翻倍,用户建议限制。
相关链接:Discord讨论
Ollama简化本地模型运行
支持GGUF文件,本地运行模型,链接是HuggingFace文档。
相关链接:HuggingFace文档
Tokenflood发布用于LLM负载测试
开源工具,模拟LLM负载,评估延迟。
相关链接:GitHub仓库
SMOLTRACE基准框架发布
评估Smolagents,跟踪accuracy、延迟等,支持132任务。
相关链接:GitHub仓库
社区讨论与反馈
社区对GPT-5.1的混合反馈
有的觉得更对话化、有用,有的觉得冗长、过于友好。
Cursor vs Copilot用户偏好讨论
部分用户返回Copilot,偏好主观。
相关链接:Discord讨论
AI伦理讨论:隐私与宣传
OpenAI反对NYT隐私入侵,AI聊天机器人可能传播宣传。
硬件讨论:CUDA vs Vulkan
Vulkan在LM Studio上导致BSOD,切换到CUDA解决,Vulkan更快但不稳定。
相关链接:Discord讨论
其他
Windsurf发布Aether stealth模型
Aether Alpha/Beta/Gamma,免费测试。
相关链接:下载链接
Magic Patterns 2.0获600万美元融资
bootstrapped到1M ARR,1500+团队使用。
相关链接:Twitter公告
来源:Easy AI 教学项目
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。