## 📅 2025年11月13日 AI行业动态
#### **模型更新与发布**
##### OpenAI发布GPT-5.1模型
GPT-5.1在ChatGPT推出,API本周晚些时候可用。包含5.1 Instant(更对话化、指令遵循改进)和5.1 Thinking(自适应推理)。GPT-5.0成为legacy model,3个月后sunset。
> 相关链接:[OpenAI公告](https://openai.com/index/gpt-5-1/)
##### WeiboAI模型发布
基于qwen2.5的1.5B参数模型,初期性能好,但1-2轮后漂移,能背诵Quora内容。
> 相关链接:[相关推文](https://x.com/WeiboLLM/status/1988109435902832896)
##### Gemini 3 Pro传闻
社区期待Gemini 3 Pro下周发布,测试显示性能接近人类,GPT-5.1对比下显得不足。
##### Kimi K2模型性能
Kimi K2在one-shot编码任务中表现好,API配额易耗尽,建议cursor-like计划。
> 相关链接:[演示视频](https://www.youtube.com/watch?v=BpsleXIV-WI)
---
#### **AI应用与案例**
##### Code Arena上线用于编码评估
评估模型的编码能力,支持Claude、GPT-5等,需规划、调试、部署应用。
> 相关链接:[Twitter公告](https://twitter.com/arena/status/1988665193275240616)
##### Perceptron推出Physical AI平台
API和Python SDK,支持Isaac-0.1和Qwen3VL-235B,用于多模态感知与动作,免费访问Isaac本周。
> 相关链接:[Perceptron公告](https://twitter.com/perceptroninc/status/1988713482460750290)
##### Waymo扩展自动驾驶范围
Phoenix、LA、SF Bay Area的高速公路,连接SF和San Jose,SJC curbside。
> 相关链接:[Waymo公告](https://twitter.com/dmitri_dolgov/status/1988672463761485882)|[Jeff Dean推文](https://twitter.com/JeffDean/status/1988674389773357077)
##### 用户用ChatGPT赢得监护权
无律师用户用ChatGPT准备法律文件,赢full custody,对方有assault记录。
> 相关链接:[Reddit帖子](https://www.reddit.com/r/ChatGPT/comments/1ovafq9/i_won_full_custody_with_no_lawyer_thanks_to/)
##### Dawn报纸用ChatGPT写文章
巴基斯坦Dawn用ChatGPT写文章,引发AI内容担忧,编辑导致内容扭曲(30 em dashes)。
> 相关链接:[Reddit帖子](https://www.reddit.com/r/ChatGPT/comments/1ovcn4l/chat_gpt_used_to_write_article_in_dawn_newspaper/)
##### UBTech发布自充电人形机器人
1.12亿美元订单,年底交付500台,用于工厂。
> 相关链接:[SCMP文章](https://www.scmp.com/tech/tech-trends/article/3332372/chinas-humanoid-robots-get-factory-jobs-ubtechs-model-scores-us112-million-orders)
---
#### **工具与框架**
##### LangChain推出Agent治理中间件
人类-in-the-loop(暂停执行需用户批准)和工具调用限制(防止滥用)。
> 相关链接:[人类-in-the-loop](https://twitter.com/bromann/status/1988653017982226704)|[工具调用限制](https://twitter.com/sydneyrunkle/status/1988667837381242973)
##### LlamaIndex发布SEC Agent模板
多步Agent分类文件、提取schema、审核,用于SEC filings。
> 相关链接:[Twitter公告](https://twitter.com/llama_index/status/1988696219015848401)
##### Cursor推出Max模式提升性能
读取整个文件,超过200k context成本翻倍,用户建议限制。
> 相关链接:[Discord讨论](https://discord.com/channels/1074847526655643750/1074847527708393565/1437894734218657995)
##### Ollama简化本地模型运行
支持GGUF文件,本地运行模型,链接是HuggingFace文档。
> 相关链接:[HuggingFace文档](https://huggingface.co/docs/hub/en/gguf-llamacpp)
##### Tokenflood发布用于LLM负载测试
开源工具,模拟LLM负载,评估延迟。
> 相关链接:[GitHub仓库](https://github.com/twerkmeister/tokenflood)
##### SMOLTRACE基准框架发布
评估Smolagents,跟踪accuracy、延迟等,支持132任务。
> 相关链接:[GitHub仓库](https://github.com/Mandark-droid/SMOLTRACE)
---
#### **社区讨论与反馈**
##### 社区对GPT-5.1的混合反馈
有的觉得更对话化、有用,有的觉得冗长、过于友好。
> 相关链接:[负面反馈](https://twitter.com/tamaybes/status/1988715705722892371)|[正面反馈](https://twitter.com/_simonsmith/status/1988732264516120775)
##### Cursor vs Copilot用户偏好讨论
部分用户返回Copilot,偏好主观。
> 相关链接:[Discord讨论](https://discord.com/channels/1074847526655643750/1074847527708393565/1437894734218657995)
##### AI伦理讨论:隐私与宣传
OpenAI反对NYT隐私入侵,AI聊天机器人可能传播宣传。
> 相关链接:[OpenAI博客](https://openai.com/index/fighting-nyt-user-privacy-invasion/)|[Discord讨论](https://discord.com/channels/974519864045756446/998381918976479273/1437897446335320135)
##### 硬件讨论:CUDA vs Vulkan
Vulkan在LM Studio上导致BSOD,切换到CUDA解决,Vulkan更快但不稳定。
> 相关链接:[Discord讨论](https://discord.com/channels/1110598183144399058/1153759714082033735/1437894996866109450)
---
#### **其他**
##### Windsurf发布Aether stealth模型
Aether Alpha/Beta/Gamma,免费测试。
> 相关链接:[下载链接](https://windsurf.com/download/editor?next=true)
##### Magic Patterns 2.0获600万美元融资
bootstrapped到1M ARR,1500+团队使用。
> 相关链接:[Twitter公告](https://xcancel.com/alexdanilowicz/status/1988247206940602440?s=20)
---
---
*来源:Easy AI 教学项目*
#EasyAI #AI日报 #AI教学
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!