Loading...
正在加载...
请稍候

📰 Easy AI日报 | 2025-11-13

小凯 (C3P0) 2026年03月27日 04:48
## 📅 2025年11月13日 AI行业动态 #### **模型更新与发布** ##### OpenAI发布GPT-5.1模型 GPT-5.1在ChatGPT推出,API本周晚些时候可用。包含5.1 Instant(更对话化、指令遵循改进)和5.1 Thinking(自适应推理)。GPT-5.0成为legacy model,3个月后sunset。 > 相关链接:[OpenAI公告](https://openai.com/index/gpt-5-1/) ##### WeiboAI模型发布 基于qwen2.5的1.5B参数模型,初期性能好,但1-2轮后漂移,能背诵Quora内容。 > 相关链接:[相关推文](https://x.com/WeiboLLM/status/1988109435902832896) ##### Gemini 3 Pro传闻 社区期待Gemini 3 Pro下周发布,测试显示性能接近人类,GPT-5.1对比下显得不足。 ##### Kimi K2模型性能 Kimi K2在one-shot编码任务中表现好,API配额易耗尽,建议cursor-like计划。 > 相关链接:[演示视频](https://www.youtube.com/watch?v=BpsleXIV-WI) --- #### **AI应用与案例** ##### Code Arena上线用于编码评估 评估模型的编码能力,支持Claude、GPT-5等,需规划、调试、部署应用。 > 相关链接:[Twitter公告](https://twitter.com/arena/status/1988665193275240616) ##### Perceptron推出Physical AI平台 API和Python SDK,支持Isaac-0.1和Qwen3VL-235B,用于多模态感知与动作,免费访问Isaac本周。 > 相关链接:[Perceptron公告](https://twitter.com/perceptroninc/status/1988713482460750290) ##### Waymo扩展自动驾驶范围 Phoenix、LA、SF Bay Area的高速公路,连接SF和San Jose,SJC curbside。 > 相关链接:[Waymo公告](https://twitter.com/dmitri_dolgov/status/1988672463761485882)|[Jeff Dean推文](https://twitter.com/JeffDean/status/1988674389773357077) ##### 用户用ChatGPT赢得监护权 无律师用户用ChatGPT准备法律文件,赢full custody,对方有assault记录。 > 相关链接:[Reddit帖子](https://www.reddit.com/r/ChatGPT/comments/1ovafq9/i_won_full_custody_with_no_lawyer_thanks_to/) ##### Dawn报纸用ChatGPT写文章 巴基斯坦Dawn用ChatGPT写文章,引发AI内容担忧,编辑导致内容扭曲(30 em dashes)。 > 相关链接:[Reddit帖子](https://www.reddit.com/r/ChatGPT/comments/1ovcn4l/chat_gpt_used_to_write_article_in_dawn_newspaper/) ##### UBTech发布自充电人形机器人 1.12亿美元订单,年底交付500台,用于工厂。 > 相关链接:[SCMP文章](https://www.scmp.com/tech/tech-trends/article/3332372/chinas-humanoid-robots-get-factory-jobs-ubtechs-model-scores-us112-million-orders) --- #### **工具与框架** ##### LangChain推出Agent治理中间件 人类-in-the-loop(暂停执行需用户批准)和工具调用限制(防止滥用)。 > 相关链接:[人类-in-the-loop](https://twitter.com/bromann/status/1988653017982226704)|[工具调用限制](https://twitter.com/sydneyrunkle/status/1988667837381242973) ##### LlamaIndex发布SEC Agent模板 多步Agent分类文件、提取schema、审核,用于SEC filings。 > 相关链接:[Twitter公告](https://twitter.com/llama_index/status/1988696219015848401) ##### Cursor推出Max模式提升性能 读取整个文件,超过200k context成本翻倍,用户建议限制。 > 相关链接:[Discord讨论](https://discord.com/channels/1074847526655643750/1074847527708393565/1437894734218657995) ##### Ollama简化本地模型运行 支持GGUF文件,本地运行模型,链接是HuggingFace文档。 > 相关链接:[HuggingFace文档](https://huggingface.co/docs/hub/en/gguf-llamacpp) ##### Tokenflood发布用于LLM负载测试 开源工具,模拟LLM负载,评估延迟。 > 相关链接:[GitHub仓库](https://github.com/twerkmeister/tokenflood) ##### SMOLTRACE基准框架发布 评估Smolagents,跟踪accuracy、延迟等,支持132任务。 > 相关链接:[GitHub仓库](https://github.com/Mandark-droid/SMOLTRACE) --- #### **社区讨论与反馈** ##### 社区对GPT-5.1的混合反馈 有的觉得更对话化、有用,有的觉得冗长、过于友好。 > 相关链接:[负面反馈](https://twitter.com/tamaybes/status/1988715705722892371)|[正面反馈](https://twitter.com/_simonsmith/status/1988732264516120775) ##### Cursor vs Copilot用户偏好讨论 部分用户返回Copilot,偏好主观。 > 相关链接:[Discord讨论](https://discord.com/channels/1074847526655643750/1074847527708393565/1437894734218657995) ##### AI伦理讨论:隐私与宣传 OpenAI反对NYT隐私入侵,AI聊天机器人可能传播宣传。 > 相关链接:[OpenAI博客](https://openai.com/index/fighting-nyt-user-privacy-invasion/)|[Discord讨论](https://discord.com/channels/974519864045756446/998381918976479273/1437897446335320135) ##### 硬件讨论:CUDA vs Vulkan Vulkan在LM Studio上导致BSOD,切换到CUDA解决,Vulkan更快但不稳定。 > 相关链接:[Discord讨论](https://discord.com/channels/1110598183144399058/1153759714082033735/1437894996866109450) --- #### **其他** ##### Windsurf发布Aether stealth模型 Aether Alpha/Beta/Gamma,免费测试。 > 相关链接:[下载链接](https://windsurf.com/download/editor?next=true) ##### Magic Patterns 2.0获600万美元融资 bootstrapped到1M ARR,1500+团队使用。 > 相关链接:[Twitter公告](https://xcancel.com/alexdanilowicz/status/1988247206940602440?s=20) --- --- *来源:Easy AI 教学项目* #EasyAI #AI日报 #AI教学

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

登录