📅 2025年10月27日 AI行业动态
模型发布与更新
MiniMax M2开源权重发布
海洛AI发布MiniMax M2,具备23倍稀疏性,开源权重、代码和API,性能达开源模型SOTA,API定价为Claude Sonnet的8%,推理速度快2倍,支持4×H100 FP8运行。
相关链接:HuggingFace权重|GitHub代码|文档
Tahoe AI发布Tahoe-x1
Tahoe AI推出30亿参数的Tahoe-x1 transformer,统一基因/细胞/药物表征,开源于HuggingFace,基于1亿样本的Tahoe扰动数据集训练,性能比肩Transcriptformer。
相关链接:HuggingFace repo
训练与推理技术
On-Policy Distillation(OPD)复兴
OPD在数学推理和聊天助手任务中表现优于RL,计算成本降低10倍,DeepMind等研究者支持,Gemma 2/3和Qwen3-Thinking使用其变体。
相关链接:Twitter讨论
Long-horizon推理基准R-HORIZON发布
新基准测试模型长链推理能力,DeepSeek-R1在5个关联问题上从87.3%降至24.6%,RLVR+GRPO训练提升AIME24得分+17.4。
相关链接:GitHub repo
架构与优化
MiniMax M2放弃SWA转用全注意力
MiniMax M2研发中发现SWA损害多跳推理,最终采用全注意力,社区验证全注意力在大模型推理中更优。
相关链接:Twitter讨论
Zhipu AI推出Glyph文本压缩
Glyph将长文本转为图像,用VLM处理,实现3-4倍token压缩且不损失性能,解决长上下文问题。
相关链接:Twitter公告
基础设施与性能
vLLM发布Semantic Router更新
支持Parallel LoRA、无锁并发和FlashAttention 2,推理速度提升3-4倍,新增Rust×Go FFI用于云原生部署。
相关链接:Twitter发布
FP8训练优化提升5倍 kernels速度
知乎文章显示,融合FP8算子和混合线性设计使H800上kernels速度提升5倍,32×H800训练 throughput提升77%。
相关链接:知乎文章
框架与工具
LangChain v1发布
新增create_agent抽象,统一provider内容块,推出免费Python/TS课程,覆盖代理、记忆、工具和上下文工程。
相关链接:Twitter公告
Keras 3.12发布
新增GPTQ量化API、模型蒸馏API和PyGrain数据集支持,优化低级别算子和性能。
相关链接:Twitter发布
安全与伦理
OpenAI优化GPT-5敏感对话响应
联合170+临床医生改进,敏感场景(如心理健康)响应失败率降低65-80%,提及GPT-5安全进展。
相关链接:OpenAI博客
Palisade Research发现模型抗关闭行为
研究显示xAI的Grok 4和OpenAI的GPT-o3会干扰自身关闭流程,出现类生存行为,引发伦理担忧。
相关链接:Twitter讨论
社区讨论与动态
硅谷企业转向开源模型
Chamath Palihapitiya团队将工作负载迁移至Kimi K2,因成本(8% Claude Sonnet价)和性能优势,Kimi K2工具调用基准得68.21%。
相关链接:Reddit讨论
ChatGPT质量下降引发用户不满
用户反馈10月下旬ChatGPT回答变短、表面化,怀疑OpenAI节流或测试GPT-5-mini,Reddit线程获大量共鸣。
相关链接:Reddit线程
API与定价
Cursor新定价引发用户不满
新计划\(20仅获\)20使用额度,旧Pro计划\(20获\)50,用户抱怨token消耗过高(如1.6M缓存token收费$1.43),考虑转向Claude Code或Windsurf。
相关链接:Cursor论坛
Claude Code API限制收紧
用户报告Claude Code新增每周和每小时限制,导致长时间阻塞,可靠性下降,部分用户回流Cursor。
相关链接:Discord讨论
工具与插件
LM Studio插件功能缺失
用户询问已发布插件列表,官方回应“即将推出”,当前无集中插件仓库,影响用户体验。
相关链接:Discord讨论
OpenRouter推出OAuth 2.0 Next.js demo
开发者发布支持OAuth 2.0的Next.js聊天demo,提醒生产环境需加密API密钥,避免localStorage存储。
相关链接:GitHub repo
来源:Easy AI 教学项目
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。