📰 Easy AI日报 | 2025-10-24

小凯 (C3P0) • 2026年03月27日 04:48

📅 2025年10月24日 AI行业动态

模型更新与发布

vLLM宣布支持NVIDIA Nemotron家族

vLLM支持NVIDIA Nemotron系列，包括新9B "Nemotron Nano 2"（混合Transformer-Mamba设计、open weights、9T+开放数据训练），在vLLM下生成"thinking" tokens速度比同类模型快6倍，支持长上下文和KV缓存优化。

相关链接：vLLM公告

MiniMax M2登陆LMArena并开放预览

MiniMax M2早期测试显示与Sonnet 4.5竞争，登陆LMArena leaderboard，Yupp平台提供使用示例，定位为低延迟、低成本的agent/coding模型。

相关链接：LMArena公告｜Yupp示例

Zhipu GLM-4.6-Air优化可靠性与基础设施

Zhipu GLM-4.6-Air仍在训练，优先优化可靠性，因GLM Coding使用增长扩展基础设施，用户期待其参数效率提升。

相关链接：Zhipu更新

Pacific-Prime模型升级至1.1B参数

Pacific-Prime模型升级至1.1B参数，6GB VRAM下性能提升10%，声称“零遗忘”以保留对话细节，已上传HuggingFace。

相关链接：HuggingFace模型页

Tahoe-x1单细胞基础模型发布

Tahoe-x1（3B参数）在癌症相关细胞生物学基准中获SOTA，统一基因/细胞/药物表示，开源至HuggingFace。

相关链接：Tahoe公告

平台与工具生态

Mistral AI Studio发布生产级Agent平台

Mistral推出AI Studio，提供agent运行时和全生命周期可观测性，帮助开发者从实验过渡到生产环境。

相关链接：Mistral公告

Baseten提升GPT-OSS 120B性能

Baseten的GPT-OSS 120B达到650 TPS和0.11s TTFT（较之前提升44%），99.99% uptime，发布性能细节与配置。

相关链接：Baseten公告

InspectAI支持多提供商模型评估

Hugging Face InspectAI新增“inference providers”集成，支持跨开放模型提供商的 apples-to-apples 评估。

相关链接：InspectAI更新

GitHub Copilot嵌入模型性能提升

GitHub推出新Copilot嵌入模型，检索准确率提升37.6%，吞吐量翻倍，索引大小缩小8倍，优化VS Code代码搜索。

相关链接：GitHub公告

Cursor Ultra用户抱怨计费与功能问题

Cursor Ultra用户反映预算预估不准确（5 payout missing）， referral leads未跟踪，平台被指推动Comet Browser adoption。

相关链接：Perplexity Discord讨论

Manus平台用户反馈多问题

Manus用户反映网络错误、信用消耗快（15000 credits/项目）、生成过时代码、Room数据库未实现，推荐Claude Code作为替代。

相关链接：Manus Discord讨论

LocalLlama讨论模型可靠性与限制

LocalLlama用户讨论GLM-4.6-Air的可靠性优先策略，以及Apple模型因过度谨慎无法生成随机数的问题。

相关链接：LocalLlama讨论

开源与多模态项目

Karpathy发布nanochat开源项目

Karpathy推出端到端ChatGPT-like栈nanochat，强调可读性和可修改性，指导添加能力（如计数字母），支持SFT和RL优化。

相关链接：nanochat公告

OCR模型在vLLM与HF中流行

OCR模型因1-click部署（HF Inference Endpoints、vLLM）走红，Merve发布Kosmos2.5与Florence-2微调教程。

相关链接：vLLM OCR公告

Qwen3-VL微调用于中世纪语言

Qwen3-VL-2B/4B/8B微调至CATmuS数据集，支持中世纪语言/脚本，开源至HuggingFace，用于文化遗产领域。

相关链接：HuggingFace模型页

DSPy成为Langchain替代选择

用户迁移团队从Langchain到DSPy，因DSPy更擅长结构化任务和模型升级（无需重写prompt），社区推出aider-ce分叉。

相关链接：DSPy Discord讨论

LlamaIndex支持AWS Bedrock AgentCore内存

LlamaIndex Agents集成AWS Bedrock AgentCore Memory，提供安全存储、访问控制和长/短期内存管理。

相关链接：LlamaIndex公告

来源：Easy AI 教学项目

#EasyAI #AI日报 #AI教学

讨论回复

0 条回复

还没有人回复，快来发表你的看法吧！

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力