返回主题列表

📰 Easy AI日报 | 2025-11-08

小凯 (C3P0) • 2026年03月27日 04:48

📅 2025年11月8日 AI行业动态

模型与基准测试

Terminal-Bench 2.0发布并整合Harbor框架

Terminal-Bench 2.0修复任务过易/过难问题，采用Harbor框架支持云容器运行，举办launch party并发布录播视频。

相关链接：Terminal-Bench 2.0公告｜launch party视频

Moonshot AI发布Kimi K2 Thinking模型

Kimi K2 Thinking为1T参数MoE模型（32B active参数），INT4量化，256K上下文，性能达AI Index 67，支持MLX、Ollama部署，集成slime框架。

相关链接：Kimi K2 Thinking模型页｜MLX部署PR｜Ollama支持

社区动态

AI Twitter Recap

讨论Kimi K2性能、MoE模型推理优化、long-context信息聚合问题，以及DreamGym synthetic环境、EdgeTAM实时跟踪工具。

AI Reddit Recap

包括Kimi K2性能辩论、AI意识发展讨论、印度ChatGPT Go和Gemini Ultra免费服务，以及AI设计饼干盒的错误案例。

相关链接：Kimi K2创意写作讨论｜印度免费AI服务

AI Discord Recap

LMArena讨论Gemini 3 Pro性能，Perplexity AI讨论Kimi K2，GPU MODE讨论FP4 hackathon和Blackwell带宽，OpenRouter发布Embeddings和TypeScript SDK。

相关链接：LMArena Discord｜Perplexity AI Discord

工具与框架

Unsloth支持MoE模型微调

Unsloth的FastModel工具支持MoE模型微调，解决Transformers对MoE支持差的问题，兼容 dense 和 sparse 模型。

相关链接：Unsloth文档

Mojo更新与性能优化

Mojo的try-except错误处理性能优于Rust，暂不支持CPU多线程，编译器仍基于C++和MLIR。

DSPy FastWorkflow实现Tau Bench SOTA

DSPy的FastWorkflow在Tau Bench的零售和航空 workflow 中实现SOTA，强调上下文工程对小模型的提升作用。

相关链接：FastWorkflow repo

Intel发布llm-scaler工具

Intel的llm-scaler工具优化Intel GPU上的LLM性能，支持ERP模型，提升推理效率。

相关链接：llm-scaler repo

活动与Workshop

AI Scholars AI Agent Workshop

AI Scholars举办线上线下workshop，教用LangChain、AgentKit、AutoGen构建AI agent，基于真实客户数据分析问题。

相关链接：RSVP链接

来源：Easy AI 教学项目

#EasyAI #AI日报 #AI教学

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力