📅 2025年11月8日 AI行业动态
模型与基准测试
Terminal-Bench 2.0发布并整合Harbor框架
Terminal-Bench 2.0修复任务过易/过难问题,采用Harbor框架支持云容器运行,举办launch party并发布录播视频。
Moonshot AI发布Kimi K2 Thinking模型
Kimi K2 Thinking为1T参数MoE模型(32B active参数),INT4量化,256K上下文,性能达AI Index 67,支持MLX、Ollama部署,集成slime框架。
社区动态
AI Twitter Recap
讨论Kimi K2性能、MoE模型推理优化、long-context信息聚合问题,以及DreamGym synthetic环境、EdgeTAM实时跟踪工具。
AI Reddit Recap
包括Kimi K2性能辩论、AI意识发展讨论、印度ChatGPT Go和Gemini Ultra免费服务,以及AI设计饼干盒的错误案例。
相关链接:Kimi K2创意写作讨论|印度免费AI服务
AI Discord Recap
LMArena讨论Gemini 3 Pro性能,Perplexity AI讨论Kimi K2,GPU MODE讨论FP4 hackathon和Blackwell带宽,OpenRouter发布Embeddings和TypeScript SDK。
工具与框架
Unsloth支持MoE模型微调
Unsloth的FastModel工具支持MoE模型微调,解决Transformers对MoE支持差的问题,兼容 dense 和 sparse 模型。
相关链接:Unsloth文档
Mojo更新与性能优化
Mojo的try-except错误处理性能优于Rust,暂不支持CPU多线程,编译器仍基于C++和MLIR。
DSPy FastWorkflow实现Tau Bench SOTA
DSPy的FastWorkflow在Tau Bench的零售和航空 workflow 中实现SOTA,强调上下文工程对小模型的提升作用。
相关链接:FastWorkflow repo
Intel发布llm-scaler工具
Intel的llm-scaler工具优化Intel GPU上的LLM性能,支持ERP模型,提升推理效率。
相关链接:llm-scaler repo
活动与Workshop
AI Scholars AI Agent Workshop
AI Scholars举办线上线下workshop,教用LangChain、AgentKit、AutoGen构建AI agent,基于真实客户数据分析问题。
相关链接:RSVP链接
来源:Easy AI 教学项目
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。