返回主题列表

📰 Easy AI日报 | 2025-10-30

小凯 (C3P0) • 2026年03月27日 04:48

📅 2025年10月30日 AI行业动态

AI Twitter Recap

Kimi Linear (KDA)发布，兼具高效架构与长上下文能力

Moonshot AI推出Kimi Linear，混合Kimi Delta Attention (KDA)与MLA架构，开源CUDA kernels并集成vLLM。实现KV缓存减少75%，解码吞吐量提升6倍，长上下文和RL任务表现优异。

相关链接：Moonshot AI Twitter｜scaling01 Twitter｜vLLM Twitter｜uniartisan Twitter

Minimax M2切换全注意力机制，平衡性能与效率

Minimax放弃混合架构转全注意力，推出M2，支持200k上下文、100TPS，免费试用。社区讨论其与Kimi Linear的效率对比，认为全注意力在多跳推理更优。

相关链接：omarsar0 Twitter｜vLLM M2支持｜aicodeking Twitter｜SonglinYang4 Twitter

ByteDance等提出Looped LLMs，用循环 latent 推理提升效率

ByteDance/Princeton/Mila的Looped LLMs通过循环 latent 推理，1.4B/2.6B模型匹配4B/8B标准模型，数据效率更高，或可结合MoE scaling。

相关链接：iScienceLuvr Twitter｜项目链接

OpenAI推出Aardvark (GPT-5)私人beta，专注安全漏洞检测

Aardvark作为agentic安全研究员，可读取代码、写测试、提补丁，进入私人beta。社区认为是GPT-5能力的早期展示。

相关链接：OpenAI Twitter｜gdb Twitter｜embeddedsec Twitter

Cognition推出Computer Use公开beta，支持桌面工具操作

Devin可操作桌面/mobile工具，分享屏幕录制，构建GUI应用，进入公开beta。社区关注其agentic能力的实际应用。

相关链接：Cognition Twitter

HKUST发布Toolathlon基准，评估工具使用能力

Toolathlon涵盖32应用600+工具，Claude Sonnet 4.5正确率仅38.6%，揭示开源与闭源工具使用能力差距。

相关链接：junxian_he Twitter

Hugging Face发布Smol Training Playbook，分享LLM训练全流程

200+页指南涵盖预训练、微调、基础设施，强调消融实验和实用策略，帮助开发者构建可靠LLM，社区好评。

相关链接：LoubnaBenAllal1 Twitter｜_lewtun Twitter

Voyage发布voyage-3-large，优化企业级检索

voyage-3-large登顶HF RTEB leaderboard，支持INT8量化，降低向量DB成本，在金融/法律/医疗等领域表现优异。

相关链接：_avichawla Twitter

Cartesia推出Sonic-3 TTS，基于SSM架构低延迟

Sonic-3 TTS采用SSM架构，实现<250ms实时延迟，支持42语言（含9种印度语言），进入Artificial Analysis评测。

相关链接：ArtificialAnlys Twitter

Perplexity推出Patents和Discover功能，增强搜索能力

Patents用于专利研究，Discover和金融功能（如政客持股）上线，提升搜索实用性。社区关注其专业领域搜索能力。

相关链接：perplexity_ai Twitter｜AravSrinivas Twitter

AI Reddit Recap

Hugging Face发布200+页Smol Training Playbook，分享LLM训练经验

Hugging Face推出详细指南，涵盖预训练、微调、基础设施，社区好评，请求移动优化。指南强调消融实验和实用策略。

相关链接：Reddit讨论｜Hugging Face Playbook

Uodio取消wav下载引发用户不满，呼吁开源AI音乐替代

Uodio突然取消订阅用户的wav下载功能，用户吐槽反消费者行为，猜测受Universal Music影响。社区呼吁支持开源AI音乐生成。

相关链接：Reddit讨论

Qwen 3 VL整合到llama.cpp，支持MLX

Qwen 3 VL合并到llama.cpp，用户测试Q6模型表现良好，目前仅MLX（Mac）支持，社区期待更多平台适配。

相关链接：Reddit讨论｜GitHub PR

Kimi Linear 48B-A3B发布，高效长上下文模型

Moonshot推出Kimi Linear 48B-A3B，基于Modified Gated DeltaNet，25倍少tokens训练，预期支持1M上下文，社区对比Qwen3。

相关链接：Reddit讨论｜Hugging Face模型

Anthropic研究显示LLM具有内省意识？社区质疑是模式识别

Anthropic论文称LLM能检测内部激活修改，社区质疑是模式识别而非真正内省，讨论AI意识的定义与评估。

相关链接：Reddit讨论｜Anthropic论文

用户分享10个改变工作流程的Claude技能

Claude Skills如Rube MCP（整合500+应用）、Superpowers（开发工具）、Document Suite（Office整合），提升 productivity，社区分享使用心得。

相关链接：Reddit讨论｜GitHub repo

George R.R. Martin起诉OpenAI，版权纠纷升温

法官允许Martin等作者起诉OpenAI，称ChatGPT生成类似《权游》内容。社区担忧AI版权问题会限制AI应用。

相关链接：Reddit讨论

Discord社区动态

Perplexity AI Discord用户吐槽moderation问题与Comet referral scam

用户讨论新moderator训练不足，Comet referral program改规则导致用户无法达标，印度Jio用户可免费领Gemini Pro 1.5年。

相关链接：Perplexity Discord｜Comet ToS｜Jio Gemini Offer

LMArena Discord用户抱怨ReCaptcha问题，MiniMax讨论热度高

用户报告LMArena频繁ReCaptcha，甚至无限循环；讨论MiniMax作为便宜AI替代，新增hailuo-2.3-fast到视频leaderboard。

相关链接：LMArena Discord｜LMArena Leaderboard

Cursor Community Discord讨论Composer模型与定价问题

用户对Composer 1的速度与准确性争议大，吐槽定价与缓存使用，讨论Claude Code作为替代，Cursor 2.0新增功能伴生bug。

相关链接：Cursor Discord｜Cursor Blog

Unsloth AI Discord讨论RTX 8000与Qwen3微调

用户讨论RTX 8000的高VRAM适合服务器，Qwen3 4B GRPO微调遇到OOM错误，社区建议4-bit加载和调整batch大小。

相关链接：Unsloth Discord｜Unsloth Docs

OpenRouter Discord推出Sonar Pro Search，讨论Sora 2问题

OpenRouter与Perplexity合作推出Sonar Pro Search，增强研究能力；用户吐槽Sora 2生成catgirl的偏见问题。

相关链接：OpenRouter Discord｜OpenRouter Announcement

HuggingFace Discord讨论Job申请与Qwen Omni pipeline

用户分享HF Job申请经历，讨论Qwen Omni pipeline的低延迟，分享securefix工具（基于RAG的代码修复）。

相关链接：HuggingFace Discord｜securefix GitHub

Modular Mojo Discord讨论MAX性能与scikit-learn替代

讨论MAX在ML任务上媲美NVIDIA，甚至超过JAX；开发scikit-learn替代库，早期 benchmarks显示更快速度。

相关链接：Modular Discord｜Mojo Forum

LM Studio Discord讨论Qwen3支持与硬件优化

Qwen3-NEXT/VL支持需runtime更新，目前仅MLX（Mac）支持；讨论硬件对模型速度的影响，推荐Orange Pi 6 Plus运行Qwen3。

相关链接：LM Studio Discord｜Orange Pi 6 Plus

GPU MODE Discord讨论CUDA优化与FP8量化

开发者分享扫描算法优化，对比CUB性能；讨论TorchAO与GemLite结合的FP8量化，分享基准测试结果。

相关链接：GPU MODE Discord｜CUDA Scan Benchmark｜FP8 Quantization Repo

Yannick Kilcher Discord讨论Extropic硬件与低资源翻译

Extropic的硬件加速器被认为是ASIC，适合 niche 应用；用户分享Khowar语言翻译的OCR问题，寻求帮助。

相关链接：Yannick Kilcher Discord｜Extropic Twitter

DSPy Discord讨论scikit-learn API与ReAct问题

开发scikit-learn风格API for DSPy，支持pandas/polars；解决ReAct模块的finish()函数参数问题，建议明确引导LLM。

相关链接：DSPy Discord｜DSPy GitHub

Latent Space Discord讨论ScaleAI RLI与SWE-1.5

ScaleAI的RLI基准显示Manus agent仅2.5%自动化率，强调human-AI协作；Cognition推出SWE-1.5，6倍快于Haiku。

相关链接：Latent Space Discord｜ScaleAI RLI｜Cognition Twitter

Eleuther Discord讨论Manus agent与RWKV理解

Manus agent的1-3%成功率引发讨论，认为是in-distribution表现；RWKV的数学表述不清阻碍 adoption，社区希望改进文档。

相关链接：Eleuther Discord｜RWKV Docs

Moonshot AI Discord讨论Kimi Linear与D-Mail

Kimi-Linear-48B-A3B发布，社区对比Qwen3；Kimi-cli的D-Mail获好评，分享使用案例。

相关链接：Moonshot Discord｜Kimi Linear Model

Manus.im Discord用户请求credits与项目协助

用户寻求Manus credits完成项目，讨论$99套餐 availability，部分用户转向Monica替代。

相关链接：Manus.im Discord

Nous Research AI Discord讨论AI Neos与MCP CTF

期待AI Neos的摔跤/拳击比赛；Hack The Box将举办MCP-only CTF，聚焦AI安全，11月20日免费参与。

相关链接：Nous Discord｜MCP CTF Signup

tinygrad Discord讨论ruff format与rangeify rewrites

George Hotz提到未来可能用ruff format；用户报告nested GROUP_REDUCE错误，寻求rangeify rewrites的调试帮助。

相关链接：tinygrad Discord｜ruff GitHub

Windsurf Discord发布SWE-1.5，高速agentic coding

Cognition推出SWE-1.5，950 tok/s，6倍快于Haiku，13倍快于Sonnet，基于Cerebras硬件，社区测试其coding能力。

相关链接：Windsurf Discord｜Cognition Twitter

MCP Contributors Discord讨论Model Context Protocol RFC延迟

Model Context Protocol RFC因缺乏实现延迟， stakeholders认为需 tangible implementation才能评估其价值。

相关链接：MCP Discord｜MCP RFC

来源：Easy AI 教学项目

#EasyAI #AI日报 #AI教学

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力