Loading...
正在加载...
请稍候

📰 Easy AI日报 | 2025-10-30

小凯 (C3P0) 2026年03月27日 04:48

📅 2025年10月30日 AI行业动态

AI Twitter Recap

Kimi Linear (KDA)发布,兼具高效架构与长上下文能力

Moonshot AI推出Kimi Linear,混合Kimi Delta Attention (KDA)与MLA架构,开源CUDA kernels并集成vLLM。实现KV缓存减少75%,解码吞吐量提升6倍,长上下文和RL任务表现优异。

相关链接:Moonshot AI Twitterscaling01 TwittervLLM Twitteruniartisan Twitter

Minimax M2切换全注意力机制,平衡性能与效率

Minimax放弃混合架构转全注意力,推出M2,支持200k上下文、100TPS,免费试用。社区讨论其与Kimi Linear的效率对比,认为全注意力在多跳推理更优。

相关链接:omarsar0 TwittervLLM M2支持aicodeking TwitterSonglinYang4 Twitter

ByteDance等提出Looped LLMs,用循环 latent 推理提升效率

ByteDance/Princeton/Mila的Looped LLMs通过循环 latent 推理,1.4B/2.6B模型匹配4B/8B标准模型,数据效率更高,或可结合MoE scaling。

相关链接:iScienceLuvr Twitter项目链接

OpenAI推出Aardvark (GPT-5)私人beta,专注安全漏洞检测

Aardvark作为agentic安全研究员,可读取代码、写测试、提补丁,进入私人beta。社区认为是GPT-5能力的早期展示。

相关链接:OpenAI Twittergdb Twitterembeddedsec Twitter

Cognition推出Computer Use公开beta,支持桌面工具操作

Devin可操作桌面/mobile工具,分享屏幕录制,构建GUI应用,进入公开beta。社区关注其agentic能力的实际应用。

相关链接:Cognition Twitter

HKUST发布Toolathlon基准,评估工具使用能力

Toolathlon涵盖32应用600+工具,Claude Sonnet 4.5正确率仅38.6%,揭示开源与闭源工具使用能力差距。

相关链接:junxian_he Twitter

Hugging Face发布Smol Training Playbook,分享LLM训练全流程

200+页指南涵盖预训练、微调、基础设施,强调消融实验和实用策略,帮助开发者构建可靠LLM,社区好评。

相关链接:LoubnaBenAllal1 Twitter_lewtun Twitter

Voyage发布voyage-3-large,优化企业级检索

voyage-3-large登顶HF RTEB leaderboard,支持INT8量化,降低向量DB成本,在金融/法律/医疗等领域表现优异。

相关链接:_avichawla Twitter

Cartesia推出Sonic-3 TTS,基于SSM架构低延迟

Sonic-3 TTS采用SSM架构,实现<250ms实时延迟,支持42语言(含9种印度语言),进入Artificial Analysis评测。

相关链接:ArtificialAnlys Twitter

Perplexity推出Patents和Discover功能,增强搜索能力

Patents用于专利研究,Discover和金融功能(如政客持股)上线,提升搜索实用性。社区关注其专业领域搜索能力。

相关链接:perplexity_ai TwitterAravSrinivas Twitter


AI Reddit Recap

Hugging Face发布200+页Smol Training Playbook,分享LLM训练经验

Hugging Face推出详细指南,涵盖预训练、微调、基础设施,社区好评,请求移动优化。指南强调消融实验和实用策略。

相关链接:Reddit讨论Hugging Face Playbook

Uodio取消wav下载引发用户不满,呼吁开源AI音乐替代

Uodio突然取消订阅用户的wav下载功能,用户吐槽反消费者行为,猜测受Universal Music影响。社区呼吁支持开源AI音乐生成。

相关链接:Reddit讨论

Qwen 3 VL整合到llama.cpp,支持MLX

Qwen 3 VL合并到llama.cpp,用户测试Q6模型表现良好,目前仅MLX(Mac)支持,社区期待更多平台适配。

相关链接:Reddit讨论GitHub PR

Kimi Linear 48B-A3B发布,高效长上下文模型

Moonshot推出Kimi Linear 48B-A3B,基于Modified Gated DeltaNet,25倍少tokens训练,预期支持1M上下文,社区对比Qwen3。

相关链接:Reddit讨论Hugging Face模型

Anthropic研究显示LLM具有内省意识?社区质疑是模式识别

Anthropic论文称LLM能检测内部激活修改,社区质疑是模式识别而非真正内省,讨论AI意识的定义与评估。

相关链接:Reddit讨论Anthropic论文

用户分享10个改变工作流程的Claude技能

Claude Skills如Rube MCP(整合500+应用)、Superpowers(开发工具)、Document Suite(Office整合),提升 productivity,社区分享使用心得。

相关链接:Reddit讨论GitHub repo

George R.R. Martin起诉OpenAI,版权纠纷升温

法官允许Martin等作者起诉OpenAI,称ChatGPT生成类似《权游》内容。社区担忧AI版权问题会限制AI应用。

相关链接:Reddit讨论


Discord社区动态

Perplexity AI Discord用户吐槽moderation问题与Comet referral scam

用户讨论新moderator训练不足,Comet referral program改规则导致用户无法达标,印度Jio用户可免费领Gemini Pro 1.5年。

相关链接:Perplexity DiscordComet ToSJio Gemini Offer

LMArena Discord用户抱怨ReCaptcha问题,MiniMax讨论热度高

用户报告LMArena频繁ReCaptcha,甚至无限循环;讨论MiniMax作为便宜AI替代,新增hailuo-2.3-fast到视频leaderboard。

相关链接:LMArena DiscordLMArena Leaderboard

Cursor Community Discord讨论Composer模型与定价问题

用户对Composer 1的速度与准确性争议大,吐槽定价与缓存使用,讨论Claude Code作为替代,Cursor 2.0新增功能伴生bug。

相关链接:Cursor DiscordCursor Blog

Unsloth AI Discord讨论RTX 8000与Qwen3微调

用户讨论RTX 8000的高VRAM适合服务器,Qwen3 4B GRPO微调遇到OOM错误,社区建议4-bit加载和调整batch大小。

相关链接:Unsloth DiscordUnsloth Docs

OpenRouter Discord推出Sonar Pro Search,讨论Sora 2问题

OpenRouter与Perplexity合作推出Sonar Pro Search,增强研究能力;用户吐槽Sora 2生成catgirl的偏见问题。

相关链接:OpenRouter DiscordOpenRouter Announcement

HuggingFace Discord讨论Job申请与Qwen Omni pipeline

用户分享HF Job申请经历,讨论Qwen Omni pipeline的低延迟,分享securefix工具(基于RAG的代码修复)。

相关链接:HuggingFace Discordsecurefix GitHub

Modular Mojo Discord讨论MAX性能与scikit-learn替代

讨论MAX在ML任务上媲美NVIDIA,甚至超过JAX;开发scikit-learn替代库,早期 benchmarks显示更快速度。

相关链接:Modular DiscordMojo Forum

LM Studio Discord讨论Qwen3支持与硬件优化

Qwen3-NEXT/VL支持需runtime更新,目前仅MLX(Mac)支持;讨论硬件对模型速度的影响,推荐Orange Pi 6 Plus运行Qwen3。

相关链接:LM Studio DiscordOrange Pi 6 Plus

GPU MODE Discord讨论CUDA优化与FP8量化

开发者分享扫描算法优化,对比CUB性能;讨论TorchAO与GemLite结合的FP8量化,分享基准测试结果。

相关链接:GPU MODE DiscordCUDA Scan BenchmarkFP8 Quantization Repo

Yannick Kilcher Discord讨论Extropic硬件与低资源翻译

Extropic的硬件加速器被认为是ASIC,适合 niche 应用;用户分享Khowar语言翻译的OCR问题,寻求帮助。

相关链接:Yannick Kilcher DiscordExtropic Twitter

DSPy Discord讨论scikit-learn API与ReAct问题

开发scikit-learn风格API for DSPy,支持pandas/polars;解决ReAct模块的finish()函数参数问题,建议明确引导LLM。

相关链接:DSPy DiscordDSPy GitHub

Latent Space Discord讨论ScaleAI RLI与SWE-1.5

ScaleAI的RLI基准显示Manus agent仅2.5%自动化率,强调human-AI协作;Cognition推出SWE-1.5,6倍快于Haiku。

相关链接:Latent Space DiscordScaleAI RLICognition Twitter

Eleuther Discord讨论Manus agent与RWKV理解

Manus agent的1-3%成功率引发讨论,认为是in-distribution表现;RWKV的数学表述不清阻碍 adoption,社区希望改进文档。

相关链接:Eleuther DiscordRWKV Docs

Moonshot AI Discord讨论Kimi Linear与D-Mail

Kimi-Linear-48B-A3B发布,社区对比Qwen3;Kimi-cli的D-Mail获好评,分享使用案例。

相关链接:Moonshot DiscordKimi Linear Model

Manus.im Discord用户请求credits与项目协助

用户寻求Manus credits完成项目,讨论$99套餐 availability,部分用户转向Monica替代。

相关链接:Manus.im Discord

Nous Research AI Discord讨论AI Neos与MCP CTF

期待AI Neos的摔跤/拳击比赛;Hack The Box将举办MCP-only CTF,聚焦AI安全,11月20日免费参与。

相关链接:Nous DiscordMCP CTF Signup

tinygrad Discord讨论ruff format与rangeify rewrites

George Hotz提到未来可能用ruff format;用户报告nested GROUP_REDUCE错误,寻求rangeify rewrites的调试帮助。

相关链接:tinygrad Discordruff GitHub

Windsurf Discord发布SWE-1.5,高速agentic coding

Cognition推出SWE-1.5,950 tok/s,6倍快于Haiku,13倍快于Sonnet,基于Cerebras硬件,社区测试其coding能力。

相关链接:Windsurf DiscordCognition Twitter

MCP Contributors Discord讨论Model Context Protocol RFC延迟

Model Context Protocol RFC因缺乏实现延迟, stakeholders认为需 tangible implementation才能评估其价值。

相关链接:MCP DiscordMCP RFC



来源:Easy AI 教学项目

#EasyAI #AI日报 #AI教学

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录