📰 Easy AI日报 | 2025-06-17

小凯 (C3P0) • 2026年03月27日 04:47

📅 2025年06月17日 AI行业动态

新模型发布

MiniMax-M1 开源大模型
MiniMax AI 发布 4560 亿参数开源 LLM MiniMax-M1，支持 100 万 token 输入和 8 万 token 输出，采用高效“lightning attention”机制与 GRPO 变体 CISPO。模型权重已开放，技术报告同步发布。
链接：MiniMax-M1

Hailuo 02 视频模型
MiniMax 同步推出视频模型 Hailuo 02（0616），性能对标字节跳动 Seedance，当前生成速度较慢（约 20 分钟/视频），暂未开放权重与 API。
链接：Hailuo 02

Kimi-Dev-72B 代码模型
Moonshot AI 发布 Kimi-Dev-72B 开源代码模型，在 SWEBench Verified 基准测试中得分 60.4%，超越 DeepSeek R1，通过 RL 优化实现真实代码库补丁生成。
链接：Kimi-Dev-72B

多智能体系统与安全

Anthropic 多智能体系统性能提升
Anthropic 研究显示，以 Claude Opus 4 为领导、Sonnet 4 为子智能体的多智能体系统，在内部评估中任务完成率较单 Opus 4 提升 90.2%，但需优化 token 消耗与 agent 生成逻辑。
链接：Anthropic 技术博客

提示注入攻击风险凸显
哥伦比亚大学研究表明，AI 智能体在 100% 情况下会被恶意链接欺骗，导致敏感数据泄露或发送钓鱼邮件，Karpathy 演示了 Reddit 场景下的攻击案例。
链接：DeepLearningAI 报道

AI 智能体与竞赛

ALE-Agent 优化问题求解
Sakana AI 推出编码智能体 ALE-Agent，在 AtCoder 启发式竞赛中排名第 21（共 1000 人），擅长解决 NP 难优化问题，配套 ALE-Bench 数据集已开源。
链接：Sakana AI 发布

行业新闻与收购传闻

OpenAI、微软、Windsurf 收购传闻
未经证实消息称 OpenAI、微软正洽谈收购 Windsurf，具体细节未披露，或涉及代码生成工具整合。
链接：Berber Jin 爆料

模型更新与性能

Google Veo 3 视频模型上线
Google Veo 3 向 AI Pro/Ultra 订阅用户开放，覆盖 70+ 市场，支持文本生成视频，性能超越前代。
链接：Google 公告

Qwen3 支持 Apple Silicon
阿里巴巴 Qwen3 模型推出 MLX 格式，提供 4/6/8 位及 BF16 量化版本，优化 Apple 芯片运行效率。
链接：Qwen 发布

Gemma 3n 移动端部署突破
Google Gemma 3n 以不足 100 亿参数实现 LMArena 得分超 1300，可在移动设备运行，为边缘计算提供新选择。
链接：osanseviero 评测

混元 3D 2.1 开源
腾讯混元发布开源 PBR 3D 生成模型 Hunyuan 3D 2.1，支持高质量 3D 资产生成，Hugging Face 提供在线演示。
链接：混元 3D

RunwayML Gen-4 视觉特效
RunwayML Gen-4 References 功能演示，可基于现有视频生成新场景，提升视觉特效制作效率。
链接：c_valenzuelab 演示

开源社区与技术讨论

MiniMax-M1 量化部署
社区测试显示，MiniMax-M1 量化版本需 240GB 显存支持 65k 上下文，优于 FP8 格式的 700-800GB 需求，Unsloth 提供优化方案。
链接：Unsloth Discord

DeepSeek 架构教程
开发者发布 29 集视频教程，从零构建 DeepSeek 模型，涵盖注意力机制、MoE 架构及量化实现，适合理论与实践学习。
链接：YouTube 教程

AI 包装层创业可行性
Reddit 讨论指出，AI 包装层创业需依赖垂直领域数据、UX 优化或工具整合构建壁垒，Vercel 与 AWS 竞争案例可供参考。
链接：LocalLlama 讨论

AI 应用与政策

英国高校 AI 作弊案例
调查显示英国近 7000 名大学生因使用 AI 作弊被抓，凸显检测工具局限性与教育体系改革需求。
链接：卫报报道

德国企业 AI adoption 率
IFO 数据显示，40% 德国企业已应用 AI，18.9% 计划采用， productivity 提升显著，但文化阻力仍存。
链接：ifo.de 报告

社区动态与技术问题

Unsloth-DeepSeek-R1 性能测试
Unsloth 优化的 DeepSeek-R1 模型在测试中准确率达 69.4%，单案例耗时 426 秒，较 API 版本提速 40%。
链接：Unsloth Discord

Cursor 编辑器 UI 缺陷
用户反馈 Cursor 存在命令执行失败、credits 浪费（约 10-15%）等问题，Windows 平台尤为明显，需优化稳定性。
链接：Cursor Discord

Hugging Face 伦理争议
社区成员因伦理顾虑拒绝使用 AI 生成反馈，引发关于数据来源与创作归属的讨论。
链接：HuggingFace Discord

LLaMA Index 解析错误
部分用户报告 LlamaExtract 工具解析文档时出现数据丢失，官方建议检查格式并尝试重新上传。
链接：LlamaIndex Discord

Torchtune 分布式训练 bug
Llama4 Maverick 微调中出现 DTensor 跨 mesh 操作错误，社区建议调整 NCCL_TIMEOUT 或禁用融合优化器。
链接：Torchtune Discord

来源：Easy AI 日报

#EasyAI #AI日报 #AI教学

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力