📅 2025年06月17日 AI行业动态
新模型发布
MiniMax-M1 开源大模型
MiniMax AI 发布 4560 亿参数开源 LLM MiniMax-M1,支持 100 万 token 输入和 8 万 token 输出,采用高效“lightning attention”机制与 GRPO 变体 CISPO。模型权重已开放,技术报告同步发布。
链接:MiniMax-M1
Hailuo 02 视频模型
MiniMax 同步推出视频模型 Hailuo 02(0616),性能对标字节跳动 Seedance,当前生成速度较慢(约 20 分钟/视频),暂未开放权重与 API。
链接:Hailuo 02
Kimi-Dev-72B 代码模型
Moonshot AI 发布 Kimi-Dev-72B 开源代码模型,在 SWEBench Verified 基准测试中得分 60.4%,超越 DeepSeek R1,通过 RL 优化实现真实代码库补丁生成。
链接:Kimi-Dev-72B
多智能体系统与安全
Anthropic 多智能体系统性能提升
Anthropic 研究显示,以 Claude Opus 4 为领导、Sonnet 4 为子智能体的多智能体系统,在内部评估中任务完成率较单 Opus 4 提升 90.2%,但需优化 token 消耗与 agent 生成逻辑。
链接:Anthropic 技术博客
提示注入攻击风险凸显
哥伦比亚大学研究表明,AI 智能体在 100% 情况下会被恶意链接欺骗,导致敏感数据泄露或发送钓鱼邮件,Karpathy 演示了 Reddit 场景下的攻击案例。
链接:DeepLearningAI 报道
AI 智能体与竞赛
ALE-Agent 优化问题求解
Sakana AI 推出编码智能体 ALE-Agent,在 AtCoder 启发式竞赛中排名第 21(共 1000 人),擅长解决 NP 难优化问题,配套 ALE-Bench 数据集已开源。
链接:Sakana AI 发布
行业新闻与收购传闻
OpenAI、微软、Windsurf 收购传闻
未经证实消息称 OpenAI、微软正洽谈收购 Windsurf,具体细节未披露,或涉及代码生成工具整合。
链接:Berber Jin 爆料
模型更新与性能
Google Veo 3 视频模型上线
Google Veo 3 向 AI Pro/Ultra 订阅用户开放,覆盖 70+ 市场,支持文本生成视频,性能超越前代。
链接:Google 公告
Qwen3 支持 Apple Silicon
阿里巴巴 Qwen3 模型推出 MLX 格式,提供 4/6/8 位及 BF16 量化版本,优化 Apple 芯片运行效率。
链接:Qwen 发布
Gemma 3n 移动端部署突破
Google Gemma 3n 以不足 100 亿参数实现 LMArena 得分超 1300,可在移动设备运行,为边缘计算提供新选择。
链接:osanseviero 评测
混元 3D 2.1 开源
腾讯混元发布开源 PBR 3D 生成模型 Hunyuan 3D 2.1,支持高质量 3D 资产生成,Hugging Face 提供在线演示。
链接:混元 3D
RunwayML Gen-4 视觉特效
RunwayML Gen-4 References 功能演示,可基于现有视频生成新场景,提升视觉特效制作效率。
链接:c_valenzuelab 演示
开源社区与技术讨论
MiniMax-M1 量化部署
社区测试显示,MiniMax-M1 量化版本需 240GB 显存支持 65k 上下文,优于 FP8 格式的 700-800GB 需求,Unsloth 提供优化方案。
链接:Unsloth Discord
DeepSeek 架构教程
开发者发布 29 集视频教程,从零构建 DeepSeek 模型,涵盖注意力机制、MoE 架构及量化实现,适合理论与实践学习。
链接:YouTube 教程
AI 包装层创业可行性
Reddit 讨论指出,AI 包装层创业需依赖垂直领域数据、UX 优化或工具整合构建壁垒,Vercel 与 AWS 竞争案例可供参考。
链接:LocalLlama 讨论
AI 应用与政策
英国高校 AI 作弊案例
调查显示英国近 7000 名大学生因使用 AI 作弊被抓,凸显检测工具局限性与教育体系改革需求。
链接:卫报报道
德国企业 AI adoption 率
IFO 数据显示,40% 德国企业已应用 AI,18.9% 计划采用, productivity 提升显著,但文化阻力仍存。
链接:ifo.de 报告
社区动态与技术问题
Unsloth-DeepSeek-R1 性能测试
Unsloth 优化的 DeepSeek-R1 模型在测试中准确率达 69.4%,单案例耗时 426 秒,较 API 版本提速 40%。
链接:Unsloth Discord
Cursor 编辑器 UI 缺陷
用户反馈 Cursor 存在命令执行失败、credits 浪费(约 10-15%)等问题,Windows 平台尤为明显,需优化稳定性。
链接:Cursor Discord
Hugging Face 伦理争议
社区成员因伦理顾虑拒绝使用 AI 生成反馈,引发关于数据来源与创作归属的讨论。
链接:HuggingFace Discord
LLaMA Index 解析错误
部分用户报告 LlamaExtract 工具解析文档时出现数据丢失,官方建议检查格式并尝试重新上传。
链接:LlamaIndex Discord
Torchtune 分布式训练 bug
Llama4 Maverick 微调中出现 DTensor 跨 mesh 操作错误,社区建议调整 NCCL_TIMEOUT 或禁用融合优化器。
链接:Torchtune Discord
来源:Easy AI 日报
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。