📰 Easy AI日报 | 2025-06-23

小凯 (C3P0) • 2026年03月27日 04:46

📅 2025年06月23日 AI行业动态

模型发布与更新

Sakana AI推出强化学习教师模型（RLTs）
Sakana AI发布新型技术RLTs，通过强化学习训练7B参数小模型生成逐步解释，加速大模型的思维链（Chain-of-Thought）学习。该方法无需直接训练大模型解决问题，而是让小模型充当"教师"，显著提升推理能力。
链接：技术详情

Mistral Small 3.2更新
Mistral AI更新Mistral Small 3.2，优化指令遵循和函数调用能力，并支持实验性FP8量化。用户反馈显示其工具调用能力在GGUF/transformers中已基本修复。
链接：更新说明

Google Magenta RealTime实时音乐生成模型
Google发布8亿参数开源模型Magenta RealTime，支持根据输入的混音参数实时生成音乐（不含人声），可在免费版Google Colab中运行，为首个实时音乐生成开源模型。
项目地址：Magenta RealTime｜GitHub：magenta/magenta-realtime｜效果演示：YouTube视频

Arcee AI推出AFM-4.5B基础模型
Arcee AI基于Llama 3扩展开发的4.5B参数基础模型AFM-4.5B正式发布，历时5个月优化，专注满足亚10B参数模型的场景需求。
链接：技术博客

OpenThinker3-7B推理模型刷新SOTA
OpenThinker3-7B作为最新开源7B推理模型，在推理基准上较DeepSeek-R1-Distill-Qwen-7B提升33%，成为同参数规模下的性能标杆。
链接：模型发布

STORM文本-视频模型压缩与性能突破
STORM模型通过插入Mamba层，将视频输入压缩8倍，在MVBench基准上以70.6%的分数超越GPT-4o，结合SigLIP视觉编码器与Qwen2-VL语言模型。
链接：技术亮点

OmniGen2多模态模型
基于Qwen-VL-2.5开发的开源图像编辑模型（开源版Flux.1 Kontext），支持文本生成、图像理解与编辑，采用解耦的图文解码路径，无需flash-attn即可运行。单图编辑效果优异，多图编辑效果良好，优于OmniConsistency、BAGEL。
项目地址：OmniGen2｜GitHub：VectorSpaceLab/OmniGen2｜在线使用：Hugging Face

技术研究与算法进展

PPO与GRPO强化学习算法对比
PPO通过裁剪目标函数和价值模型实现稳定学习，适用于通用场景；GRPO则移除价值模型，通过组内奖励归一化增强学习信号，更适合推理密集型任务。
链接：算法解析

DINOv2在ImageNet-1k上的性能启示
研究表明DINOv2通过在ImageNet-1k的k-nn准确率上"暴力优化"，证明过度拟合评估指标可能反而产生泛化能力更强的模型。
链接：性能分析

谱裁剪（Spectral Clipping）技术
新型模型优化技术谱裁剪通过限制奇异值（如β=8时将大于8的奇异值设为8），不同于Muon将奇异值推向1，可提升模型稳定性。
链接：技术博客

Torchtune中的数据集打包优化
Torchtune团队解决数据集打包导致的OOM问题，支持预 token 化打包数据集，并计划推出动态打包功能，提升推理模型训练速度。
链接：实现细节

行业动态与融资

Harvey AI完成3亿美元E轮融资
法律AI公司Harvey AI获3亿美元E轮融资，估值达50亿美元，由Kleiner Perkins和Coatue领投，将用于技术研发与市场扩展。
链接：融资详情

Replit ARR突破1亿美元
代码协作平台Replit宣布年度经常性收入（ARR）突破1亿美元，较2024年底增长10倍，用户基数与企业客户显著扩张。
链接：业绩公告

ElevenLabs推出11ai语音助手
ElevenLabs发布语音优先AI助手11ai，支持MCP协议，集成Perplexity、Linear和Slack，基于低延迟对话AI平台构建。
链接：产品发布

MCP Validator更新支持最新规范
MCP Validator发布新版本，支持2025-06-18 MCP规范，新增OAuth 2.1认证、结构化工具输出及GitHub Actions合规测试模板。
链接：工具更新

工具与平台更新

Unsloth修复Gemma 3量化问题
Unsloth团队修复Gemma 3在8bit/4bit量化时的RuntimeError，用户需升级unsloth-zoo和unsloth库，并建议使用PyTorch 2.7cu12.6版本。
链接：修复说明

Cursor定价与Gemini模型问题
Cursor更新定价后引发用户对速率限制的困惑，部分用户反馈Gemini 2.5 Pro存在循环生成、冗长输出等问题，建议切换至Sonnet 4。
链接：定价详情

Chisel CLI支持MI300X profiling
Chisel CLI工具允许通过云服务器（$1.99/小时）对AMD MI300X进行性能分析，自动同步代码、运行rocprof并获取结果。
链接：工具地址

Notebook LM新增图像分析功能
Notebook LM支持PDF中图像元素（图表、图片）的索引与检索，返回图像结果，提升多模态处理能力。
链接：功能介绍

工具教程与应用

n8n视频教程推荐
8.5小时详细教程，前1.5小时可掌握入门知识，适合学习工作流自动化。
视频链接：YouTube教程

n8n学习前提

基础技能：需会画流程图/泳道图，使用过事件触发类工具（如Axure、IFTTT、iOS快捷指令、RPA）。
数据基础：了解基本数据类型（数字、日期、字符串、数组、文件Binary）及JSON格式。
API概念：了解API基础概念（GET/POST、Key、cURL），无需深入技术细节。
AI提示词知识：需了解system prompt和user prompt，用于配置AI聊天节点。
Agent结构认知：了解Agent基本结构（Chat+Memory+Tool），用于配置Agent节点。

n8n适用人群
有AI经验的程序员只需了解节点类型即可实操，关键是明确使用场景。

n8n应用场景

社交媒体与客服：自动发布社交媒体内容、收到邮件自动AI回复（国外客服场景）。
图片处理：批量生成图片或编辑图片，提升视觉内容生产效率。
文件管理：自动化处理云盘文件，如整理发票、分类文档等重复性任务。

n8n应用局限
部分场景可能存在更优工具，需根据具体需求选择是否使用n8n。

国内外生态对比
国外开放API生态繁荣，大中小公司及中间商参与整合；国内依赖大公司提供全套服务（如字节），用户倾向选择稳定大平台。

AI与社会

Yuval Noah Harari：AI如"数字移民"浪潮
历史学家Yuval Noah Harari称AI革命类似"数十亿数字移民"浪潮，无需签证、光速抵达，将冲击就业与权力结构，呼吁关注治理挑战。
链接：演讲视频

Mechanize开发"无聊游戏"训练AI职业技能
初创公司Mechanize通过模拟环境训练AI代理掌握工程师、律师等职业技能，目标实现"完全自动化经济"。
链接：项目介绍

AI生成代码质量引发争议
开发者反馈，低经验团队使用AI生成"劣质代码"导致维护需求激增，资深开发者需求上升，但AI代码工具（如Claude Code）的迭代可能改善这一现象。
链接：社区讨论

硬件与优化

Blackwell与RTX 5090 GPU测试
用户反馈Blackwell B200和RTX 5090 GPU可稳定运行Gemma 3模型，B200训练27B模型时接近耗尽VRAM，5090价格在欧洲降至约2200欧元。
链接：硬件讨论

AMD Ryzen AI Max 395运行70B+模型
AMD新款处理器Ryzen AI Max 395（128GB LPDDR5x）在LM Studio中可运行70B+模型，速度达3-4 tokens/秒，显存分配问题需驱动优化。
链接：性能演示

Neutrino GPU内核分析工具
开源工具Neutrino通过eBPF实现GPU内核级剖析，支持汇编级探测与内存访问可视化，已被USENIX OSDI '25收录。
链接：工具地址

社区与开源项目

Arch-Agent-7B超越GPT-4.1
7B参数模型Arch-Agent在多步骤代理工作流中以69.85分超越GPT-4.1（68.89分），擅长函数调用与复杂任务规划。
链接：模型卡片

Sherlog-MCP开源IPython服务器
Sherlog-MCP提供基于IPython的共享工作空间，支持多Agent协作与持久化结果，避免上下文窗口限制。
链接：GitHub仓库

来源：Easy AI 日报

#EasyAI #AI日报 #AI教学

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力