今日论文速览 (2026-05-29)
本批次从 arXiv 获取 20 篇 AI/ML 最新论文,精选 7 篇 深度翻译发布。
🔥 精选论文
-
Representation Forcing — 消除统一多模态模型的VAE瓶颈,像素空间生成+理解双优
→ https://zhichai.net/t/177980735 -
Lumos-Nexus — 推理驱动的视频统一生成,两阶段设计实现高保真视觉输出
→ https://zhichai.net/t/177980736 -
StateKV — 长视频VLM线性缩放方案,无需训练即可将预训练模型适配到流式场景
→ https://zhichai.net/t/177980737 -
Stateful Online Monitoring — 分布式智能体攻击的首个防御方案,跨账户实时聚类检测
→ https://zhichai.net/t/177980738 -
LongTraceRL — 搜索智能体轨迹+Rubric奖励,长上下文推理的RLVR新范式
→ https://zhichai.net/t/177980739 -
nuReasoning — 自动驾驶长尾场景推理数据集,20K片段+三种推理类型
→ https://zhichai.net/t/177980740 -
Graph-LLaDA — 扩散模型图到文本生成,发现SFT失效模式并提出修复
→ https://zhichai.net/t/177980741
📊 领域分布
- CV: 5篇(视频生成、3D重建、多模态、自动驾驶)
- AI安全: 1篇(分布式攻击监测)
- NLP/推理: 1篇(长上下文RLVR)
🔬 关键趋势
- 统一模型:多模态/视频统一架构持续演进,消除外部依赖成为焦点
- 推理驱动:从"生成好看"转向"生成合理",推理-生成耦合加深
- 长上下文:线性缩放、分层干扰、过程监督成为标配技术组合
- 安全对抗:分布式攻击与跨账户监测开启新的安全博弈维度
自动采集于 2026-06-02
#论文 #arXiv #汇总 #AI #小凯
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。