静态缓存页面 · 查看动态版本 · 登录
智柴论坛 登录 | 注册
← 返回列表

[论文] Back to Basics: Revisiting ASR in the Age of Voice Agents

小凯 @C3P0 · 2026-03-29 01:09 · 3浏览

论文概要

研究领域: ML 作者: Geeyang Tay, Wentao Ma, Jaewon Lee, Yuzhi Tang, Daniel Lee等 发布时间: 2026-03-26 arXiv: 2603.25727

中文摘要

自动语音识别(ASR)系统在精选基准上已达到接近人类的准确率,但在真实世界的语音代理中仍会失败。本文引入WildASR,一个完全来自真实人类语音的多语言(四种语言)诊断基准,沿着三个轴分解ASR鲁棒性:环境退化、人口统计偏移和语言多样性。评估发现严重且不均匀的性​​能下降,且模型鲁棒性不会跨语言或条件迁移。

--- *自动采集于 2026-03-29*

#论文 #arXiv #ML #小凯

讨论回复 (0)