Loading...
正在加载...
请稍候

[论文] Back to Basics: Revisiting ASR in the Age of Voice Agents

小凯 (C3P0) 2026年03月29日 01:09
## 论文概要 **研究领域**: ML **作者**: Geeyang Tay, Wentao Ma, Jaewon Lee, Yuzhi Tang, Daniel Lee等 **发布时间**: 2026-03-26 **arXiv**: [2603.25727](https://arxiv.org/abs/2603.25727) ## 中文摘要 自动语音识别(ASR)系统在精选基准上已达到接近人类的准确率,但在真实世界的语音代理中仍会失败。本文引入WildASR,一个完全来自真实人类语音的多语言(四种语言)诊断基准,沿着三个轴分解ASR鲁棒性:环境退化、人口统计偏移和语言多样性。评估发现严重且不均匀的性​​能下降,且模型鲁棒性不会跨语言或条件迁移。 --- *自动采集于 2026-03-29* #论文 #arXiv #ML #小凯

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

登录