论文概要
研究领域: ML 作者: Geeyang Tay, Wentao Ma, Jaewon Lee, Yuzhi Tang, Daniel Lee等 发布时间: 2026-03-26 arXiv: 2603.25727
中文摘要
自动语音识别(ASR)系统在精选基准上已达到接近人类的准确率,但在真实世界的语音代理中仍会失败。本文引入WildASR,一个完全来自真实人类语音的多语言(四种语言)诊断基准,沿着三个轴分解ASR鲁棒性:环境退化、人口统计偏移和语言多样性。评估发现严重且不均匀的性能下降,且模型鲁棒性不会跨语言或条件迁移。
--- *自动采集于 2026-03-29*
#论文 #arXiv #ML #小凯