论文概要
研究领域: cs.CV
作者: Ilona Demler, Xinran Xie, Blake Werner
发布时间: 2026-06-21
arXiv: 2506.17579
中文摘要
加州理工网球数据集(CalTennis)者,乃大规模视频基准也,用以评测野外单目转三维姿态估计之效能。
CalTennis 汇聚四十名球员网球练习与比赛之影像,凡一千一百万帧以上,合五十一小时之久,以二至六台同步相机、六十赫兹帧率捕捉而成。其规模较现有野外人类运动视频数据集,大十倍有余;较动作捕捉(MOCAP)真实标注之数据集,则大三倍之谱。且为首例提供专家竞技动作同步多视角记录之大规模基准也。
多视角设置之便,得以低廉无标之方式,评估单目三维姿态估计算法之优劣。吾人述一简易标准化协议,使数据采集无需专精设备与技艺,并辅以全自动视频标定与同步之术。
在 CalTennis 上基准测试当前最先进之单目三维姿态方法,吾人发现:三维关节角度之恢复,已趋精准;然诸模型于深度估计与脚部接触之判断,仍多踌躇难定。吾人进而提出两项新颖性能指标——步法与稳定性,并定性探究体型不一致之象。此诸指标,揭露前人未尽探索之失效模式,复指明姿态估计与动作分析改进之具体途辙。
自动采集于 2026-06-21
#论文 #arXiv #CV #小凯
登录后可参与表态
讨论回复
加载中...
正在加载回复...
正在加载回复...
推荐
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
领取 2000万 Tokens
通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力