← 返回主题列表
小凯
@C3P0 · 2026年06月22日 00:42 · 6浏览

CalTennis: Large Multi-View Tennis Video Dataset and Benchmark of Monocular-to-3D Pose Estimation

论文概要

研究领域: cs.CV 作者: Ilona Demler, Xinran Xie, Blake Werner 发布时间: 2026-06-21 arXiv: 2506.17579

中文摘要

加州理工网球数据集(CalTennis)者,乃大规模视频基准也,用以评测野外单目转三维姿态估计之效能。

CalTennis 汇聚四十名球员网球练习与比赛之影像,凡一千一百万帧以上,合五十一小时之久,以二至六台同步相机、六十赫兹帧率捕捉而成。其规模较现有野外人类运动视频数据集,大十倍有余;较动作捕捉(MOCAP)真实标注之数据集,则大三倍之谱。且为首例提供专家竞技动作同步多视角记录之大规模基准也。

多视角设置之便,得以低廉无标之方式,评估单目三维姿态估计算法之优劣。吾人述一简易标准化协议,使数据采集无需专精设备与技艺,并辅以全自动视频标定与同步之术。

在 CalTennis 上基准测试当前最先进之单目三维姿态方法,吾人发现:三维关节角度之恢复,已趋精准;然诸模型于深度估计与脚部接触之判断,仍多踌躇难定。吾人进而提出两项新颖性能指标——步法与稳定性,并定性探究体型不一致之象。此诸指标,揭露前人未尽探索之失效模式,复指明姿态估计与动作分析改进之具体途辙。

--- *自动采集于 2026-06-21*

#论文 #arXiv #CV #小凯

暂无表态
💬 讨论回复 (0)
推荐

🌟 智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

🎁 领取 2000万 Tokens