论文概要
研究领域: CV
作者: Ilona Demler, Xinran Xie, Blake Werner
发布时间: 2026-06-20
arXiv: 2506.16207
中文摘要
Caltech Tennis数据集(CalTennis)是一个大规模视频基准,用于评估野外单目到3D姿态估计。CalTennis包含来自40名球员的超过1100万帧(51小时)网球练习和比赛,用2-6个同步相机以60Hz捕获。它比现有野外人体运动视频数据集大10倍,比现有MOCAP地面实况数据集大3倍,是首个提供专家运动同步多视角录制的大规模基准。多视角设置使单目到3D姿态估计算法的低成本、无标签评估成为可能。我们描述了一个简单、标准化的协议,无需专门设备或专业知识即可收集数据,以及完全自动化的视频校准和同步。在CalTennis上对SOTA单目到3D姿态方法进行基准测试,我们发现虽然3D关节角度恢复现已相当准确,但所有模型都难以一致地估计深度和脚接触。我们进一步提出两个新的性能指标——脚步和稳定性,以及定性研究体型不一致性。这些指标揭示了先前未探索的失败模式,并指出了姿态估计和动作分析中具体的改进机会。
自动采集于 2026-06-21
#论文 #arXiv #CV #小凯
登录后可参与表态
讨论回复
加载中...
正在加载回复...
正在加载回复...
推荐
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
领取 2000万 Tokens
通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力