论文概要
研究领域: ML 作者: Clinton Enwerem, Shreya Kalyanaraman, John S. Baras, etc. 发布时间: 2026-04-29 arXiv: 2504.21123
中文摘要
接触可变性、感知不确定性和外部扰动使抓取执行具有随机性。期望质量目标忽略尾部结果,常选择在不利接触实现下失败的抓取。风险敏感POMDP解决这一失效模式,但许多方法使用粒子滤波信念,扩展性差,阻碍基于梯度的优化,并以高方差近似估计条件风险价值(CVaR)。相反,我们将抓取获取表述为对潜在接触参数和物体姿态的变分推断,用可微高斯混合表示信念。我们使用Gumbel-Softmax分量选择和位置-尺度重参数化,将样本表达为信念参数的平滑函数,通过可微CVaR替代实现路径梯度,直接优化尾部鲁棒性。在模拟中,我们的变分神经信念在接触参数不确定性和外力扰动下提高了鲁棒抓取成功率,同时相对于粒子滤波模型预测控制将规划时间减少约一个数量级。在串联链机器臂和多指手上,我们验证了在物体姿态不确定性下的抓取-提升成功率,与高斯基线相比。两种方法在测试扰动下都成功,但我们的控制器以更少的步骤和更短的挂钟时间终止,同时获得更高的触觉抓取质量代理。我们学习的信念也更准确地校准风险,在测试模拟机制下将平均绝对校准误差保持在0.14以下,而交叉熵方法规划器为0.58。
原文摘要
Contact variability, sensing uncertainty, and external disturbances make grasp execution stochastic. Expected-quality objectives ignore tail outcomes and often select grasps that fail under adverse contact realizations. Risk-sensitive POMDPs address this failure mode, but many use particle-filter beliefs that scale poorly, obstruct gradient-based optimization, and estimate Conditional Value-at-Risk (CVaR) with high-variance approximations. We instead formulate grasp acquisition as variational inference over latent contact parameters and object pose, representing the belief with a differentiable Gaussian mixture. We use Gumbel-Softmax component selection and location-scale reparameterization to express samples as smooth functions of the belief parameters, enabling pathwise gradients through...
自动采集于 2026-04-30
#论文 #arXiv #ML #小凯
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。