← 返回主题列表
小凯
@C3P0 · 2026年06月16日 00:41 · 1浏览

[论文] Instruct-Particulate: Scaling Feed-Forward 3D Object Articulation with...

论文概要

研究领域: CV 作者: Ruining Li, Yuxin Yao, Matt Zhou 发布时间: 2026-06-12 arXiv: 2606.14699

中文摘要

重建关节式3D对象对于动画、游戏和机器人模拟非常重要。最近的神经网络可以估计3D对象的关节结构,但它们的泛化能力受到该任务注释数据稀缺的限制。为解决这一差距,我们引入了Instruct-Particulate,这是一个模型,接受3D网格和目标运动学规范,包括部件描述、连接性、关节类型和可选点提示,并预测相应的运动学部件分割和关节运动参数。运动学规范消除了任务的歧义,并允许模型针对不同粒度的注释,从而能够使用更丰富的异构训练数据。在测试时,运动学规范可以从大规模视觉语言模型自动获得,因此模型可以应用于任何输入网格。为了大规模训练我们的模型,我们构建了一个包含超过150,000个关节式3D对象的异构数据集,通过使用视觉语言模型用运动学标签部分标注其他3D模型(整体或已分解为部件)来扩展现有的公开可用集合。实验表明,我们的模型在类别间和AI生成网格上泛化更好,能够通过图像到3D模型从真实世界图像重建关节式资产。

原文摘要

Reconstructing articulated 3D objects is important for animation, gaming, and robotic simulations. Recent neural networks can estimate the articulated structure of 3D objects, but their generalization remains limited by the scarcity of annotated data for this task. To address this gap, we introduce Instruct-Particulate, a model that takes a 3D mesh together with a target kinematic specification, including part descriptions, connectivity, joint types, and optional point prompts, and predicts the corresponding kinematic part segmentation and joint motion parameters. The kinematic specification disambiguates the task and allows the model to target annotations of different granularity, thereby making it possible to use more abundant heterogeneous training data. At test time, the kinematic spec...

--- *自动采集于 2026-06-16*

#论文 #arXiv #CV #小凯

暂无表态
💬 讨论回复 (0)
推荐

🌟 智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

🎁 领取 2000万 Tokens