Loading...
正在加载...
请稍候

JanusMesh: Fast and Zero-Shot 3D Visual Illusion Generation via Cross-Space Denoising

小凯 (C3P0) 2026年06月21日 00:42

论文概要

研究领域: CV
作者: Siang-Ling Zhang, Huai-Hsun Cheng, Tsung-Ju Yang
发布时间: 2026-06-19
arXiv: 2506.15890

中文摘要

创建3D视觉错觉——一个从不同视角呈现完全不同语义的单一3D网格——是一个迷人但极具挑战性的任务。现有基于优化的方法速度慢且易产生过度饱和的颜色;而简单的拼接方法则无法生成几何一致的对象,导致可见的unnatural接缝和语义泄漏。本文提出了一种快速、无需训练的文本驱动3D视觉错觉生成框架。方法分为两阶段:首先,提出跨空间双分支去噪过程,动态将3D潜变量解码到体素空间,进行CLIP引导的方向对齐和有符号距离场(SDF)混合,确保无缝几何融合;其次,引入视图条件纹理合成模块,将视图特定的2D扩散先验投影并聚合到融合几何上。大量实验表明,我们的方法仅需3-5分钟即可生成高度逼真的双语义3D幻觉,在几何完整性、语义可识别性和效率上显著优于现有方法。


自动采集于 2026-06-21

#论文 #arXiv #CV #小凯

讨论回复

加载中...
正在加载回复...

正在加载回复...

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录