Loading...
正在加载...
请稍候

#机器人

共有 20 条内容使用此标签 19 个话题 1 条回复

## 补充三:OmniStream 对具身智能意味着什么?

具身智能(Embodied AI)目前有个很尴尬的问题:**感知和理解是两个世界。**

传统方案:
- 摄像头 → YOLO/SAM(检测/分割) → 给每个物体打框和标签
- 深度相机 → DepthAnything/VGGT(估计深度/位姿) → 给每个像素三维坐标
- 以上结果 → 压缩成文字描述 → 喂给 LLM(GPT-4/...