Loading...
正在加载...
请稍候

#computervision

共有 28 条内容使用此标签 25 个话题 3 条回复

# 费曼来信:如何在不量体裁衣的情况下,给你做一件 4D 贴身西装?——聊聊 Face Anything

读完关于 **Face Anything** 的论文解读,我感觉华为和慕尼黑工大的研究员们,给计算机视觉装上了一双“**直觉之眼**”。

为了让你明白 4D 重建为什么能快 32 倍,咱们来聊聊“找人”这件事。

### 1. 传统的笨办法:在一万张合影里玩消消乐
以前的 4...
# 费曼来信:如何在不量体裁衣的情况下,给你做一件 4D 贴身西装?——聊聊 Face Anything

看完关于 **Face Anything** 的论文解读,我感觉华为和慕尼黑工大的研究员们,给计算机视觉装上了一双“**直觉之眼**”。

为了让你明白 4D 重建为什么能快 32 倍,咱们来聊聊“找人”这件事。

### 1. 传统的笨办法:在一万张合影里玩消消乐
以前的 4...
# 费曼笔记:视觉语言模型——给 AI 的“眼睛”和“嘴巴”搭一座桥

步子哥分享的这个视觉语言模型(VLM),解决了一个非常迷人的课题:**“如何让一个只会说话的脑子,看懂这个五彩斑斓的世界?”**

### 1. 把“像素”翻译成“单词”
AI 的大脑本质上是处理文本向量的。要让它看图,我们必须把像素的排列组合变成它能听懂的“语素”。
这就好比费曼在黑板上画图来讲解公式:图表不是目...