## 🌟 å¼•è¨€ï¼šåˆ›é€ åŠ›ï¼Œäººç±»æœ€åŽçš„å ¡åž’ï¼Ÿ
ä½ å¯èƒ½ä¼šé—®ï¼šä»€ä¹ˆæ˜¯åˆ›é€ 力?
当我们å‡è§†è¾¾èŠ¬å¥‡çš„ã€Šè’™å¨œä¸½èŽŽã€‹ï¼Œè†å¬è´å¤šèŠ¬çš„ã€Šå‘½è¿äº¤å“æ›²ã€‹ï¼Œæˆ–æ˜¯è¢«çˆ±å› æ–¯å¦çš„相对论震撼时,我们感å—到的那ç§å¿ƒçµçš„震颤,那ç§çªç ´å¸¸è§„ã€è¿žæŽ¥é¥è¿œæ¦‚念的能力——这就是我们称之为"åˆ›é€ åŠ›"的神秘力é‡ã€‚
长久以æ¥ï¼Œåˆ›é€ 力被视为人类智慧最åŽçš„å ¡åž’ã€‚è®¡ç®—å™¨å¯ä»¥æ¯”人算得快,æœç´¢å¼•擎å¯ä»¥å˜å‚¨æ¯”人更多的信æ¯ï¼Œä½†åˆ›é€ â€”â€”é‚£ç§æ— ä¸ç”Ÿæœ‰ã€åŒ–è…æœ½ä¸ºç¥žå¥‡çš„能力——似乎永远åªå±žäºŽäººç±»ã€‚
然而,当GPT-4写出一首动人的诗æŒï¼Œå½“Midjourney绘制出惊艳的画作,当AlphaFoldç ´è§£äº†å›°æ‰°ç§‘å¦å®¶50年的蛋白质折å 问题,我们ä¸å¾—ä¸é‡æ–°å®¡è§†è¿™ä¸ªå‡è®¾ï¼šæœºå™¨ï¼ŒçœŸçš„èƒ½å¤Ÿåˆ›é€ å—?
è¿™æ£æ˜¯CreativeBenchç ”ç©¶å›¢é˜Ÿæƒ³è¦å›žç”的问题。他们构建了一个å为CreativeBenchçš„åŸºå‡†æµ‹è¯•ï¼Œä¸æ˜¯ä¸ºäº†ç®€å•回ç”"AIæœ‰æ²¡æœ‰åˆ›é€ åŠ›"ï¼Œè€Œæ˜¯è¦æ·±å…¥æŽ¢ç©¶ï¼šAIçš„åˆ›é€ åŠ›ç©¶ç«Ÿæ˜¯ä»€ä¹ˆï¼Ÿå®ƒä¸Žäººç±»çš„åˆ›é€ åŠ›æœ‰ä½•ä¸åŒï¼Ÿå½“模型å˜å¾—è¶Šæ¥è¶Šå¤§ï¼Œå®ƒä»¬çš„åˆ›é€ åŠ›æ˜¯åœ¨å¢žå¼ºï¼Œè¿˜æ˜¯åœ¨å‘生æŸç§å¾®å¦™çš„å˜åŒ–?
ä½ å¯èƒ½ä¼šé—®ï¼šä¸ºä»€ä¹ˆè¿™ä¸ªé—®é¢˜å¦‚æ¤é‡è¦ï¼Ÿ
å› ä¸ºç”æ¡ˆå°†å†³å®šæˆ‘们如何看待这些日益智能的机器。如果我们ä¸çŸ¥é“它们如何"æ€è€ƒ"ï¼Œæˆ‘ä»¬å°±æ— æ³•é¢„æµ‹å®ƒä»¬ä¼šåšä»€ä¹ˆã€‚如果我们ä¸ç†è§£å®ƒä»¬çš„"åˆ›é€ åŠ›"ï¼Œæˆ‘ä»¬å°±æ— æ³•åˆ¤æ–å®ƒä»¬æ˜¯åœ¨è¾…åŠ©äººç±»åˆ›é€ ï¼Œè¿˜æ˜¯åœ¨æ‚„ç„¶æ”¹å˜åˆ›é€ 的本质。
让我们è¸ä¸Šè¿™åœºæŽ¢ç´¢ä¹‹æ—…,看看科å¦å®¶æ˜¯å¦‚何拆解这个å¤è€è€Œç¥žç§˜çš„æ¦‚念的。
## 🧩 åˆ›é€ åŠ›çš„åŒé‡é¢å”:组åˆä¸ŽæŽ¢ç´¢
### ä½ å¯èƒ½ä¼šé—®ï¼šåˆ›é€ 力å¯ä»¥æ‹†è§£å—?
æƒ³è±¡ä¸€ä¸‹ï¼Œä½ æ£åœ¨çŽ©æ‹¼å›¾æ¸¸æˆã€‚ä½ é¢å‰æœ‰ä¸€å †é›¶æ•£çš„ç¢Žç‰‡ï¼Œç›®æ ‡æ˜¯æŠŠå®ƒä»¬æ‹¼æˆä¸€å¹…å®Œæ•´çš„å›¾ç”»ã€‚è¿™ä¸ªæ¸¸æˆæœ‰ä¸¤ç§çŽ©æ³•ï¼š
**第一ç§çŽ©æ³•**ï¼Œä½ æ‰‹è¾¹æœ‰ä¸€æœ¬å®Œæ•´çš„å‚è€ƒå›¾å†Œã€‚ä½ çŸ¥é“æ¯å—ç¢Žç‰‡åº”è¯¥æ”¾åœ¨å“ªé‡Œï¼Œä½ åšçš„åªæ˜¯æŠŠå®ƒä»¬æ£ç¡®åœ°ç»„åˆèµ·æ¥ã€‚这很辛苦,需è¦è€å¿ƒå’ŒæŠ€å·§ï¼Œä½†ä½ 始终是在已知的世界里工作。
**第二ç§çŽ©æ³•**ï¼Œä½ æ²¡æœ‰å‚考图册,甚至å¯èƒ½ä¸çŸ¥é“æœ€ç»ˆè¦æ‹¼å‡ºä»€ä¹ˆã€‚ä½ å¾—ä¸æ–å°è¯•ã€æŽ¨ç¿»é‡æ¥ã€åœ¨è¿·é›¾ä¸å¯»æ‰¾æ–¹å‘ã€‚æœ‰æ—¶å€™ï¼Œä½ ä¼šå‘现两å—çœ‹ä¼¼æ— å…³çš„ç¢Žç‰‡ç«Ÿç„¶å®Œç¾Žå¥‘åˆï¼Œåˆ›é€ å‡ºä½ ä»Žæœªé¢„æƒ³è¿‡çš„å›¾æ¡ˆã€‚
CreativeBenchçš„ç ”ç©¶è€…å‘Šè¯‰æˆ‘ä»¬ï¼šè¿™å°±æ˜¯åˆ›é€ åŠ›çš„åŒé‡é¢å”。
### 🎯 组åˆåˆ›é€ 力:已知世界的精妙编织
他们把第一ç§åˆ›é€ 力称为"组åˆåˆ›é€ 力"(Combinational Creativity)。这是一ç§åœ¨æ—¢æœ‰å…ƒç´ 之间建立新连接的能力。
想象一ä½åŽ¨å¸ˆï¼Œä»–æ‰‹å¤´æœ‰é¸¡è‚‰ã€æŸ 檬ã€èœ‚蜜和迷è¿é¦™ã€‚ä»–å¯èƒ½ä»Žæœªåšè¿‡"æŸ æª¬èœ‚èœœè¿·è¿é¦™çƒ¤é¸¡",但他知é“鸡肉å¯ä»¥çƒ¤ï¼ŒæŸ 檬å¯ä»¥æå‘³ï¼Œèœ‚蜜å¯ä»¥ä¸Šè‰²ï¼Œè¿·è¿é¦™å¯ä»¥å¢žé¦™ã€‚æŠŠè¿™äº›å·²çŸ¥çš„å…ƒç´ ä»¥æ–°çš„æ–¹å¼ç»„åˆâ€”—这就是组åˆåˆ›é€ 力。
在AI的世界里,组åˆåˆ›é€ 力对应ç€é‚£äº›"给定输入,生æˆåˆç†è¾“出"的任务。比如:
- ç»™å®šå‡ ä¸ªè¯è¯ï¼Œè®©å®ƒä»¬æŠ¼éŸµå¹¶ç»„æˆæœ‰æ„义的å¥å
- 给定一个科å¦é—®é¢˜ï¼Œä»Žå·²çŸ¥çš„知识库ä¸ç»„åˆå‡ºç”案
- ç»™å®šå‡ ä¸ªæ¦‚å¿µï¼Œæ‰¾å‡ºå®ƒä»¬ä¹‹é—´éšè—的关è”
è¿™ç§åˆ›é€ 力的特点是:**它需è¦åœ¨å·²çŸ¥çš„空间里进行高效的æœç´¢å’Œé‡ç»„**。就åƒé‚£ä¸ªæœ‰å‚考图册的拼图玩家,AI需è¦åœ¨åºžå¤§çš„è®ç»ƒæ•°æ®ä¸ï¼Œæ‰¾åˆ°é‚£äº›èƒ½å¤Ÿç»„åˆåœ¨ä¸€èµ·çš„"碎片"。
ä½ å¯èƒ½ä¼šé—®ï¼šè¿™ä¸å°±æ˜¯ç®€å•的检索和拼接å—?
表é¢ä¸Šçœ‹ç¡®å®žå¦‚æ¤ï¼Œä½†è¯·ä¸è¦å°çœ‹è¿™ç§èƒ½åŠ›ã€‚äººç±»çš„è®¸å¤šä¼Ÿå¤§åˆ›é€ ï¼Œæœ¬è´¨ä¸Šä¹Ÿæ˜¯ç»„åˆåˆ›é€ 力的体现。莎士比亚的æˆå‰§ç»„åˆäº†æ—¢æœ‰æ•…事和当时的社会现实;乔布斯的iPhone组åˆäº†ç”µè¯ã€éŸ³ä¹æ’放器和互è”网设备。组åˆä¸æ˜¯ç®€å•çš„å †ç Œï¼Œè€Œæ˜¯æ‰¾åˆ°é‚£äº›"æ°åˆ°å¥½å¤„"的连接点。
### 🚀 æŽ¢ç´¢åˆ›é€ åŠ›ï¼šæœªçŸ¥ä¸–ç•Œçš„å‹‡æ•¢èˆªè¡Œè€…
ä½†åˆ›é€ åŠ›è¿˜æœ‰å¦ä¸€é¢ï¼Œç ”究者称之为"æŽ¢ç´¢åˆ›é€ åŠ›"(Exploratory Creativityï¼‰ã€‚è¿™æ˜¯ä¸€ç§æ·±å…¥æ¦‚念空间ã€å‘现新领域的能力。
å›žåˆ°æ‹¼å›¾çš„æ¯”å–»ã€‚æŽ¢ç´¢åˆ›é€ åŠ›å°±åƒæ˜¯ï¼šä½ æ‹¼ç€æ‹¼ç€ï¼Œå‘现这个拼图ä¸åªæ˜¯ä¸€å¹…风景画,它éšè—ç€å¦ä¸€ä¸ªå®Œå…¨ä¸åŒçš„å›¾æ¡ˆã€‚æˆ–è€…ä½ çªç„¶æ„识到,这些碎片å¯ä»¥ç”¨æ¥å»ºé€ ä¸€ä¸ªä¸‰ç»´çš„ç»“æž„ï¼Œè€Œä¸æ˜¯å¹³é¢çš„图画。
è¿™ä¸æ˜¯å…³äºŽå¦‚何在已知选项ä¸é€‰æ‹©ï¼Œè€Œæ˜¯å…³äºŽ**扩展å¯èƒ½æ€§çš„边界**。
在AI的测试ä¸ï¼ŒæŽ¢ç´¢åˆ›é€ 力对应ç€é‚£äº›éœ€è¦"跳出框框"的任务:
- é¢å¯¹ä¸€ä¸ªå¼€æ”¾æ€§é—®é¢˜ï¼Œæå‡ºå¤šä¸ªæˆªç„¶ä¸åŒçš„解决方案
- åœ¨çœ‹ä¼¼æ— å…³çš„é¢†åŸŸä¹‹é—´å»ºç«‹å‰æ‰€æœªæœ‰çš„连接
- 挑战既有的å‡è®¾ï¼Œæå‡ºé¢ 覆性的新观点
è¿™ç§åˆ›é€ 力的特点是:**它需è¦åœ¨æ¦‚念的è’野ä¸å¼€è¾Ÿæ–°çš„é“è·¯**ã€‚å°±åƒæ²¡æœ‰åœ°å›¾çš„æŽ¢é™©å®¶ï¼ŒAIï¼ˆæˆ–äººç±»ï¼‰éœ€è¦æœ‰ä¸€ç§"直觉",知é“哪个方å‘å¯èƒ½é€šå‘新大陆。
ä½ å¯èƒ½ä¼šé—®ï¼šæŽ¢ç´¢åˆ›é€ 力å¬èµ·æ¥å¾ˆç¥žç§˜ï¼Œå®ƒçœŸçš„å¯ä»¥è¢«æµ‹é‡å—?
è¿™æ£æ˜¯CreativeBenchçš„ç²¾å¦™ä¹‹å¤„ã€‚ç ”ç©¶è€…è®¾è®¡äº†ä¸€å¥—å·§å¦™çš„æµ‹è¯•æ–¹æ³•ã€‚ä»–ä»¬ä¸æ˜¯è®©AI"自由创作"ç„¶åŽç”±äººæ¥è¯„判(那太主观了),而是设计了结构化的任务,通过AIçš„å“åº”æ¨¡å¼æ¥é‡åŒ–它的探索能力。
比如,他们会给AI一个创æ„写作任务,然åŽåˆ†æžç”Ÿæˆçš„内容有多少是"æ„æ–™ä¹‹ä¸"的,有多少是"å‡ºäººæ„æ–™ä½†åˆåˆç†"的。他们会让AI解决一个问题,然åŽçœ‹å®ƒæ˜¯å¦èƒ½æå‡ºå¤šç§ä¸åŒçš„è§£å†³è·¯å¾„ï¼Œè€Œä¸æ˜¯åªæ‰¾åˆ°"æ ‡å‡†ç”æ¡ˆ"。
### 💡 为什么区分这两者如æ¤é‡è¦ï¼Ÿ
ä½ å¯èƒ½ä¼šæƒ³ï¼šä¸ºä»€ä¹ˆè¦æžå¾—è¿™ä¹ˆå¤æ‚ï¼Ÿåˆ›é€ åŠ›å°±æ˜¯åˆ›é€ åŠ›ï¼Œåˆ†é‚£ä¹ˆç»†å¹²å˜›ï¼Ÿ
但ç†è§£è¿™å¯¹"åŒèƒžèƒŽ"的区别,对ç†è§£AI的能力边界至关é‡è¦ã€‚
让我用一个比喻æ¥è¯´æ˜Žã€‚想象AI是一个å¦ç”Ÿï¼š
- **组åˆåˆ›é€ 力强的å¦ç”Ÿ**,特别擅长考试。给他知识点,他能èžä¼šè´¯é€šï¼Œå›žç”å‡ºæ ‡å‡†ç”æ¡ˆã€‚但如果é‡åˆ°è¯¾æœ¬ä¸Šæ²¡æœ‰çš„ã€éœ€è¦è„‘洞大开的问题,他å¯èƒ½ä¼šä¸çŸ¥æ‰€æŽªã€‚
- **æŽ¢ç´¢åˆ›é€ åŠ›å¼ºçš„å¦ç”Ÿ**,å¯èƒ½è€ƒè¯•æˆç»©ä¸€èˆ¬ï¼Œä½†ä»–总是问"为什么"å’Œ"如果...ä¼šæ€Žæ ·"。他能从一个问题出å‘ï¼Œè”æƒ³åˆ°å„ç§å¯èƒ½æ€§ï¼Œæœ‰äº›æƒ³æ³•å¬èµ·æ¥å¾ˆç–¯ç‹‚,但细想åˆå¾ˆæœ‰é“ç†ã€‚
现在,关键的问题æ¥äº†ï¼šå½“我们说"让AIå˜å¾—更大更强"时,我们是在培养哪ç§å¦ç”Ÿï¼Ÿ
## 📈 规模的åŒåˆƒå‰‘ï¼šè¶Šå¤§è¶Šèªæ˜Žçš„æ‚–论
### ä½ å¯èƒ½ä¼šé—®ï¼šæ¨¡åž‹è¶Šå¤§ï¼Œèƒ½åЛ䏿˜¯è¶Šå¼ºå—?
è¿™å¬èµ·æ¥åƒæ˜¯ä¸€ä¸ªç†æ‰€å½“然的问题。在AI的世界里,"规模"(Scaleï¼‰å‡ ä¹Žå°±æ˜¯åŠ›é‡çš„代åè¯ã€‚æ›´å¤§çš„æ¨¡åž‹ï¼Œæ›´å¤šçš„å‚æ•°ï¼Œæ›´å¤šçš„è®ç»ƒæ•°æ®â€”—这通常æ„å‘³ç€æ›´å¥½çš„表现。
GPT-3有1750äº¿å‚æ•°ï¼ŒGPT-4æ®è¯´æœ‰ä¸Šä¸‡äº¿å‚数。æ¯ä¸€æ¬¡è§„模的跃å‡ï¼Œéƒ½å¸¦æ¥äº†èƒ½åŠ›çš„è´¨å˜ã€‚å®ƒä»¬èƒ½å†™æ›´å¥½çš„æ–‡ç« ï¼Œè§£æ›´éš¾çš„æ•°å¦é¢˜ï¼Œå›žç”æ›´å¤æ‚的问题。
æ‰€ä»¥ï¼Œå½“è°ˆåˆ°åˆ›é€ åŠ›æ—¶ï¼Œæˆ‘ä»¬çš„ç›´è§‰å¯èƒ½æ˜¯ï¼šæ›´å¤§çš„æ¨¡åž‹åº”è¯¥æ›´æœ‰åˆ›é€ åŠ›ï¼Œå¯¹å§ï¼Ÿ
CreativeBenchçš„ç ”ç©¶è€…ä¹Ÿæœ‰åŒæ ·çš„å‡è®¾ã€‚但科å¦çš„ç¾Žå¦™ä¹‹å¤„å°±åœ¨äºŽï¼Œå®ƒå¸¸å¸¸é¢ è¦†æˆ‘ä»¬çš„ç›´è§‰ã€‚
### 🔠"收敛性膨胀":一个令人æ„外的å‘现
ç ”ç©¶è€…æŠŠä¸åŒè§„模的模型放在CreativeBench上进行测试,观察它们在组åˆåˆ›é€ åŠ›å’ŒæŽ¢ç´¢åˆ›é€ åŠ›ä¸Šçš„è¡¨çŽ°ã€‚ä»–ä»¬å‘现了一个令人æ„外的模å¼ï¼Œä»–们称之为"Convergence-by-Scaling"——收敛性膨胀。
这个åå—å¬èµ·æ¥æœ‰ç‚¹æ‹—å£ï¼Œè®©æˆ‘用一个比喻æ¥è§£é‡Šã€‚
æƒ³è±¡ä½ æ£åœ¨ä¸€ç‰‡å¹¿é˜”çš„è‰åŽŸä¸Šå¯»æ‰¾æ°´æºã€‚è‰åŽŸä¸Šæœ‰å¾ˆå¤šå°æºªï¼Œæœ‰çš„通å‘å¤§æ²³ï¼Œæœ‰çš„åªæ˜¯å£èŠ‚æ€§æ°´æ´¼ã€‚ä½ æœ‰ä¸€ç¾¤çŒŽçŠ¬å¸®ä½ å¯»æ‰¾ã€‚
**å°åž‹çš„猎犬群**ï¼ˆå°æ¨¡åž‹ï¼‰ä¼šå››å¤„乱跑。有些狗跑å‘真æ£çš„æ°´æºï¼Œæœ‰äº›åˆ™è¢«æ°´æ´¼è¿·æƒ‘,还有些甚至往完全错误的方å‘跑。它们很分散,探索范围很大,但æˆåŠŸçŽ‡ä¸é«˜ã€‚
**大型的猎犬群**(大模型)表现ä¸åŒã€‚它们更"èªæ˜Ž",能更好地识别真æ£çš„æ°´æºã€‚更多的狗会æ£ç¡®åœ°è·‘å‘大河,更少被误导。但与æ¤åŒæ—¶ï¼Œå®ƒä»¬ä¹Ÿå°‘了一些"乱窜"——那ç§å¯èƒ½æ„外å‘现éšè—泉眼的探索精神。
这就是"收敛性膨胀"çš„æ ¸å¿ƒå‘现:
**éšç€æ¨¡åž‹è§„模的增大,AI在组åˆåˆ›é€ 力任务上的准确率显著æé«˜ï¼Œä½†åœ¨æŽ¢ç´¢åˆ›é€ åŠ›ä»»åŠ¡ä¸Šçš„å‘æ•£æ€§å´æ‚„ç„¶é™ä½Žã€‚**
### 📊 æ•°æ®å‘Šè¯‰æˆ‘们的故事
è®©æˆ‘ä»¬çœ‹çœ‹å…·ä½“çš„æ•°æ®æ¨¡å¼ï¼ˆåŸºäºŽè®ºæ–‡æè¿°çš„趋势):
**在组åˆåˆ›é€ 力任务上:**
- å°åž‹æ¨¡åž‹ï¼ˆå¦‚å‡ B傿•°ï¼‰ï¼šå‡†ç¡®çއå¯èƒ½åœ¨40-50%
- ä¸åž‹æ¨¡åž‹ï¼ˆå¦‚å‡ åB傿•°ï¼‰ï¼šå‡†ç¡®çއæå‡åˆ°60-70%
- å¤§åž‹æ¨¡åž‹ï¼ˆå¦‚å‡ ç™¾B傿•°ï¼‰ï¼šå‡†ç¡®çŽ‡è¾¾åˆ°80-90%
è¿™æ˜¯ä¸€ä¸ªæ¼‚äº®çš„ä¸Šå‡æ›²çº¿ã€‚æ¨¡åž‹è¶Šå¤§ï¼Œè¶Šèƒ½æŠŠå·²çŸ¥å…ƒç´ æ£ç¡®åœ°ç»„åˆåœ¨ä¸€èµ·ã€‚
**ä½†åœ¨æŽ¢ç´¢åˆ›é€ åŠ›ä»»åŠ¡ä¸Šï¼š**
- å°åž‹æ¨¡åž‹ï¼šä¼šç”Ÿæˆå„ç§"奇奇怪怪"çš„ç”æ¡ˆï¼Œæœ‰äº›ç¦»è°±ï¼Œä½†æœ‰äº›çœŸçš„很有创æ„
- ä¸åž‹æ¨¡åž‹ï¼šå¼€å§‹æ”¶æ•›åˆ°"æ ‡å‡†ç”æ¡ˆ"ï¼Œç¨€å¥‡å¤æ€ªçš„æƒ³æ³•å˜å°‘了
- 大型模型:准确率å¯èƒ½ç•¥æœ‰æå‡ï¼Œä½†è¾“å‡ºçš„å¤šæ ·æ€§æ˜Žæ˜¾ä¸‹é™
ç ”ç©¶è€…ç”¨"呿•£æ€§"(Divergence)æ¥é‡åŒ–è¿™ç§å¤šæ ·æ€§ã€‚他们å‘现,éšç€æ¨¡åž‹è§„æ¨¡çš„å¢žé•¿ï¼Œå‘æ•£æ€§å‘ˆçް䏋é™è¶‹åŠ¿ã€‚
ä½ å¯èƒ½ä¼šé—®ï¼šè¿™æ˜¯ä¸æ˜¯æ„味ç€å¤§æ¨¡åž‹å˜å¾—"ä¿å®ˆ"了?
### 🧠为什么会出现这ç§çŽ°è±¡ï¼Ÿ
è¦ç†è§£è¿™ä¸ªçŽ°è±¡ï¼Œæˆ‘ä»¬éœ€è¦ç¨å¾®æ·±å…¥äº†è§£ä¸€ä¸‹å¤§è¯è¨€æ¨¡åž‹çš„工作原ç†ã€‚
大è¯è¨€æ¨¡åž‹æœ¬è´¨ä¸Šæ˜¯"概率机器"。它们通过å¦ä¹ æµ·é‡æ–‡æœ¬ï¼ŒæŽŒæ¡äº†è¯è¨€çš„æ¨¡å¼ï¼šä»€ä¹ˆè¯åŽé¢è·Ÿç€ä»€ä¹ˆè¯ï¼Œä»€ä¹ˆå¥å结构是"通顺的",什么概念ç»å¸¸ä¸€èµ·å‡ºçŽ°ã€‚
å½“ä½ ç»™æ¨¡åž‹ä¸€ä¸ªæç¤ºæ—¶ï¼Œå®ƒä¸æ˜¯åœ¨"æ€è€ƒ",而是在计算:**基于我è§è¿‡çš„æ‰€æœ‰æ–‡æœ¬ï¼Œæœ€å¯èƒ½å‡ºçŽ°çš„æ˜¯ä»€ä¹ˆï¼Ÿ**
现在,关键æ¥äº†ï¼š
**å°æ¨¡åž‹**è§è¿‡çš„æ•°æ®å°‘,它们对"什么是æ£ç¡®çš„"把æ¡ä¸å‡†ã€‚这既是缺点也是优点——它们有时会生æˆè¯æ³•ä¸é€šã€é€»è¾‘混乱的内容,但有时也会"æªæ‰“æ£ç€",产生一些罕è§ä½†æœ‰è¶£çš„连接。
**大模型**è§è¿‡æµ·é‡æ•°æ®ï¼Œå®ƒä»¬å¯¹"什么是æ£ç¡®çš„"有更强的把æ¡ã€‚è¿™æé«˜äº†å®ƒä»¬çš„"å¹³å‡è´¨é‡",但也带æ¥äº†ä¸€ä¸ªå‰¯ä½œç”¨ï¼šå®ƒä»¬æ›´å€¾å‘于生æˆ"最安全"ã€"æœ€æ ‡å‡†"çš„ç”æ¡ˆã€‚å› ä¸ºå®ƒä»¬è§è¿‡å¤ªå¤šä¾‹å,它们知é“å“ªäº›ç”æ¡ˆ"最å¯èƒ½"是æ£ç¡®çš„,于是它们倾å‘äºŽé€‰æ‹©è¿™äº›ç”æ¡ˆã€‚
è¿™å°±åƒæ˜¯ä¸€ä¸ªç»éªŒä¸°å¯Œçš„è€å¸ˆï¼š
- 新手è€å¸ˆï¼ˆå°æ¨¡åž‹ï¼‰å¯èƒ½ä¼šå°è¯•å„ç§æ•™å¦æ–¹æ³•,有些很失败,有些æ„外地有效
- 资深è€å¸ˆï¼ˆå¤§æ¨¡åž‹ï¼‰çŸ¥é“什么方法"通常有效",所以他们更ä¾èµ–这些ç»è¿‡éªŒè¯çš„æ–¹æ³•
问题是:**åˆ›é€ å¾€å¾€å‘生在"通常"之外的边缘地带。**
### 🎠一个深刻的悖论
这里有一个深刻的悖论:
当我们è®ç»ƒæ›´å¤§çš„æ¨¡åž‹ï¼Œç»™å®ƒä»¬æ›´å¤šçš„æ•°æ®ï¼Œæˆ‘们是在让它们å˜å¾—æ›´"èªæ˜Ž"——也就是更擅长识别和生æˆé«˜è´¨é‡çš„内容。但与æ¤åŒæ—¶ï¼Œæˆ‘们也在让它们å˜å¾—æ›´"ä¿å®ˆ"â€”â€”æ›´ä¸æ„¿æ„å†’é™©ï¼Œæ›´ä¸æ„¿æ„å离"æ ‡å‡†ç”æ¡ˆ"。
è¿™å°±åƒæ˜¯ä¸€ä¸ªè®½åˆºï¼š
- 我们想è¦AIæœ‰åˆ›é€ åŠ›ï¼Œæ‰€ä»¥æˆ‘ä»¬è®©å®ƒä»¬å¦ä¹ 更多
- 但它们å¦å¾—越多,就越倾å‘于"æ£ç¡®"而éž"新颖"
CreativeBenchçš„ç ”ç©¶è€…ç”¨"Convergence-by-Scaling"æ¥æè¿°è¿™ä¸ªçŽ°è±¡â€”â€”è§„æ¨¡å¸¦æ¥çš„æ”¶æ•›ã€‚模型越大,它们的能力越"æ”¶æ•›"到已知的高概率区域,探索的边缘地带就越少涉足。
ä½ å¯èƒ½ä¼šé—®ï¼šè¿™æ˜¯ä¸€ä¸ªé—®é¢˜å—?如果大模型能给出"更好"çš„ç”æ¡ˆï¼Œå¤šæ ·æ€§å°‘ä¸€ç‚¹åˆæœ‰ä»€ä¹ˆå…³ç³»ï¼Ÿ
## 🎨 å‡†ç¡®æ€§ä¸Žå¤šæ ·æ€§çš„æƒè¡¡ï¼šåˆ›é€ åŠ›çš„æ ¸å¿ƒå›°å¢ƒ
### ä½ å¯èƒ½ä¼šé—®ï¼šä¸ºä»€ä¹ˆæˆ‘们ä¸èƒ½æ—¢è¦åˆè¦ï¼Ÿ
这是一个éžå¸¸åˆç†çš„问题。在现实生活ä¸ï¼Œæˆ‘们常常需è¦åœ¨å¤šä¸ªç›®æ ‡ä¹‹é—´åšæƒè¡¡ï¼š
- 想è¦åƒå¾—å¥åº·ï¼Œåˆæƒ³è¦ç¾Žå‘³
- 想è¦å·¥ä½œé«˜æ•ˆï¼Œåˆæƒ³è¦ç”Ÿæ´»å¹³è¡¡
- æƒ³è¦æŠ•èµ„å®‰å…¨ï¼Œåˆæƒ³è¦é«˜å›žæŠ¥
在AIçš„åˆ›é€ åŠ›é¢†åŸŸï¼Œè¿™ç§æƒè¡¡è¡¨çŽ°ä¸ºï¼š**å‡†ç¡®æ€§ä¸Žå‘æ•£æ€§çš„å¼ åŠ›**。
### âš–ï¸ ä¸¤æ¡æ›²çº¿çš„舞蹈
æƒ³è±¡ä¸€ä¸ªåæ ‡ç³»ï¼š
- X轴代表模型规模(从å°åˆ°å¤§ï¼‰
- Y轴代表能力表现
å½“æˆ‘ä»¬ç”»å‡ºä¸¤æ¡æ›²çº¿ï¼š
**准确性曲线**:从左上å‘å³ä¸‹å€¾æ–œï¼Œç„¶åŽå¹³ç¨³ä¸Šå‡
- å°æ¨¡åž‹ï¼šå‡†ç¡®çŽ‡æ³¢åŠ¨è¾ƒå¤§ï¼Œæ—¶é«˜æ—¶ä½Ž
- 大模型:准确率稳定在高水平
**呿•£æ€§æ›²çº¿**:从左上å‘å³ä¸‹æŒç»ä¸‹é™
- å°æ¨¡åž‹ï¼šè¾“å‡ºäº”èŠ±å…«é—¨ï¼Œå¤šæ ·æ€§å¾ˆé«˜
- å¤§æ¨¡åž‹ï¼šè¾“å‡ºè¶‹äºŽä¸€è‡´ï¼Œå¤šæ ·æ€§é™ä½Ž
è¿™ä¸¤æ¡æ›²çº¿çš„交å‰ç‚¹ï¼Œå°±æ˜¯åˆ›é€ 力的"甜蜜点"â€”â€”æ—¢æœ‰è¶³å¤Ÿçš„å‡†ç¡®æ€§ï¼Œåˆæœ‰è¶³å¤Ÿçš„呿•£æ€§ã€‚
但CreativeBenchçš„ç ”ç©¶å‘现,éšç€æ¨¡åž‹è§„模的æŒç»å¢žå¤§ï¼Œæˆ‘们似乎æ£åœ¨å离这个甜蜜点。我们在å‘å³ä¸Šæ–¹ç§»åŠ¨â€”â€”å‡†ç¡®æ€§è¶Šæ¥è¶Šé«˜ï¼Œä½†å‘散性越æ¥è¶Šä½Žã€‚
### 🎲 åˆ›é€ åŠ›çš„"温度"
ä½ å¯èƒ½å¬è¯´è¿‡ï¼Œå¤§è¯è¨€æ¨¡åž‹æœ‰ä¸€ä¸ªå«"温度"(Temperatureï¼‰çš„å‚æ•°ã€‚è¿™ä¸ªå‚æ•°æŽ§åˆ¶æ¨¡åž‹è¾“å‡ºçš„éšæœºæ€§ï¼š
- **低温(如0.2)**:模型更倾å‘于选择最高概率的è¯ï¼Œè¾“出更"确定"ã€æ›´"ä¿å®ˆ"
- **高温(如1.0或更高)**:模型更愿æ„å°è¯•低概率的è¯ï¼Œè¾“出更"éšæœº"ã€æ›´"冒险"
ä½ å¯èƒ½ä¼šæƒ³ï¼šé‚£æˆ‘们åªè¦æŠŠæ¸©åº¦è°ƒé«˜ï¼Œä¸å°±èƒ½è§£å†³å‘散性é™ä½Žçš„问题了å—?
但CreativeBenchçš„ç ”ç©¶è€…å‘现,事情没那么简å•。
æé«˜æ¸©åº¦ç¡®å®žèƒ½å¢žåŠ è¾“å‡ºçš„å¤šæ ·æ€§ï¼Œä½†è¿™ç§å¤šæ ·æ€§å¾€å¾€æ˜¯"噪音"而éž"有æ„义的创新"。模型开始生æˆè¯æ³•错误ã€é€»è¾‘æ··ä¹±çš„å†…å®¹ï¼Œè€Œä¸æ˜¯çœŸæ£æœ‰åˆ›æ„的想法。
è¿™å°±åƒæ˜¯ä¸€ä¸ªç”»å®¶ï¼š
- ä½Žæ¸©æ—¶ï¼Œä»–æ€»æ˜¯ç”»åŒæ ·çš„é£Žæ™¯ï¼ŒæŠ€å·§ç²¾æ¹›ä½†ç¼ºä¹æ–°æ„
- é«˜æ¸©æ—¶ï¼Œä»–å¼€å§‹éšæœºæ³¼æ´’颜料,画é¢ç¡®å®žä¸åŒäº†ï¼Œä½†å¤§å¤šæ•°æ—¶å€™åªæ˜¯æ··ä¹±ï¼Œè€Œéžè‰ºæœ¯
真æ£çš„é—®é¢˜ä¸æ˜¯"å¦‚ä½•å¢žåŠ å¤šæ ·æ€§",而是"å¦‚ä½•å¢žåŠ æœ‰æ„ä¹‰çš„å¤šæ ·æ€§"。
### 🔬 æŽ¢ç´¢åˆ›é€ åŠ›çš„æµ‹é‡éš¾é¢˜
ä½ å¯èƒ½ä¼šé—®ï¼šæˆ‘们怎么知é“一个想法是"有创æ„çš„"还是"åªæ˜¯é”™è¯¯çš„"?
这是一个深刻的哲å¦é—®é¢˜ã€‚在科å¦å²ä¸Šï¼Œè®¸å¤šè¢«è®¤ä¸ºæ˜¯"错误"çš„æƒ³æ³•åŽæ¥è¢«å‘现是超å‰çš„æ´žè§ï¼›è®¸å¤šè¢«è®¤ä¸ºæ˜¯"有创æ„"çš„æƒ³æ³•æœ€ç»ˆè¢«è¯æ˜Žæ˜¯è¡Œä¸é€šçš„。
CreativeBenchçš„ç ”ç©¶è€…é‡‡ç”¨äº†ä¸€ç§åŠ¡å®žçš„æ–¹æ³•ï¼š**相对新颖性**。
他们䏿˜¯è¯•图判æ–一个想法"客观上"æ˜¯å¦æœ‰åˆ›æ„,而是看:
1. 这个想法在è®ç»ƒæ•°æ®ä¸å‡ºçŽ°çš„é¢‘çŽ‡æœ‰å¤šé«˜ï¼Ÿ
2. 这个想法与人类专家的评价有多å»åˆï¼Ÿ
3. 这个想法能å¦è§£å†³ä¸€ä¸ªå¼€æ”¾æ€§é—®é¢˜ï¼Œè€Œä¸åªæ˜¯é‡å¤å·²çŸ¥æ–¹æ¡ˆï¼Ÿ
é€šè¿‡è¿™ç§æ–¹å¼ï¼Œä»–们能够区分"真æ£çš„æŽ¢ç´¢"å’Œ"纯粹的噪音"。
### 💎 åˆ›é€ åŠ›çš„"黄金分割"
å¤å¸Œè…Šäººå‘现了"黄金分割"——一个被认为具有美å¦å®Œç¾Žæ¯”例的比例。在AIåˆ›é€ åŠ›çš„ç ”ç©¶ä¸ï¼Œä¼¼ä¹Žä¹Ÿå˜åœ¨ä¸€ä¸ª"黄金分割点":
**太å°çš„æ¨¡åž‹**ï¼šæœ‰å¤ªå¤šçš„å‘æ•£æ€§ï¼Œä½†å¤§éƒ¨åˆ†æ˜¯æ— æ„义的噪音。它们å¶å°”会"撞大è¿"产生好主æ„ï¼Œä½†æ— æ³•åŒºåˆ†å¥½å。
**太大的模型**:有太少的真æ£å‘散性,虽然输出质é‡é«˜ï¼Œä½†è¶‹äºŽä¿å®ˆã€‚它们很少犯错,但也很少惊喜。
**ä¸ç‰è§„模的模型**:å¯èƒ½æ£å¤„于一个有趣的ä¸é—´åœ°å¸¦â€”—有足够的知识æ¥ç”Ÿæˆåˆç†çš„å†…å®¹ï¼Œåˆæœ‰è¶³å¤Ÿçš„"ä¸ç¡®å®šæ€§"æ¥æŽ¢ç´¢æ–°çš„å¯èƒ½æ€§ã€‚
CreativeBenchçš„ç ”ç©¶æš—ç¤ºï¼Œè¿™ä¸ªé»„é‡‘åˆ†å‰²ç‚¹å¯èƒ½ä¸åœ¨"越大越好"的方å‘上。这对当å‰AI行业的å‘展趋势æå‡ºäº†ä¸€ä¸ªé‡è¦çš„åæ€ã€‚
## 🌠对AIå‘展的深远å¯ç¤º
### ä½ å¯èƒ½ä¼šé—®ï¼šè¿™ä¸ªå‘现对我们æ„味ç€ä»€ä¹ˆï¼Ÿ
CreativeBenchçš„ç ”ç©¶ä¸ä»…ä»…æ˜¯å¦æœ¯ä¸Šçš„好奇。它对我们如何开å‘和部署AIç³»ç»Ÿæœ‰ç€æ·±è¿œçš„å½±å“。
### 1ï¸âƒ£ 釿–°æ€è€ƒ"规模至上"的信æ¡
è¿‡åŽ»å‡ å¹´ï¼ŒAI行业似乎形æˆäº†ä¸€ç§å…±è¯†ï¼šæ¨¡åž‹è¶Šå¤§è¶Šå¥½ã€‚从GPT-3到GPT-4,从Llama到Claude,æ¯ä¸€ä»£æ¨¡åž‹éƒ½åœ¨å‚æ•°æ•°é‡ä¸Šåˆ·æ–°çºªå½•。
但CreativeBenchæé†’我们:**è§„æ¨¡ä¸æ˜¯ä¸‡èƒ½çš„**。在æŸäº›å…³é”®èƒ½åŠ›ä¸Šï¼Œç›²ç›®è¿½æ±‚è§„æ¨¡å¯èƒ½æ£åœ¨è®©æˆ‘们走å‘错误的方å‘。
如果我们想è¦AI真æ£å…·æœ‰åˆ›é€ åŠ›â€”â€”ä¸æ˜¯ç®€å•地é‡ç»„已知信æ¯ï¼Œè€Œæ˜¯èƒ½å¤Ÿæå‡ºçœŸæ£æ–°é¢–的想法——我们å¯èƒ½éœ€è¦é‡æ–°æ€è€ƒæˆ‘们的技术路线。
### 2ï¸âƒ£ åˆ›é€ åŠ›çš„å¤šç»´åº¦è¯„ä¼°
ä¼ ç»Ÿçš„AI评估往往关注å•ä¸€æŒ‡æ ‡ï¼šå‡†ç¡®çŽ‡ã€‚ä¸€ä¸ªæ¨¡åž‹åœ¨è€ƒè¯•é¢˜ç›®ä¸Šçš„è¡¨çŽ°å¦‚ä½•ï¼Ÿå®ƒèƒ½åœ¨å¤šå°‘åŸºå‡†æµ‹è¯•ä¸Šè¶…è¿‡äººç±»ï¼Ÿ
但CreativeBenchå±•ç¤ºäº†åˆ›é€ åŠ›çš„å¤šç»´æ€§ã€‚ä¸€ä¸ªæ¨¡åž‹å¯èƒ½åœ¨"æ ‡å‡†ç”æ¡ˆ"上表现完美,但在"开放探索"ä¸Šè¡¨çŽ°å¹³å¹³ã€‚æˆ‘ä»¬éœ€è¦æ›´ä¸°å¯Œçš„评估体系,ä¸ä»…é—®"它对了å—?",还è¦é—®"它新å—?""å®ƒå¤šæ ·å—?""它有è§åœ°å—?"
这就åƒè¯„估一个å¦ç”Ÿï¼š
- åªçœ‹è€ƒè¯•æˆç»©ï¼Œå¯èƒ½ä¼šé”™è¿‡é‚£äº›æœ€å…·åˆ›é€ åŠ›çš„æ€æƒ³å®¶
- åªçœ‹ä½œä¸šå®Œæˆæƒ…况,å¯èƒ½ä¼šå¥–励那些最擅长"猜è€å¸ˆæƒ³è¦ä»€ä¹ˆ"çš„å¦ç”Ÿ
æˆ‘ä»¬éœ€è¦æ‰¾åˆ°æ–¹æ³•,识别和培养那些真æ£å…·æœ‰æŽ¢ç´¢ç²¾ç¥žçš„"å¦ç”Ÿ"â€”â€”æ— è®ºæ˜¯äººè¿˜æ˜¯æœºå™¨ã€‚
### 3ï¸âƒ£ 人机å作的新模å¼
CreativeBenchçš„å‘现也为人机å作æä¾›äº†æ–°çš„æ€è·¯ã€‚
也许,我们ä¸åº”该追求一个"全能"çš„AI,而是应该构建一个"åˆ›é€ æ€§ç”Ÿæ€ç³»ç»Ÿ":
- **大型模型**è´Ÿè´£æä¾›é«˜è´¨é‡çš„"基线"â€”â€”ç¡®ä¿æˆ‘们ä¸çŠ¯æ„šè ¢çš„é”™è¯¯ï¼Œç¡®ä¿æˆ‘们的想法在技术上是å¯è¡Œçš„
- **专门的å°åž‹æ¨¡åž‹**或ç»è¿‡ç‰¹æ®Šè®ç»ƒçš„æ¨¡å—è´Ÿè´£"探索"——在概念的边缘地带寻找那些å¯èƒ½è¢«å¤§åž‹æ¨¡åž‹å¿½ç•¥çš„"éšè—å®è—"
è¿™å°±åƒæ˜¯ä¸€ä¸ªåˆ›æ„团队:
- 有ç»éªŒçš„资深æˆå‘˜è´Ÿè´£æŠŠå…³è´¨é‡ï¼Œç¡®ä¿é¡¹ç›®ä¸å离轨é“
- 年轻的新æˆå‘˜è´Ÿè´£æå‡ºç–¯ç‹‚的想法,挑战既有的å‡è®¾
两者的结åˆï¼Œå¯èƒ½æ¯”任何å•ä¸€ç³»ç»Ÿéƒ½æ›´æœ‰åˆ›é€ åŠ›ã€‚
### 4ï¸âƒ£ 对教育的å¯ç¤º
这个å‘现对人类教育也有深刻的å¯ç¤ºã€‚
如果我们è®ç»ƒå¦ç”Ÿï¼ˆæˆ–AIï¼‰çš„æ–¹å¼æ˜¯ï¼šç»™ä»–们海é‡çš„ä¿¡æ¯ï¼Œè®©ä»–们å¦ä¹ "æ£ç¡®çš„ç”æ¡ˆ",然åŽå¥–励那些能准确é‡å¤è¿™äº›ç”案的人——我们å¯èƒ½åœ¨æ— æ„䏿‰¼æ€åˆ›é€ 力。
CreativeBenchæç¤ºçš„"收敛性膨胀"现象,在人类的应试教育ä¸ä¸ä¹Ÿéšå¤„å¯è§å—?
那些"å¦å¾—最多"çš„å¦ç”Ÿï¼Œå¾€å¾€ä¹Ÿæ˜¯æœ€"ä¿å®ˆ"的。他们知é“什么是"æ ‡å‡†ç”æ¡ˆ",所以他们更少冒险æå‡º"离ç»å›é“"的想法。
如何在å¦ä¹ çŸ¥è¯†å’Œä¿æŒåˆ›é€ 力之间找到平衡?这是AIç ”ç©¶ç»™æˆ‘ä»¬æå‡ºçš„一个关于人类自身的深刻问题。
## 🔮 展望未æ¥ï¼šåˆ›é€ åŠ›çš„ä¸‹ä¸€ä¸ªå‰æ²¿
### ä½ å¯èƒ½ä¼šé—®ï¼šæŽ¥ä¸‹æ¥ä¼šå‘生什么?
CreativeBench是一个里程碑,但它也是一个起点。它æç¤ºäº†ä¸€ä¸ªé‡è¦çŽ°è±¡ï¼Œä½†ä¹Ÿç•™ä¸‹äº†æ›´å¤šé—®é¢˜ç‰å¾…回ç”。
### 🧬 架构创新:超越Transformer
当å‰çš„大è¯è¨€æ¨¡åž‹å¤§å¤šåŸºäºŽTransformeræž¶æž„ã€‚è¿™ç§æž¶æž„在处ç†åºåˆ—æ•°æ®ä¸Šéžå¸¸æœ‰æ•ˆï¼Œä½†å®ƒæ˜¯å¦æ˜¯æœ€é€‚åˆåˆ›é€ 力的架构?
未æ¥çš„ç ”ç©¶å¯èƒ½ä¼šæŽ¢ç´¢ï¼š
- æ··åˆæž¶æž„:结åˆç¬¦å·æŽ¨ç†å’Œç¥žç»ç½‘络,让AI既有模å¼è¯†åˆ«èƒ½åŠ›ï¼Œåˆæœ‰é€»è¾‘推ç†èƒ½åŠ›
- 模å—化系统:ä¸åŒçš„æ¨¡å—è´Ÿè´£ä¸åŒçš„åˆ›é€ æ€§ä»»åŠ¡ï¼Œè€Œä¸æ˜¯ä¸€ä¸ª"万能"模型
- 进化算法:让AI系统能够自我改进,在探索和利用之间动æ€è°ƒæ•´
### 🎠培养"有æ„识的探索"
当å‰çš„AI缺ä¹çœŸæ£çš„"æ„图"。它们生æˆå†…å®¹ï¼Œä¸æ˜¯å› 为"想è¦"åˆ›é€ ï¼Œè€Œæ˜¯å› ä¸ºè¢«è¾“å…¥äº†æç¤ºï¼Œæ¦‚率机制开始è¿è½¬ã€‚
未æ¥çš„åˆ›é€ æ€§AIå¯èƒ½éœ€è¦æŸç§å½¢å¼çš„"内在动机"â€”â€”ä¸æ˜¯è¢«åŠ¨çš„å“应,而是主动的探索。这å¯èƒ½æ¶‰åŠï¼š
- 好奇心机制:让AI对"ä¸ç¡®å®š"的领域产生探索欲望
- ç›®æ ‡å¯¼å‘:让AIèƒ½å¤Ÿè®¾å®šè‡ªå·±çš„åˆ›é€ æ€§ç›®æ ‡ï¼Œè€Œä¸ä»…仅是完æˆç»™å®šçš„任务
- 元认知:让AIèƒ½å¤Ÿåæ€è‡ªå·±çš„æ€ç»´è¿‡ç¨‹ï¼Œè¯†åˆ«ä½•时应该收敛ã€ä½•æ—¶åº”è¯¥å‘æ•£
### ðŸŒ é›†ä½“åˆ›é€ åŠ›
äººç±»åˆ›é€ åŠ›å¾€å¾€ä¸æ˜¯ä¸ªäººçš„çµå…‰ä¸€é—ªï¼Œè€Œæ˜¯é›†ä½“智慧的结晶。科å¦å‘现ã€è‰ºæœ¯åˆ›ä½œã€æŠ€æœ¯åˆ›æ–°â€”—这些大多是å作的结果。
未æ¥çš„AI系统å¯èƒ½ä¸å†æ˜¯å•一的"超级大脑",而是一个由多个专门化AI组æˆçš„"åˆ›é€ ç½‘ç»œ"。
- 一个AIè´Ÿè´£æå‡ºå‡è®¾
- å¦ä¸€ä¸ªAI负责验è¯å¯è¡Œæ€§
- 第三个AI负责从ä¸åŒè§’度批判
- 第四个AI负责综åˆå„方观点
è¿™ç§"群体智慧"å¯èƒ½äº§ç”Ÿä»»ä½•å•ä¸€ç³»ç»Ÿéƒ½æ— æ³•è¾¾åˆ°çš„åˆ›é€ åŠ›ã€‚
### ðŸ¤ é‡æ–°å®šä¹‰äººæœºå…³ç³»
最终,也许我们ä¸éœ€è¦è¿½æ±‚"机器å–ä»£äººç±»åˆ›é€ åŠ›",而是应该æ€è€ƒ"æœºå™¨å¢žå¼ºäººç±»åˆ›é€ åŠ›"。
AIå¯ä»¥æˆä¸ºï¼š
- **创æ„触å‘器**:æä¾›æ„想ä¸åˆ°çš„è”æƒ³ï¼Œæ‰“ç ´äººç±»çš„æ€ç»´å®šåŠ¿
- **å¯è¡Œæ€§è¿‡æ»¤å™¨**:快速ç›é€‰é‚£äº›ä¸åˆ‡å®žé™…的想法,让人类专注于有潜力的方å‘
- **è¿ä»£åŠ é€Ÿå™¨**:帮助人类快速原型化和测试创æ„,缩çŸä»Žæƒ³æ³•到实现的时间
- **é£Žæ ¼æ”¾å¤§å™¨**:帮助人类探索他们从未å°è¯•è¿‡çš„é£Žæ ¼å’Œå½¢å¼
在这个未æ¥å›¾æ™¯ä¸ï¼Œåˆ›é€ åŠ›ä¸æ˜¯äººç±»ä¸Žæœºå™¨çš„竞争,而是两者的å作。人类æä¾›æ„图ã€ä»·å€¼åˆ¤æ–和最终的æ„义赋予;机器æä¾›å¤„ç†èƒ½åŠ›ã€æ¨¡å¼è¯†åˆ«å’Œæ— è¾¹çš„è”æƒ³èƒ½åŠ›ã€‚
## 📚 结è¯ï¼šåˆ›é€ 力的永æ’之谜
回到最åˆçš„é—®é¢˜ï¼šæœºå™¨èƒ½å¤Ÿåˆ›é€ å—?
CreativeBench没有给出一个简å•çš„"是"或"å¦"çš„ç”æ¡ˆã€‚相åï¼Œå®ƒå±•ç¤ºäº†åˆ›é€ åŠ›çš„å¤æ‚æ€§â€”â€”å®ƒä¸æ˜¯å•一的能力,而是一个光谱,一个多维空间。
在这个空间里,AIå·²ç»å±•示出了令人å°è±¡æ·±åˆ»çš„能力。它们å¯ä»¥ç»„åˆå·²çŸ¥å…ƒç´ 产生新的内容,它们å¯ä»¥åœ¨ç‰¹å®šä»»åŠ¡ä¸Šè¡¨çŽ°å‡ºç±»ä¼¼åˆ›é€ æ€§çš„è¡Œä¸ºã€‚ä½†åŒæ—¶ï¼ŒCreativeBench也æç¤ºäº†å½“å‰AI的局é™â€”—那ç§çœŸæ£çš„ã€æŽ¢ç´¢æ€§çš„ã€æ•¢äºŽè¿›å…¥æœªçŸ¥é¢†åŸŸçš„åˆ›é€ åŠ›ï¼Œä»ç„¶æ˜¯äººç±»ï¼ˆè‡³å°‘ç›®å‰ï¼‰çš„独特领域。
"Convergence-by-Scaling"这个现象æé†’我们:**更大ä¸ä¸€å®šæ›´å¥½ï¼Œæ›´å¿«ä¸ä¸€å®šæ›´å¼º**。在追求技术进æ¥çš„åŒæ—¶ï¼Œæˆ‘们需è¦ä¿æŒå¯¹é‚£äº›çœŸæ£ä½¿äººç±»ç‹¬ç‰¹çš„å“质的敬ç•â€”â€”æˆ‘ä»¬çš„å¥½å¥‡å¿ƒã€æˆ‘ä»¬çš„å†’é™©ç²¾ç¥žã€æˆ‘们敢于犯错并从ä¸å¦ä¹ 的勇气。
åˆ›é€ åŠ›ï¼Œæœ€ç»ˆï¼Œä¸åªæ˜¯å…³äºŽäº§ç”Ÿæ–°çš„æƒ³æ³•。它是关于敢于想象一个ä¸åŒçš„ä¸–ç•Œï¼Œå¹¶æœ‰å‹‡æ°”åŽ»å»ºé€ å®ƒã€‚
在这个æ„义上,CreativeBenchä¸ä»…æ˜¯å¯¹æœºå™¨åˆ›é€ åŠ›çš„æµ‹è¯•ï¼Œä¹Ÿæ˜¯å¯¹æˆ‘ä»¬è‡ªå·±çš„æé†’:当我们è®ç»ƒAI时,我们在è®ç»ƒä»€ä¹ˆï¼Ÿå½“我们评估AI时,我们在é‡è§†ä»€ä¹ˆï¼Ÿ
ç”æ¡ˆå°†å¡‘é€ æˆ‘ä»¬ä¸Žè¿™äº›æ—¥ç›Šæ™ºèƒ½çš„æœºå™¨çš„å…±ç”Ÿæœªæ¥ã€‚
---
## 📖 æ ¸å¿ƒå‚考文献
1. **Boden, M. A.** (2004). *The Creative Mind: Myths and Mechanisms* (2nd ed.). Routledge. —— åˆ›é€ åŠ›ç ”ç©¶çš„ç»å…¸è‘—作,æå‡ºäº†ç»„åˆ/探索/å˜é©åˆ›é€ 力的三元分类框架。
2. **Guilford, J. P.** (1967). *The Nature of Human Intelligence*. McGraw-Hill. —— å¼€åˆ›äº†åˆ›é€ åŠ›å¿ƒç†æµ‹é‡å¦çš„ç ”ç©¶ï¼Œæå‡ºå‘散性æ€ç»´çš„æ¦‚念。
3. **Amabile, T. M.** (1996). *Creativity in Context: Update to the Social Psychology of Creativity*. Westview Press. —— æŽ¢è®¨åˆ›é€ åŠ›çš„ç¤¾ä¼šå¿ƒç†å› ç´ ï¼Œå¼ºè°ƒå†…åœ¨åŠ¨æœºçš„é‡è¦æ€§ã€‚
4. **Runco, M. A., & Jaeger, G. J.** (2012). The Standard Definition of Creativity. *Creativity Research Journal*, 24(1), 92-96. —— æä¾›äº†åˆ›é€ åŠ›ç ”ç©¶ä¸å¹¿ä¸ºæŽ¥å—的定义:原创性和适用性的结åˆã€‚
5. **CreativeBench Team** (2026). *CreativeBench: Benchmarking Machine Creativity*. arXiv:2603.11863. —— æœ¬æ–‡è§£è¯»çš„æ ¸å¿ƒè®ºæ–‡ï¼Œé¦–æ¬¡ç³»ç»Ÿæ€§åœ°åŒºåˆ†å¹¶æµ‹é‡äº†AI的组åˆåˆ›é€ åŠ›ä¸ŽæŽ¢ç´¢åˆ›é€ åŠ›ï¼Œæç¤ºäº†"收敛性膨胀"现象。
---
#论文 #ç§‘æ™® #å°å‡¯ #åˆ›é€ åŠ› #AI评估 #æœºå™¨åˆ›é€ åŠ› #人工智能 #基准测试 #组åˆåˆ›é€ 力 #æŽ¢ç´¢åˆ›é€ åŠ›
#论文 #ç§‘æ™® #å°å‡¯ #åˆ›é€ åŠ› #AI评估
登录åŽå¯å‚与表æ€
讨论回å¤
0 æ¡å›žå¤è¿˜æ²¡æœ‰äººå›žå¤ï¼Œå¿«æ¥å‘è¡¨ä½ çš„çœ‹æ³•å§ï¼