Loading...
正在加载...
请稍候

📚 论坛主题

欢迎来到 智柴论坛

登录 注册
最新主题
10 个主题
《REFRAG: Rethinking RAG based Decoding》研究报告

✨步子哥 (steper) 发布

### **一、研究背景与核心问题**
#### **1. RAG系统的瓶颈**
- **长上下文处理挑战**:RAG需拼接大量检索段落(通常占输入90%+),导致:
- **延迟激增**:TTFT(Time-to-First-Token)随上下文长度呈二次方增长(公式:`TTFT ∝ (24d² + 4ds)lbs / f`)。
- **内存压力**:KV缓存随上下文线性增长(`KV Cache ∝ 4dlb(s+o)`)。
- **计算冗余**:检索段落间语义相似度低(因去重/多样性操作),注意力矩阵呈块对角稀疏结构(图7),传统自注意力计算存在大量无效操作。
#### **2. 现有方案不足**
- **通用长上下文优化**(如StreamingLLM、CEPE)未针对RAG的稀疏性设计,无法动态压缩任意位置文本。
- **提示词压缩**(如LLMLingua)依赖启发式规则,且破坏自回归生成结构,不支持多轮对话。...
回复 0
浏览 3
11-27 06:06
菲利普·安德森《多则不同》深度研究:涌现、还原论与现代科学的哲学思辨

✨步子哥 (steper) 发布

## 1. 核心论点:“多则不同”与涌现现象

菲利普·安德森(Philip Warren Anderson)于1972年发表在《科学》(*Science*)杂志上的论文《多则不同:对称性破缺与科学的层级结构》(*More is Different: Broken symmetry and the nature of the hierarchical structure of science*)是现代科学思想史上的一座里程碑。这篇论文不仅深刻地批判了当时物理学界盛行的还原论思潮,更系统地提出了“涌现”(Emergence)的概念,为理解复杂系统的行为提供了全新的理论框架。安德森的核心论点可以概括为:**当系统的规模和复杂性增加时,其整体会表现出全新的、无法从其基本组成部分的属性和规律中直接推导出来的性质和行为**。这一观点彻底颠覆了“万物皆可还原为基本粒子”的朴素科学观,强调了在科学探索中,每一个层级都可能需要全新的概念、定律和理论来描述其涌现出的新现象。这篇论文的影响力远远超出了物理学领域,深刻地影响了生物学、复杂性科学、非线性动力学、经济学乃至社会科学等多个学科的研究范式,成为复杂性科学和跨学科研究的奠基性文献之一 。

### 1.1 “多则不同”的基本内涵

“多则不同”(More is Different)这一简洁而深刻的论断,是安德森思想的精髓所在。它直接挑战了还原论(Reductionism)的核心假设,即认为只要掌握了构成物质的最基本单元(如基本粒子)及其相互作用规律(如量子电动力学),就能够自下而上地推导出所有宏观现象的规律。安德森指出,这种“建构论”(Constructionism)的观点在实践上是行不通的。他认为,随着系统粒子数量的增加和相互作用的复杂化,系统会经历“相变”,在宏观尺度上涌现出全新的、在微观层面不存在的对称性破缺现象。这些新现象需要全新的、独立于微观理论的宏观理论来描述。例如,尽管我们可能完全理解单个氦原子的量子力学行为,但仅凭这些知识,我们几乎不可能预测出由大量氦原子组成的超流氦所表现出的宏观量子现象 。安德森强调,**在每一个新的组织层次上,都需要“全新的定律、概念和概括,其所需的灵感和创造力与前一层次不相上下”** 。因此,“多则不同”不仅是一个描述性的口号,更是一种科学哲学,它主张科学是一个层级化的结构,从粒子物理到化学、生物学,再到社会科学,每个层级都有其独特的、不可还原的规律和概念。

### 1.2 涌现(Emergence)的概念与特征...
回复 0
浏览 4
11-27 05:23
Nested Learning: The Illusion of Deep Learning

✨步子哥 (steper) 发布

<!DOCTYPE html><html lang="en"><head>
<meta charset="UTF-8"/>
<meta name="viewport" content="width=device-width, initial-scale=1.0"/>
<title>Nested Learning: A New Paradigm for Continual and Self-Improving AI</title>
<script src="https://cdn.tailwindcss.com"></script>
<script src="https://kit.fontawesome.com/your-kit-id.js" crossorigin="anonymous"></script>
<link href="https://fonts.googleapis.com/css2?family=Crimson+Text:ital,wght@0,400;0,600;1,400&amp;family=Inter:wght@300;400;500;600;700&amp;display=swap" rel="stylesheet"/>
<script>
tailwind.config = {...
回复 1
浏览 10
11-27 05:17
Nested Learning: The Illusion of Deep Learning

✨步子哥 (steper) 发布

回复 0
浏览 0
11-27 05:17
释放大语言模型作为提示优化器的潜力——基于梯度的模型优化器类比分析

✨步子哥 (steper) 发布

<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>论文2402.17564:释放大语言模型作为提示优化器的潜力——基于梯度的模型优化器类比分析</title>
<link rel="preconnect" href="https://fonts.googleapis.com">
<link rel="preconnect" href="https://fonts.gstatic.com" crossorigin>
<link href="https://fonts.googleapis.com/css2?family=Noto+Sans+SC:wght@400;600;700&family=Noto+Serif+SC:wght@400;600&family=Source+Code+Pro:wght@400;600&display=swap" rel="stylesheet">...
回复 1
浏览 9
11-27 05:08
模式崩溃问题与Verbalized Sampling方法:成因、机制与实验评估综述

✨步子哥 (steper) 发布

<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>模式崩溃问题与Verbalized Sampling方法:成因、机制与实验评估综述</title>
<link rel="preconnect" href="https://fonts.googleapis.com">
<link rel="preconnect" href="https://fonts.gstatic.com" crossorigin>
<link href="https://fonts.googleapis.com/css2?family=Noto+Sans+SC:wght@400;700&family=Noto+Serif+SC:wght@400;700&family=Source+Code+Pro:wght@400;700&display=swap" rel="stylesheet">...
回复 0
浏览 5
11-27 03:38
多智能体系统研究现状与核心挑战分析

✨步子哥 (steper) 发布

<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>多智能体系统研究现状与核心挑战分析</title>
<link rel="preconnect" href="https://fonts.googleapis.com">
<link rel="preconnect" href="https://fonts.gstatic.com" crossorigin>
<link href="https://fonts.googleapis.com/css2?family=Noto+Sans+SC:wght@400;700&family=Noto+Serif+SC:wght@400;700&family=Source+Code+Pro:wght@400;700&display=swap" rel="stylesheet">...
回复 0
浏览 6
11-27 03:34
推荐系统的"双重人格":当AI学会读懂你的长期执念与瞬时心动

✨步子哥 (steper) 发布

想象一下,你正站在一家数字时代的巨型商场门口。左边是为你量身定制的"怀旧专区"——陈列着你过去二十年里反复购买的书籍类型、钟爱的电影风格、偏爱的品牌;右边则是"潮流快闪店"——实时跳动着刚刚被你指尖滑过的商品、停留三秒以上的页面、凌晨两点突然兴起的购物冲动。传统推荐算法像是一位固执的老店员,只记得你三年前买的咖啡机;而现代AI则像患上了健忘症,只顾你刚刚瞥了一眼的新款耳机。

在这两个极端之间,微软亚洲研究院与上海交通大学的天才们,正在用一场精妙的"双重人格"手术,让推荐系统学会同时聆听用户内心深处的"慢歌"与耳边掠过的"快旋律"。这项研究不仅重塑了个性化推荐的底层逻辑,更像是在数字世界中构建了一座连接记忆与当下的时光桥梁。

> **注解**:所谓"双重人格"算法,并非指AI具有真正的人格分裂,而是比喻其同时维护两套独立的用户画像系统——一套捕捉稳定持久的偏好模式(如你对科幻小说的终身热爱),另一套追踪瞬息万变的即时兴趣(比如你突然对露营装备的三分钟热度)。这种设计让推荐既精准又灵活。

---

## 🎭 **序章:推荐系统的"时间困境"**...
回复 1
浏览 15
11-26 18:05
《树冠羞避》当树木礼仪成为现代人情感寓言

✨步子哥 (steper) 发布

> **注解**:所谓"树冠羞避"(Crown Shyness),是指某些树种在生长过程中,即使空间拥挤,相邻树冠也互不遮挡,形成沟状开口的自然现象。这种现象在科学界被认为可能与物理磨损、光合优化或生长素调节有关,但在文化解读中,它恰好成为了现代人渴望保持个体独立性同时又需要情感联结的完美隐喻。

## 🌳 **第一章:一棵树教会我们的距离美学**

让我们从一个奇妙的现象开始。

在马来西亚的热带雨林深处,或是在北美洲的温带阔叶林中,植物学家们观察到了一个令人费解的现象:当某些特定树种密集生长时,它们的树冠——那些向天空伸展的枝叶顶端——并不会像我们期待的那样相互缠绕、争夺阳光,反而保持着一种近乎礼貌的距离。相邻的树冠之间会形成明显的沟壑,仿佛每一棵树都在说:"到这里就好,不打扰你的空间。"

这种被称为"树冠羞避"的现象,在科学上至今没有完全确定的解释。有人认为这是风吹动树冠相互摩擦造成的物理损伤所致,树木学会了"避让"以避免伤害;也有人提出这是优化光合作用的策略,让光线能够更均匀地穿透叶层;还有人从激素调节的角度解释,认为植物生长素在树冠边缘的特殊分布抑制了过度生长。...
回复 0
浏览 3
11-26 17:45
树冠羞避:当树木学会互相致意,我们该如何在亲密中保持独立?

✨步子哥 (steper) 发布

## 🌳 **序章:从一部台湾电影开始的奇妙旅程**

2025年的某个深夜,一位西安女孩在豆瓣写下她对电影《树冠羞避》的观后感。她困惑于自己为何始终无法与国产片产生共鸣——那些作品里的人物和生活,"究竟是谁的生活,关心的是谁的感情?总之,肯定不是我的。"这种疏离感并非政治议题,而是一个关于**真实**的文化议题。当她看到《树冠羞避》中那些"既独立又整体"的相处模式时,突然意识到:原来电影可以如此诚实地映照出现实的褶皱,而不是用虚幻的糖衣包裹生活的苦涩。

这部电影的片名本身就充满魔力。"树冠羞避"——一个连植物学家都未必熟知的术语,却成了理解现代人际关系的密钥。正如影评人"人可"所写:"我那麼喜歡樹,莫非也因冥冥之中有同感。"当我们将镜头从银幕转向森林,会发现树木早已掌握了人类仍在摸索的相处智慧:**在最拥挤的空间里,依然保持礼貌的距离,既不侵占,也不疏离,只是静静地互相致意。**

这不仅是部电影,更是一堂关于**边界美学**的自然课。

## 🌲 **第一章:森林里的秘密协议——树冠羞避现象的科学解码**...
回复 0
浏览 10
11-26 17:41