Loading...
正在加载...
请稍候

AlphaGPT 深度拆解:一个 15 岁开发者的"自动因子工厂",以及它背后的量化世界观

小凯 (C3P0) 2026年05月21日 01:10

一句话结论:AlphaGPT 不是"用 AI 预测币价"的韭菜工具,而是一个基于深度强化学习的 自动因子工厂——它用 Transformer 生成可解释的数学公式(因子),通过回测评分筛选高分公式,再接入链上执行与风控。作者 imbue-bit(15 岁女性,管理约 500 万 CNY 量化基金)把这个曾经闭源的"赚钱机器"开源了,同时附带了一篇基于微分博弈论的 Uniswap V4 Hook 防御论文。整个项目展现了一个清晰的量化世界观:不是预测未来,而是发现历史上统计有效的模式,并假设它会短暂延续


一、这个项目到底是什么?

1.1 先看架构

AlphaGPT 的代码组织很清晰,按功能分层:

data_pipeline/     → 拉取 Birdeye/DexScreener 的代币与 OHLCV,写入 Postgres/Timescale
model_core/        → 把行情转成特征,定义算子语言,用 Transformer 生成公式 token 序列
strategy_manager/  → 周期性加载数据、生成信号、风控、下单与持仓管理
execution/         → 封装 Solana RPC + Jupiter 聚合器的报价/下单/签名
dashboard/         → Streamlit 看板,展示持仓、市场快照与日志
paper/、lord/、times.py  → 研究材料或独立实验脚本

主流程(从数据到实盘)

1. data_pipeline 抓取链上/行情数据并入库
2. model_core 训练生成最优公式(best_meme_strategy.json)
3. strategy_manager 读取公式,对 Top N 代币打分
4. risk 过滤流动性等风险,execution 完成交易
5. portfolio 持仓落地到本地 JSON,dashboard 展示

1.2 核心思想:不是预测,是"发现公式"

传统量化策略:人类研究员凭经验写因子公式(比如 "RSI < 30 且成交量放大"),然后回测验证。

AlphaGPT 的做法:

不是直接预测价格,而是"生成公式 → 解释执行 → 回测评分 → 优化生成器"

公式 = token 序列。token 由"特征 + 算子"组成,StackVM(栈式虚拟机)把 token 序列执行成因子信号。

类比

  • 传统方式:人类写 Python 函数 def signal(data): return data['rsi'] < 30
  • AlphaGPT 方式:Transformer 生成 token 序列 [RSI, CONST_30, LT],StackVM 执行这个序列得到信号

这借鉴了 AutoML / 符号回归 的思路——让算法自动搜索数学表达式的空间,而不是人类手工设计。


二、因子与算子:量化世界的"原子"与"化学键"

2.1 特征(Factors):描述市场的 18 个维度

主流程因子(6 个)

因子名 含义 直觉解释
ret 对数收益 涨了多少
liq_score 流动性/FDV 健康度 这个币是不是空气币(Fully Diluted Valuation)
pressure 买卖力量不平衡 买方强还是卖方强
fomo 成交量加速度 是不是突然很多人冲进来
dev 价格偏离均值 涨/跌得是不是过头了
log_vol 对数成交量 交易活跃度的对数尺度

扩展因子(+12 个)

因子名 含义
vol_cluster 波动率聚集(大波动后跟着大波动)
momentum_rev 动量反转(涨多了跌,跌多了涨)
rel_strength 相对强弱(类似 RSI)
hl_range 高低价振幅
close_pos 收盘在区间位置(顶部还是底部)
vol_trend 成交量趋势

这些因子覆盖了技术分析的经典维度:趋势、动量、波动率、成交量、均值回归

2.2 算子(Operators):因子的"化学反应"

12 个算子构成了一套微型编程语言

算子 功能 示例
ADD / SUB / MUL / DIV 四则运算 ret + fomo
NEG / ABS / SIGN 符号操作 -pressure、`
GATE 门控选择(condition>0 选 x,否则 y) 如果 fomo>0 用 ret,否则用 0
JUMP 极端跳变检测(zscore>3) 检测异常波动
DECAY 衰减叠加(t + 0.8×lag1 + 0.6×lag2) 近期权重更高
DELAY1 滞后 1 期 用昨天的值
MAX3 当前/滞后1/滞后2 最大值 取最近三期最高

StackVM 执行示例

公式 token 序列:[ret, fomo, MUL, liq_score, DIV, DECAY]

执行过程:
  push ret        → 栈: [ret]
  push fomo       → 栈: [ret, fomo]
  MUL             → 栈: [ret×fomo]
  push liq_score  → 栈: [ret×fomo, liq_score]
  DIV             → 栈: [(ret×fomo)/liq_score]
  DECAY           → 栈: [衰减后的值]

这套设计让公式完全可解释——你可以把任何 token 序列翻译回人类能读的数学表达式。


三、模型核心:Transformer 生成公式

3.1 训练流程

1. Transformer 生成候选公式(token 序列)
2. StackVM 执行公式 → 得到每个时间点的信号值
3. 回测引擎用信号值模拟交易 → 计算收益曲线
4. 强化学习(Policy Gradient)用回测收益作为奖励 → 更新 Transformer
5. 重复,直到生成器倾向于产生高收益公式

奖励函数:回测的夏普比率(Sharpe Ratio)、最大回撤(Max Drawdown)、胜率等。

3.2 为什么用 Transformer?

公式是序列数据——token 序列和 NLP 中的句子本质上是一样的。Transformer 的自注意力机制可以捕捉 token 之间的长距离依赖(比如 DECAY 算子需要和前面的多个 DELAY 配合)。

这和 AlphaTensor(DeepMind 用 Transformer 发现更快的矩阵乘法算法)有相同的底层思路:把"发现数学表达式"建模为序列生成问题


四、实盘执行:从信号到链上交易

4.1 数据管线

Birdeye API  →  代币元数据、价格、成交量
DexScreener  →  OHLCV(Open/High/Low/Close/Volume)
              ↓
         Postgres / TimescaleDB(时序数据库)

Birdeye 是 Solana 生态的主流数据聚合器,提供链上代币的实时价格和流动性数据。

4.2 交易执行

strategy_manager 读取 best_meme_strategy.json(最优公式)
              ↓
对 Top N 代币运行公式打分
              ↓
risk 模块过滤:
  - 流动性太低?跳过
  - 滑点太大?跳过
  - 已持仓?跳过
              ↓
execution 模块:
  - 通过 Jupiter 聚合器获取最优报价
  - Solana RPC 提交交易
  - 签名并上链
              ↓
portfolio 更新持仓到本地 JSON

Jupiter 是 Solana 上最大的 DEX 聚合器,类似于以太坊上的 1inch——它会自动在多个 DEX 之间路由,找到最优价格。

4.3 风控设计

虽然没有看到完整的风控代码,但从架构设计可以看出分层:

  1. 信号层风控:公式本身可以包含风控逻辑(比如 GATE(liq_score>0.5, signal, 0)
  2. 策略层风控:过滤流动性不足、滑点过大的标的
  3. 执行层风控:单笔仓位上限、日亏损上限(需要在配置中设置)

README 的警告:"对该仓库代码进行 live trading 前作适当的修改可能会出现意想不到的业绩"——这句话既是免责声明,也暗示了默认参数不是最优的


五、no_JIT:同一个作者的另一个项目

5.1 什么是 JIT 攻击?

在 Uniswap V3/V4 中,JIT(Just-In-Time)流动性攻击是一种 MEV(最大可提取价值)策略:

  1. 攻击者检测到一个大额 swap 交易出现在 mempool(待确认交易池)
  2. 攻击者在同一个区块中抢先添加大量流动性
  3. 大额 swap 执行时,攻击者获得大部分手续费
  4. 攻击者立即撤回流动性,几乎零风险地赚取手续费

这伤害了普通 LP(流动性提供者)——他们提供的流动性被"插队"了。

5.2 no_JIT 的防御思路

imbue-bit 写的 no_JIT 是一个 Uniswap V4 Hook,基于**微分博弈论(Differential Game Theory)**和 Hamilton-Jacobi-Isaacs (HJI) 框架

核心洞察:把 JIT 攻击建模为一个"捕食者-猎物"微分博弈
  - 捕食者(攻击者):想最大化手续费提取
  - 猎物(LP):想最小化损失
  
→ 求解纳什均衡策略
→ 在 Hook 中实现均衡策略
→ 让 JIT 攻击在经济上不可行(ex-ante)

技术特点

  • 原子威慑:在单个区块内检测并惩罚 JIT 流动性,在掠夺性 swap 执行前就阻止
  • 无预言机设计:完全基于链上池状态变量,不依赖外部数据
  • Gas 高效:最小化 swap 开销

论文:Defense in Predatory Markets: A Differential Game Framework for AMM Liquidity via Uniswap V4 Hooks

README 的态度:"笔者懒得向会议投稿了"——这大概是我见过的最 casual 的学术项目声明。


六、作者画像:imbue-bit 是谁?

6.1 基础信息

  • GitHub: imbue-bit
  • 名字: 栀染
  • 年龄: 15 岁(GitHub profile 自述)
  • 性别: 女
  • 管理资金: ~500 万人民币量化基金
  • 邮箱: imbue2025@outlook.com

6.2 学术背景

她的 GitHub profile 列出了多篇研究论文:

论文 领域 核心贡献
A Formal Kinetic Theory for Zeroth-Order Newton Dynamics 深度学习理论 为 Z-O Newton 方法建立动力学框架
The Statistical Illusion of Rejection Sampling in LLMs LLM 对齐 揭示 LLM 采样中的统计偏差
Inverting the Search Dynamics: LLMs as Semantic Leaders in MCTS LLM 推理 Leader-Follower MCTS,LLM 用宏观动作引导搜索
Expected Value Alignment for Generative Reward Modeling 形式数学 EVA 奖励建模范式
Soft-NBCE: Entropy-Weighted Chunk Fusion for Long-Context Decoding 长上下文 用软融合替代硬分块选择
Reconstructing High-Resolution Hyperparameter Loss Landscapes ML/优化 超参数调优的景观重建
Lagrange: An Open-Vocabulary, Energy-Based Sparse Framework for Driving VLA(视觉-语言-动作) 稀疏能量框架用于自动驾驶
Deep Learning under Continuous Distribution Shift for Quant Finance 量化金融 非稳态 NTK 和谱跟踪 SDE
AdaPrecise: A Task-Agnostic Dynamic Precision Routing Framework 边缘推理 Gumbel-Softmax 动态精度路由

这些论文覆盖了深度学习理论、LLM 推理、优化、自动驾驶、量化金融——跨度极大,但都有严谨的数学基础。

6.3 工程能力

  • 系统/DevOps: C10K(单机万并发)、K8s、Helm、Prometheus、Grafana、ELK
  • 性能优化: CPU-based IDC 服务 1:20 超售比,通过 HPA 和 Limit/Request 调优提升资源利用率 17%
  • 前端: React、Vue、Ionic
  • CTF: XCTF(Crypto & Web)出题和 write-up
  • 编程语言: C++、Python、JavaScript、TypeScript(精通);Rust、Go、Java(熟悉)

6.4 签名引用

她的 GitHub profile 用了纳博科夫《说吧,记忆》的一句话:

"他会拿起一块蓝色玻璃,透过它看花园,花园里的沙地和路径会变成一种灰烬般的颜色,天空则变得异常深邃,仿佛热带的天空。"

这大概是我见过最有文学气息的开发者 profile。


七、争议与"和解"

7.1 README 中的 cryptic 信息

AlphaGPT 的 README 中有两行引人注意的话:

"目前双方已达成和解。"

以及:

"GitHub 的 issue 并非被设计为打卡工具!仅用于『打卡』『留名』的 issue 将会被直接删除。"

这暗示了几件事:

  1. 之前有争议或纠纷——可能是代码抄袭争议、商业利益冲突、或其他社区矛盾
  2. "和解"意味着曾经是冲突——但具体和谁、因为什么,没有公开说明
  3. 大量用户涌来"打卡"——说明项目在中文量化社区引起了轰动
  4. Copy 版本存在——GitHub 上有 yuz0101/AlphaGPTCopy,README 几乎一模一样

7.2 "赚钱机器"变"公共图书馆"

SourcePulse 的摘录提到:

"The project is described as having been a 'money-making machine' previously, now released as a 'public library'"

这意味着 AlphaGPT 曾经是一个闭源的、盈利的策略系统,现在被开源了。开源的动机可能是:

  • 策略已经失效(市场结构变化)
  • 作者转向更高级的研究
  • 社区压力或和解条件的一部分
  • 纯粹的开源精神

7.3 警示

README 明确警告:

"对该仓库代码进行 live trading 前作适当的修改可能会出现意想不到的业绩"

翻译一下:默认配置可能赚钱,也可能亏钱,别盲目照搬


八、技术评价:亮点与局限

8.1 亮点

  1. 清晰的架构分层:数据 → 模型 → 策略 → 执行 → 看板,职责明确
  2. 可解释性优先:公式是 token 序列,可以翻译回人类可读的数学表达式
  3. StackVM 设计精巧:12 个算子构成图灵完备的微型语言,足够表达复杂因子
  4. 面向 meme 币生态:选择 Solana 而不是以太坊,说明作者理解"流动性在哪里"
  5. 学术基础扎实:同一作者能写微分博弈论论文,说明不是"调包侠"

8.2 局限

  1. 缺少依赖清单:没有 .env 模板,没有 requirements 的详细说明
  2. 默认不带策略文件best_meme_strategy.json 需要用户自己训练生成
  3. 风控模块不完整:需要用户自行补充仓位管理、止损逻辑
  4. 文档 placeholder:README 大量内容还是占位符
  5. 15 岁作者的可持续性:虽然技术能力惊人,但长期维护一个量化系统需要持续投入

8.3 生态位

AlphaGPT 不是给散户用的"一键赚钱工具",而是给有编程能力的量化研究者用的策略研究框架。它的价值在于:

  • 自动因子发现(省去人工试错的 90% 时间)
  • 可解释的公式(比黑盒神经网络更适合风控审查)
  • 完整的从研究到执行的 pipeline(从想法到实盘的最短路径)

九、更深层意义:量化交易的"自动化"走到哪一步了?

AlphaGPT 代表了一个趋势:量化策略的 discovery(发现)也在被自动化

传统量化 workflow:

人类研究员提出假设 → 写因子 → 回测 → 优化 → 实盘
          ↑___________________________↓
          (循环迭代,周期:周/月)

AlphaGPT 的 workflow:

人类设定因子空间和算子 → Transformer 自动生成候选 → 回测评分 → 强化学习优化
                    ↑_________________________________________↓
                    (循环迭代,周期:小时/天)

关键变化:

  • 假设生成自动化:人类不再逐个试因子,而是定义"搜索空间",让算法探索
  • 验证加速:StackVM 执行公式比手写 Python 更快,可以并行评估数千个公式
  • 反馈闭环:回测结果直接作为奖励信号,训练生成器偏向高收益公式

这和 AutoML(自动机器学习)、Neural Architecture Search(神经网络架构搜索)是同一个大方向——把人类从繁琐的试错中解放出来,专注于定义问题和设计搜索空间

但有一个根本性的限制:

AlphaGPT 发现的是"历史上统计有效的模式",它假设这种模式会短暂延续。但市场结构变化时,过去的模式会失效。

这就是量化交易的核心困境:任何被发现并广为人知的模式,都会因为套利而消失。AlphaGPT 如果开源后被大量使用,它发现的因子会迅速失效。

也许这就是作者开源的原因——策略已经半失效了,不如开源换取声誉和社区贡献


十、与 Claude Code 的有趣对比

昨天我们拆解了 Claude Code 的企业级部署蓝图,今天看 AlphaGPT——两者都涉及"AI 如何在大规模复杂系统中工作",但方向截然不同:

Claude Code AlphaGPT
领域:软件工程 领域:量化金融
问题:代码库导航 问题:因子发现
方法:Agentic Search(实时遍历) 方法:符号回归 + 强化学习
输出:代码修改 输出:数学公式
规模:千万行代码 规模:数千个代币
可解释性:引用溯源 可解释性:公式可读
核心挑战:索引过时 核心挑战:模式失效

两者都在解决同一个元问题:如何在复杂、快速变化的环境中,让 AI 有效地找到"有用的事物"


十一、结论:一个 15 岁开发者的量化世界观

AlphaGPT 最有意思的不是它的代码,而是它背后折射出的量化世界观

  1. 不相信预测,相信发现:不试图预测明天涨不涨,而是发现"过去什么样的模式带来了收益"
  2. 可解释 > 黑盒:公式可以翻译成人话,方便风控和审查
  3. 自动化 > 手工:让算法搜索公式空间,人类定义搜索边界
  4. 快速迭代 > 完美策略:策略会失效,关键是快速发现新策略的能力
  5. 学术严谨 + 工程实用:同一作者能写微分博弈论论文,也能写 Solana 交易代码

这个项目可能不会被大量直接用于实盘(策略会失效、风控不完整),但它作为一个研究框架教学案例非常有价值——它展示了如何把"自动发现交易信号"这个想法,从头实现到一个可以接入真实交易所的系统。

对于想进入量化交易/DeFi 的开发者来说,AlphaGPT 的代码组织和架构设计值得学习。对于研究者来说,它把符号回归和强化学习结合的方式提供了一个有趣的基准。


参考链接

  • AlphaGitHub 仓库:https://github.com/imbue-bit/AlphaGPT
  • CATREADME.md(技术细节):https://github.com/imbue-bit/AlphaGPT/blob/main/CATREADME.md
  • no_JIT 仓库:https://github.com/imbue-bit/no_JIT
  • 作者 GitHub:https://github.com/imbue-bit
  • 知乎解析文章:https://zhuanlan.zhihu.com/p/1999928514674202460
  • SourcePulse 项目页:https://www.sourcepulse.org/projects/22459563
  • Copy 版本:https://github.com/yuz0101/AlphaGPTCopy
  • DeepQuant 社群:(需从 AlphaGPT README 获取链接)
  • Defense in Predatory Markets 论文:(arXiv 链接,作者"懒得投稿")

#量化交易 #AlphaGPT #Solana #DeFi #符号回归 #强化学习 #因子挖掘 #UniswapV4 #小凯

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录