当你的竞争对手还在猜算法黑盒里装了什么,你已经在读它的源码了。
2023 年 3 月,马斯克把 Twitter 的推荐算法扔上了 GitHub,代号 twitter/the-algorithm。Scala 代码,部分开源,但已经足够让行业地震。2026 年 1 月,xAI 放出了完整重写版:xai-org/x-algorithm。Rust + Python,基于 Grok transformer,187 个文件,18000 行新代码,每四周更新一次。
这不是公关秀。Elon 的原话是:"The algorithm will literally read every post and watch every video — 100M+ per day."
对创作者来说,这意味着一件事:推流逻辑第一次从黑盒变成了白盒。 你不需要再猜什么内容会被看到——你可以读源码,算出分数,然后反向工程自己的内容策略。
这篇文章要做的,就是替你把源码嚼碎了喂到嘴里。14 个关键信号、三种 AI 智能体架构蓝图、声音风格防坑指南,以及用 Claude Code 搭建自优化创作工具的全流程。
📊 第一章:14 条推流暗语——源码不会说谎
X 的 Phoenix 排名器(2026 版本)对每条候选推文预测 15 种用户行为的概率,然后乘以权重求和。这个分数直接决定你的内容能不能出圈。
但 2023 版本泄露了 精确到小数点后一位的手调权重。2026 版本改用了学习权重,但结构不变。下面的数字来自源码,不是猜测。
🔴 高权重正向信号(权重 > 10)
| 信号 | 权重 | 相当于几个赞 | 源码出处 |
|---|---|---|---|
| 作者回复回复 | +75.0 | 150× | reply and author engaged |
| 直接回复 | +13.5 | 27× | reply |
| 资料页点击后互动 | +12.0 | 24× | profile_click |
| 优质点击(停留≥2分钟) | +10.0~11.0 | 22× | good click and stay |
| 收藏/书签 | +10.0 | 20× | bookmark |
核心洞察:一个回复链(你发推 → 有人回复 → 你再回复回去)的价值,等于 150 个赞。这不是"回复很重要"这种模糊的鸡汤,这是源码里硬编码的 weight = 75.0。
实战含义:
- 前 30 分钟是决定生死的窗口。源码里有 6 小时半衰期,但前 30 分钟的互动速度触发"病毒级联"——算法推断这条推文有爆发潜力,开始向网外用户推送。
- 回复不是评论区的副产品,它是主产品。每条推文都要设计成"会招来回复"的格式。问问题、给热评、留钩子、故意不完整。
- 回复了必须再回复。作者回复回复者的 +75 权重,是整场游戏里最高的正向信号。这意味着:你的评论区运营时间,和创作时间同等重要。
🟡 中等权重正向信号(权重 1~10)
| 信号 | 权重 | 相当于几个赞 | 备注 |
|---|---|---|---|
| 转发/引用 | +1.0 | 2× | repost / quote |
| 分享 | +1.0 | 2× | share |
| 点赞 | +0.5 | 1× | favorite —— 基线 |
| 视频观看到 50% | +0.2 | 0.4× | video_view |
| 点击展开 | +0.1 | 0.2× | click |
| 停留时间 | +0.1 | 0.2× | dwell |
核心洞察:赞是最便宜也最不值钱的信号。100 个赞的算法分数,低于 4 条回复(如果你每条都回复回去,触发 +75 × 4 = +300)。
实战含义:
- 别用赞数衡量成功。赞是虚荣指标,回复和收藏才是真金白银。
- 转发靠"可引用性"。设计一句可以被截屏、被引用、被当 meme 传播的话。人们转发不是为了帮你传播,是为了借你的嘴说自己的事。
- 视频要原生上传。外部 YouTube 链接产生零视频观看信号,相当于浪费了一个内容槽位。最佳长度 < 2 分 20 秒,竖屏 9:16。
🟢 格式乘数(隐式权重)
2023 版本的 RankingParams 函数里还有一堆布尔型 boost:
| 条件 | 乘数 | 源码字段 |
|---|---|---|
| 带图片 | ×2.0 | tweetHasImageUrlBoost |
| 带视频 | ×2.0 | tweetHasVideoUrlBoost |
| 直接关注的人发的 | ×4.0 | inDirectFollowBoost |
| 信任圈内的 | ×3.0 | inTrustedCireleBoost |
| 自己的推文 | ×2.0 | selfTweetBoost |
| 带趋势标签 | ×1.1 | tweetHasTrendBoost |
核心洞察:一张图不是"更好看",它在算法里值两个赞。一个直接关注者发的推,值四个赞。
实战含义:
- 每条推都配一张图。除非你有极强的纯文字把控力,否则不要裸发文字。图片乘数是免费的 2 倍杠杆。
- 但别超过 2 个 hashtag。
multipleHashtagsOrTrendsBoost = 0.6——多标签触发 spam 分类器,直接打 6 折。 - 外部链接是大坑。非 Premium 账号发外部链接,负向信号几乎可以抵消所有正向互动。把链接放个人资料或置顶推。
⚫ 负向信号(毁灭性权重)
| 信号 | 权重 | 相当于几个赞的负值 | 后果 |
|---|---|---|---|
| 举报 | −369.0 | −738× | 灾难级 |
| 静音/屏蔽/"显示更少" | −74.0 | −148× | 严重 |
| 屏蔽作者 | −3.0 | −6× | 重 |
| 静音作者 | −2.0 | −4× | 重 |
| 不感兴趣 | −1.0 | −2× | 中 |
核心洞察:X 的算法设计哲学不是"最大化互动",而是 "最大化长期留存"。一个让用户愤怒的推可能会骗到点击,但如果它导致屏蔽或静音,净分数是负的——算法宁肯不推它。
实战含义:
- 可以争议,不能惹人烦。有棱角的观点 = 高回复率 = 高分。但 crossing the line 到让人想屏蔽你 = 分数归零。
- 一个举报 = 738 个赞白攒。这意味着社区管理不是"礼仪问题",是数学问题。
📈 时间衰减:6 小时半衰期
ageDecayParams: slope = 0.005, base = 1.0
推文发布后大约每 6 小时失去一半的可见性分数。24 小时后算法推送基本归零。所以:
- 发帖时间 = 你的粉丝在线时间,不是你自己的方便时间。
- 前 30 分钟的互动速度决定病毒潜力。10 条回复在 15 分钟内 = 触发级联。
🧬 TweepCred:隐藏的信誉分
源码里有个叫 TweepCred 的系统,每天从用户互动图计算 PageRank 分数,范围 0~100。临界点:
- TweepCred < 65:每轮只被考虑 3 条推文
- 这意味着新账号疯狂关注 5000 人后低分发帖 = 几乎零出圈
提升 TweepCred:
- 关注策略性地关注领域内高信誉账号
- 与他们互动(回复、转发)
- 让粉丝/关注比自然增长
- 用同一设备、稳定行为模式
🤖 第二章:三种 AI 智能体架构——从手动到全自动
理解了信号,下一步是 让 AI 替你执行。不是写脚本定时发帖,而是构建一个理解 X 算法、能自我优化的创作智能体。
架构一:手动辅助层(Copilot 模式)
目标:AI 帮你优化单条推文,人在决策链顶端。
你写初稿
↓
AI 分析器:预估算法分数
- 预测各信号概率
- 计算 weighted score
- 对标历史高表现推文
↓
AI 优化器:给出改写建议
- "加个 hook 可以把回复率从 3% 提升到 8%"
- "配张图可以加 2x 乘数"
- "这结尾太完整了,留个缺口让人回复"
↓
你决定是否采纳 → 手动发布
Claude Code 实现方式:
# score_predictor.py
# 用开源权重模拟 Phoenix Scorer
def estimate_score(tweet_draft, author_history):
"""
基于源码权重预估单条推文的算法分数
"""
signals = {
'reply_prob': predict_reply(tweet_draft, author_history), # 用轻量模型或规则
'like_prob': predict_like(tweet_draft),
'retweet_prob': predict_retweet(tweet_draft),
'profile_click_prob': predict_profile_click(tweet_draft, author_history),
'dwell_prob': predict_dwell(tweet_draft),
}
weights = {
'reply': 13.5,
'author_reply_back': 75.0, # 如果作者承诺会回复
'profile_click': 12.0,
'like': 0.5,
'retweet': 1.0,
'dwell': 0.1,
}
# 格式乘数
multiplier = 1.0
if has_image(tweet_draft): multiplier *= 2.0
if has_video(tweet_draft): multiplier *= 2.0
if has_link(tweet_draft) and not is_premium: multiplier *= 0.3 # 链接惩罚
if count_hashtags(tweet_draft) > 2: multiplier *= 0.6
score = sum(signals[k] * weights[k] for k in signals) * multiplier
return score, signals, multiplier
这个层的价值:把"感觉这条会火"变成"这条预估分数 47.3,比你平均高 23%"。
架构二:半自动工作流(Agent 模式)
目标:AI 接管创作-优化-发布-监控闭环,人在关键节点 veto。
输入:主题 + 声音风格指南 + 当日热点
↓
内容生成器(Claude/GPT)
- 生成 3 个版本
- 每个版本针对不同信号优化(高回复版 / 高转发版 / 高收藏版)
↓
分数预估器
- 给 3 个版本打分
- 选择分数最高的
↓
定时发布器
- 根据粉丝活跃时间窗口自动排期
- 前 30 分钟触发高频监控
↓
发布后监控
- 实时抓取互动数据
- 如果 15 分钟内回复数 < 阈值 → 触发"作者回复"策略
- 如果 1 小时内表现超预期 → 标记为"高表现模板"存入库
↓
每日复盘
- 对比预测分数 vs 实际表现
- 校准预测模型
- 更新"声音风格指南"中的有效/无效模式
↓
人:每日查看报告, veto 或调整策略
Claude Code 实现方式:
# agent_loop.py
class XContentAgent:
def __init__(self, voice_guide, historical_data):
self.voice = voice_guide # 声音风格指南 JSON
self.history = historical_data # 过往推文 + 表现数据
self.predictor = ScorePredictor() # 架构一的预估器
self.templates = load_high_performing_templates()
def daily_cycle(self, topics, hot_trends):
# 1. 生成
drafts = self.generate_variants(topics, hot_trends, n=3)
# 2. 评分
scored = [(d, self.predictor.estimate_score(d, self.history)) for d in drafts]
best = max(scored, key=lambda x: x[1][0])
# 3. 提交给人审核
human_approved = self.submit_for_approval(best[0], best[1])
if human_approved:
self.schedule_post(best[0], optimal_time_window())
# 4. 监控(异步)
self.monitor_and_interact(best[0].id)
def monitor_and_interact(self, tweet_id):
"""发布后 30 分钟内的自动互动策略"""
for i in range(6): # 每 5 分钟检查一次,共 30 分钟
time.sleep(300)
stats = fetch_tweet_stats(tweet_id)
if stats['replies'] < 2 and i < 3:
# 前 15 分钟回复太少 → 作者主动回复置顶评论
self.post_reply(tweet_id, generate_followup_hook())
if stats['likes'] > 50 and stats['replies'] > 10:
# 表现好 → 标记模板
self.save_template(tweet_id, "high_performing")
这个层的价值:AI 不是替你写,而是替你 运营。人只负责 veto 和定方向。
架构三:全自动优化系统(Self-Evolving 模式)
目标:AI 自己发现问题、自己实验、自己学习,人只在月度回顾时介入。
持续运行的循环:
感知层
- 监控 X 平台趋势、你的互动数据、竞品账号表现
- 检测"信号漂移":算法权重是否更新(通过开源 repo 的 commit 历史)
策略层
- A/B 测试框架:自动运行对照实验
- 实验 1:hook 在开头 vs 在结尾
- 实验 2:短推 vs 线程
- 实验 3:带图 vs 纯文字(控制其他变量)
- 多臂老虎机(Multi-Armed Bandit)动态分配流量给表现好的变体
生成层
- 基于实验结果更新生成策略
- 自动淘汰低表现模板,繁衍高表现模板的变体
反馈层
- 实际互动数据 → 预测误差 → 模型再训练
- 每周自动 pull x-algorithm repo 最新代码 → 检查权重变更 → 调整策略
人:月度看板审查,调整目标(比如从"最大化回复"切换到"最大化收藏")
Claude Code 实现方式:
# self_evolving_system.py
class SelfEvolvingXAgent:
def __init__(self):
self.experiment_queue = [] # 待运行实验
self.template_population = [] # 模板种群
self.performance_db = PerformanceDB()
self.algorithm_watcher = AlgorithmWatcher(repo="xai-org/x-algorithm")
def weekly_cycle(self):
# 1. 检查算法更新
new_commits = self.algorithm_watcher.check_updates()
if new_commits:
self.parse_weight_changes(new_commits)
self.reprioritize_experiments()
# 2. 运行实验
for exp in self.experiment_queue[:5]: # 每周最多 5 个实验
self.run_ab_test(exp)
# 3. 进化模板
winners = self.performance_db.get_top_templates(k=10)
losers = self.performance_db.get_bottom_templates(k=10)
# 淘汰 + 繁衍
for loser in losers:
self.template_population.remove(loser)
for winner in winners:
mutations = self.mutate_template(winner, n=3)
self.template_population.extend(mutations)
# 4. 生成下周内容
upcoming_posts = self.generate_from_population(n=14) # 两周储备
# 5. 提交给人做月度审查
self.generate_monthly_report()
def mutate_template(self, template, n=3):
"""对高表现模板做受控变异"""
mutations = []
for i in range(n):
mutation_type = random.choice([
'hook_style', # 改变 hook 写法
'length', # 加长/缩短
'media_type', # 图→视频→纯文字
'call_to_action', # 改变结尾号召
'thread_vs_single' # 单推 vs 线程
])
mutated = apply_mutation(template, mutation_type)
mutations.append(mutated)
return mutations
这个层的价值:AI 不只是执行,它在 进化。你设一个目标函数(比如"30 天粉丝增长 10%"),它自己找到最优路径。
🎭 第三章:声音风格指南——为什么 90% 的 AI 推文一眼假
如果你用 GPT 直接生成 X 内容,读者三秒内就能嗅出"机味"。不是因为词汇选择,而是因为节奏和决策结构暴露了非人类特征。
AI 推文的 5 个致命特征
- 过度完整的句子。人类推文经常以"而且""但是"开头,或者半截句子。AI 倾向于写主谓宾齐全的段落。
- 均匀的节奏。人类写作有快有慢:短句爆发 + 长句拖尾。AI 喜欢均匀分布。
- 解释性结尾。人类抛出一个观点就走。AI 本能地觉得需要"总结一下"。
- 抽象名词堆砌。
- ❌ "这体现了系统性思维的重要性"
- ✅ "这种搞法,根子上的毛病是一个套路反复用"
- 缺乏具体锚点。人类的推文里总有随机细节:一个数字、一个品牌名、一个具体场景。AI 倾向于泛化。
声音风格指南模板
给你的 AI 智能体一份"人格宪法":
{
"voice_profile": {
"identity": "30岁技术从业者,带点理想主义,偶尔暴躁",
"sentence_structure": {
"short_burst_ratio": 0.4, // 40% 的句子 ≤ 10 字
"fragment_ratio": 0.2, // 20% 的句子不完整
"start_with_conjunction": 0.15, // 15% 以"而且/但是/其实"开头
"no_period_at_end": 0.1 // 10% 没有句号结尾
},
"vocabulary": {
"avoid": ["系统性", "方法论", "底层逻辑", "赋能", "抓手", "闭环"],
"prefer": ["搞法", "路子", "根子", "门道", "猫腻", "火候"],
"catchphrases": ["说实话", "说白了", "说白了就一句", "这事儿怪得很"]
},
"opinion_strength": 0.8, // 0=完全中立, 1=每句都带刺
"self_deprecation": 0.3, // 偶尔自嘲
"emoji_policy": "sparse_and_specific", // 不用通用😂,只用🤔💀🔥
"reference_range": "2020-2026_pop_culture_and_tech" // 引用范围
},
"content_constraints": {
"max_chars": 280,
"hook_position": "first_20_chars", // hook 必须在前 20 字
"incomplete_ending": true, // 结尾故意不完整,留回复空间
"data_anchor_required": true, // 每条推至少一个具体数字/事实/品牌
"thread_max_length": 5 // 线程最多 5 条,超过就拆分
}
}
主题一致性:算法信任你的前提
X 的 2026 版本引入了 SimClusters(模拟集群)——基于稀疏嵌入的社区发现系统。算法会判断你属于哪个"话题集群",然后主要推给那个集群的用户。
这意味着:主题漂移 = 流量腰斩。
如果你平时发 AI 内容,突然开始发健身打卡,算法不会推给那些对健身感兴趣的人——它不确定该把你放进哪个集群。
主题一致性策略:
- 70% 核心内容:你的主力领域(比如 AI/创业)
- 20% 相邻领域:与核心领域有逻辑关联的内容(AI 伦理、开发者工具)
- 10% 人格内容:展示你是活人,但不偏离整体调性
不要用 AI 生成分散主题的内容。让 AI 在一个窄域里深耕,比广撒网有效 10 倍。
⚠️ 第四章:避坑指南——这些雷踩一个就白干
坑 1:外部链接黑洞
非 Premium 账号发外部链接,算法给负向信号,而且这个负向值大到可以抵消几十个赞。把链接放个人资料或置顶推。 主文只发观点,引流靠资料页。
坑 2:Hashtag spam
超过 2 个 hashtag 触发 Grox spam 分类器,乘数直接打 6 折。最多 1-2 个,而且要极度相关。
坑 3:回复了不回
有人回复你 = +13.5 权重。你再回复回去 = +75 权重。但如果你不回,那 +13.5 就浪费了。前 30 分钟每条回复都回。
坑 4:时间窗口浪费
周末下午发帖 = 你的粉丝可能不在线 = 前 30 分钟没互动 = 算法不级联。用数据找你的粉丝活跃时间,不是凭感觉。
坑 5:线程过长
3-5 推的线程比单推多 40-60% 曝光。但超过 7 推,完成率暴跌,反而降低整体分数。线程控制在 3-5 推。
坑 6:忽视负向信号
一条被举报的推 = -369 权重 = 你白攒了 738 个赞。这意味着:
- 不要故意激怒人(争议和激怒是两回事)
- 不要发有误导性的标题党
- 不要碰会被大量举报的话题(除非这是你主动选择的策略)
坑 7:算法更新不跟踪
xAI 每四周更新一次开源代码。权重会变,新信号会加。如果你按 2023 年的策略运营 2026 年的算法,就是在用旧地图走新路。
解决方案:设置一个自动化流程,每周 pull xai-org/x-algorithm 的最新 commit,diff 关键文件(尤其是 phoenix/ 和 home-mixer/),检测权重变更。
📈 第五章:核心指标——你该盯什么数字
| 指标 | 目标值 | 为什么重要 | 算法关联 |
|---|---|---|---|
| 回复率(回复数/曝光数) | > 3% | 最高权重信号 | +13.5 / +75 |
| 前 30 分钟回复速度 | ≥ 5 条 | 触发病毒级联 | 级联阈值 |
| 资料页点击率 | > 2% | 高权重信号 | +12.0 |
| 收藏率 | > 1% | 强意图指标 | +10.0 |
| 线程完成率 | > 40% | 2025 年新信号 | 多段 dwell 累积 |
| 负向率(屏蔽/静音/举报) | < 0.1% | 毁灭性惩罚 | −74 / −369 |
| TweepCred 分数 | > 65 | 出圈门槛 | <65 = 每轮只考虑 3 条 |
| 主题一致性分 | > 0.8 | SimClusters 信任度 | 漂移 = 腰斩 |
每周检查清单
- 拉出上周所有推文,计算上述 8 个指标
- 识别"异常高/低"表现的推文,提取模式
- 检查
xai-org/x-algorithm本周 commit - 更新声音风格指南中的"有效/无效"词汇表
- 校准预测模型(对比预估分数 vs 实际表现)
🔧 附录:Claude Code 快速启动模板
# 1. 克隆 X 算法仓库
gh repo clone xai-org/x-algorithm
# 2. 创建你的 AI 智能体项目
mkdir x-agent && cd x-agent
# 3. 初始化 Claude Code 项目
claude init
# 4. 核心文件结构
x-agent/
├── voice_guide.json # 声音风格指南
├── algorithm_weights.py # 从源码提取的权重表
├── score_predictor.py # 推文分数预估器
├── content_generator.py # 内容生成器(带约束)
├── post_scheduler.py # 定时发布 + 监控
├── ab_test_framework.py # 实验框架
├── algorithm_watcher.py # 源码更新监控
└── dashboard.py # 表现看板
# 5. 让 Claude Code 帮你实现
claude "帮我实现 score_predictor.py,基于 x-algorithm/phoenix/ 的权重结构"
claude "帮我实现 algorithm_watcher.py,每周检查 xai-org/x-algorithm 的新 commit"
结语
X 的开源算法不是给技术人员的玩具,是给创作者的操作手册。当你知道一条回复值 150 个赞、一个举报值 −738 个赞、前 30 分钟决定生死——你就不再是在"猜算法",你是在用算法。
AI 智能体的价值不是替你写推文。价值在于:
- 把直觉变成数字(预估分数)
- 把手动变成自动(监控 + 互动)
- 把经验变成进化(A/B 测试 + 模板繁衍)
当你读完源码、搭好系统、跑起循环——你的竞争对手还在猜。而你已经知道了答案。
"The algorithm will literally read every post..."
现在,你也读完了算法。
参考来源
- X Recommendation Algorithm (2023):
github.com/twitter/the-algorithm - X Recommendation Algorithm (2026):
github.com/xai-org/x-algorithm - The Ultimate Guide to Twitter's Algorithm (Dev.to, 2026)
- X Algorithm: Open Source Analysis (Opentweet, 2026)
- Singh Ajit: X Algorithm System Design (2026)
#X算法 #推荐系统 #开源 #AI智能体 #内容策略 #ClaudeCode #推流信号 #创作者增长 #算法透明
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。