您正在查看静态缓存页面 · 查看完整动态版本 · 登录 参与讨论

Grok的隐秘盛宴:X平台“How For You”页面如何为你精准投喂信息

✨步子哥 (steper) 2026年01月20日 09:51 0 次浏览

你深夜滑开手机,X的“For You”页面像一个懂你的老友,总能递上恰好戳中你笑点或思考的那条推文。它不是随机乱喂,而是由一个几乎全靠Grok大模型驱动的推荐系统精心烹饪而成。这套系统将你关注的人(内网)和全平台海量内容(外网)混合在一起,用一个基于Grok-1的Transformer模型预测你最可能喜欢的帖子——点赞、回复、转推、停留时间,甚至负面行为如屏蔽或举报,都被量化成概率,最终合成一个分数,决定这条推文能否出现在你的时间线。

这不是科幻,而是X在2024-2025年间逐步开源的核心推荐算法。下面,我们像探秘一场私人晚宴一样,一步步揭开这套系统的幕后运作。

🏠 指挥大厅:Home Mixer的全局调度

每当你刷新“For You”页面,一个名为Home Mixer的服务就会被唤醒。它像一位总管家,负责协调整个推荐流程:先收集你的“口味档案”(最近点赞、回复、转推的历史,以及关注列表),再同时向两个“厨房”下单——一个是熟人厨房(Thunder),一个是全球食材库(Phoenix),取回候选推文;接着让助手们为每条推文补齐配料(作者信息、媒体类型、视频时长等);然后严格筛查(去重、去老帖、去屏蔽作者等);最后交给Grok模型打分、加权、调多样性,最终挑选出最顶尖的十几二十条,装盘端上。

整个流程高度并行,错误容错机制完善,即使某个环节卡壳也不会让整桌菜凉掉。

⚡ 熟人厨房:Thunder的实时内网供应

Thunder是一个超低延迟的内存帖子库。它实时订阅全平台的新推文事件(通过Kafka),为每个用户维护最近一段时间内其关注账号发布的原创帖、回复、转推、视频等。查询时,只要输入你的关注列表,就能毫秒级返回所有“熟人新动态”。

这部分内容天然有社交信任感:你关注的人大概率和你兴趣相近,所以Thunder提供的候选通常质量很高,且几乎没有冷启动问题。

🌍 全球食材库:Phoenix的双重魔法

Phoenix是这套系统中真正的AI明星,分担两项重任:

  1. 检索阶段(Two-Tower模型)
一个“用户塔”把你的关注列表、历史互动编码成高维向量;一个“帖子塔”把全平台每条新推文也编码成同样维度的向量。两者点积相似度最高的前K条,就是最可能对你胃口的“陌生佳肴”。这种双塔结构让检索极快,能在海量库中秒级命中。
  1. 排序阶段(Grok-based Transformer)
拿到候选后,Phoenix把你的互动历史序列(而不是简单汇总)作为上下文,逐条输入一个特制的Transformer。关键设计:候选推文之间互相“看不见”(注意力掩码隔离),只能看见用户上下文。这样每条推文的得分完全独立,不受同批其他推文影响,保证分数一致、可缓存、可解释。

模型输出十几种行为的概率:
P(点赞)、P(回复)、P(转推)、P(引用)、P(点击)、P(点开作者主页)、P(视频完整观看)、P(展开图片)、P(分享)、P(长时停留)、P(关注作者),以及负面信号P(不感兴趣)、P(屏蔽作者)、P(静音作者)、P(举报)。

⚖️ 打分秘方:多行为加权与多样性调味

最终得分不是单一“相关度”,而是:

Final Score = Σ (weight_i × P(action_i))

正面行为权重为正,负面为负。权重由实验不断调优,反映不同行为的长期留存价值。例如,长时停留和视频完整观看往往权重更高,因为它们暗示深度内容消费。

此外还有作者多样性衰减:如果同一作者连续多条高分,会自动降低后续得分,防止你的时间线被一个人霸屏。这就像宴会主人刻意把不同圈子的朋友分散坐开,让对话更丰富。

🚫 双重关卡:预过滤与后过滤

过滤分两波:

预评分过滤(确保候选池干净):

  • 去重(包括转推同一内容)
  • 去太老帖子
  • 去自己发的帖
  • 去被屏蔽/静音作者
  • 去包含静音关键词
  • 去已看或本会话已推送
  • 去无权访问的订阅墙内容

后选择过滤(最终安全审核):
  • 删除已删、垃圾、暴力、血腥等违规内容
  • 对话线程内去重(避免同一话题多条分支重复出现)

💡 核心设计哲学:极简、端到端、可进化

这套系统最激进的地方在于彻底抛弃手工特征和大部分启发式规则。以前的推荐系统往往有数百上千个人工设计的特征(发帖时间、是否有媒体、作者粉丝数、关键词匹配等),容易引入工程师偏见且难以维护。现在,全靠Grok Transformer从原始互动序列中自己学到“什么是好内容”。这让系统更纯粹、更能适应用户口味的快速变化。

另外:

  • 候选隔离保证分数稳定性
  • 多行为预测比单一分数更细腻
  • 哈希嵌入加速向量查找
  • 可组合管道框架让新增来源、过滤、评分模块像搭积木一样简单

🎯 结语:个性化与多样性的微妙平衡

X的“For You”页面本质上是一场持续进行的个性化实验:它用你自己的行为训练一个专属的Grok副本,试图猜透你下一秒想看什么。同时通过多样性衰减、外网探索、负面信号惩罚,避免把你困在信息茧房。

下次你刷到一条“怎么这么懂我”的推文时,可以微微一笑——背后不是运气,而是一个几乎全由Grok驱动、极简却精密的推荐系统,正在默默为你服务。


参考文献

  1. X For You Feed Algorithm Repository (核心系统概述与架构描述)
  2. Grok-1 Open Source Release by xAI (排名模型所基于的Transformer实现)
  3. Phoenix Component Documentation (检索双塔与排序Transformer详细设计)
  4. Home Mixer & Candidate Pipeline Framework (管道编排与可组合模块设计)
  5. Key Design Decisions Section (无手工特征、候选隔离、多行为预测等原则说明)

讨论回复

2 条回复
✨步子哥 (steper) #1
01-20 09:52

https://github.com/xai-org/x-algorithm

✨步子哥 (steper) #2
01-20 09:52

https://github.com/linkerlin/x-algorithm-php