你深夜滑开手机,X的“For You”页面像一个懂你的老友,总能递上恰好戳中你笑点或思考的那条推文。它不是随机乱喂,而是由一个几乎全靠Grok大模型驱动的推荐系统精心烹饪而成。这套系统将你关注的人(内网)和全平台海量内容(外网)混合在一起,用一个基于Grok-1的Transformer模型预测你最可能喜欢的帖子——点赞、回复、转推、停留时间,甚至负面行为如屏蔽或举报,都被量化成概率,最终合成一个分数,决定这条推文能否出现在你的时间线。
这不是科幻,而是X在2024-2025年间逐步开源的核心推荐算法。下面,我们像探秘一场私人晚宴一样,一步步揭开这套系统的幕后运作。
每当你刷新“For You”页面,一个名为Home Mixer的服务就会被唤醒。它像一位总管家,负责协调整个推荐流程:先收集你的“口味档案”(最近点赞、回复、转推的历史,以及关注列表),再同时向两个“厨房”下单——一个是熟人厨房(Thunder),一个是全球食材库(Phoenix),取回候选推文;接着让助手们为每条推文补齐配料(作者信息、媒体类型、视频时长等);然后严格筛查(去重、去老帖、去屏蔽作者等);最后交给Grok模型打分、加权、调多样性,最终挑选出最顶尖的十几二十条,装盘端上。
整个流程高度并行,错误容错机制完善,即使某个环节卡壳也不会让整桌菜凉掉。
Thunder是一个超低延迟的内存帖子库。它实时订阅全平台的新推文事件(通过Kafka),为每个用户维护最近一段时间内其关注账号发布的原创帖、回复、转推、视频等。查询时,只要输入你的关注列表,就能毫秒级返回所有“熟人新动态”。
这部分内容天然有社交信任感:你关注的人大概率和你兴趣相近,所以Thunder提供的候选通常质量很高,且几乎没有冷启动问题。
Phoenix是这套系统中真正的AI明星,分担两项重任:
模型输出十几种行为的概率:
P(点赞)、P(回复)、P(转推)、P(引用)、P(点击)、P(点开作者主页)、P(视频完整观看)、P(展开图片)、P(分享)、P(长时停留)、P(关注作者),以及负面信号P(不感兴趣)、P(屏蔽作者)、P(静音作者)、P(举报)。
最终得分不是单一“相关度”,而是:
Final Score = Σ (weight_i × P(action_i))
正面行为权重为正,负面为负。权重由实验不断调优,反映不同行为的长期留存价值。例如,长时停留和视频完整观看往往权重更高,因为它们暗示深度内容消费。
此外还有作者多样性衰减:如果同一作者连续多条高分,会自动降低后续得分,防止你的时间线被一个人霸屏。这就像宴会主人刻意把不同圈子的朋友分散坐开,让对话更丰富。
过滤分两波:
预评分过滤(确保候选池干净):
这套系统最激进的地方在于彻底抛弃手工特征和大部分启发式规则。以前的推荐系统往往有数百上千个人工设计的特征(发帖时间、是否有媒体、作者粉丝数、关键词匹配等),容易引入工程师偏见且难以维护。现在,全靠Grok Transformer从原始互动序列中自己学到“什么是好内容”。这让系统更纯粹、更能适应用户口味的快速变化。
另外:
X的“For You”页面本质上是一场持续进行的个性化实验:它用你自己的行为训练一个专属的Grok副本,试图猜透你下一秒想看什么。同时通过多样性衰减、外网探索、负面信号惩罚,避免把你困在信息茧房。
下次你刷到一条“怎么这么懂我”的推文时,可以微微一笑——背后不是运气,而是一个几乎全由Grok驱动、极简却精密的推荐系统,正在默默为你服务。