Loading...
正在加载...
请稍候

Grok的隐秘盛宴:X平台“How For You”页面如何为你精准投喂信息

✨步子哥 (steper) 2026年01月20日 09:51
你深夜滑开手机,X的“For You”页面像一个懂你的老友,总能递上恰好戳中你笑点或思考的那条推文。它不是随机乱喂,而是由一个几乎全靠Grok大模型驱动的推荐系统精心烹饪而成。这套系统将你关注的人(内网)和全平台海量内容(外网)混合在一起,用一个基于Grok-1的Transformer模型预测你最可能喜欢的帖子——点赞、回复、转推、停留时间,甚至负面行为如屏蔽或举报,都被量化成概率,最终合成一个分数,决定这条推文能否出现在你的时间线。 这不是科幻,而是X在2024-2025年间逐步开源的核心推荐算法。下面,我们像探秘一场私人晚宴一样,一步步揭开这套系统的幕后运作。 ### 🏠 指挥大厅:Home Mixer的全局调度 每当你刷新“For You”页面,一个名为**Home Mixer**的服务就会被唤醒。它像一位总管家,负责协调整个推荐流程:先收集你的“口味档案”(最近点赞、回复、转推的历史,以及关注列表),再同时向两个“厨房”下单——一个是熟人厨房(Thunder),一个是全球食材库(Phoenix),取回候选推文;接着让助手们为每条推文补齐配料(作者信息、媒体类型、视频时长等);然后严格筛查(去重、去老帖、去屏蔽作者等);最后交给Grok模型打分、加权、调多样性,最终挑选出最顶尖的十几二十条,装盘端上。 整个流程高度并行,错误容错机制完善,即使某个环节卡壳也不会让整桌菜凉掉。 ### ⚡ 熟人厨房:Thunder的实时内网供应 **Thunder**是一个超低延迟的内存帖子库。它实时订阅全平台的新推文事件(通过Kafka),为每个用户维护最近一段时间内其关注账号发布的原创帖、回复、转推、视频等。查询时,只要输入你的关注列表,就能毫秒级返回所有“熟人新动态”。 这部分内容天然有社交信任感:你关注的人大概率和你兴趣相近,所以Thunder提供的候选通常质量很高,且几乎没有冷启动问题。 ### 🌍 全球食材库:Phoenix的双重魔法 **Phoenix**是这套系统中真正的AI明星,分担两项重任: 1. **检索阶段(Two-Tower模型)** 一个“用户塔”把你的关注列表、历史互动编码成高维向量;一个“帖子塔”把全平台每条新推文也编码成同样维度的向量。两者点积相似度最高的前K条,就是最可能对你胃口的“陌生佳肴”。这种双塔结构让检索极快,能在海量库中秒级命中。 2. **排序阶段(Grok-based Transformer)** 拿到候选后,Phoenix把你的互动历史序列(而不是简单汇总)作为上下文,逐条输入一个特制的Transformer。关键设计:候选推文之间互相“看不见”(注意力掩码隔离),只能看见用户上下文。这样每条推文的得分完全独立,不受同批其他推文影响,保证分数一致、可缓存、可解释。 模型输出十几种行为的概率: P(点赞)、P(回复)、P(转推)、P(引用)、P(点击)、P(点开作者主页)、P(视频完整观看)、P(展开图片)、P(分享)、P(长时停留)、P(关注作者),以及负面信号P(不感兴趣)、P(屏蔽作者)、P(静音作者)、P(举报)。 ### ⚖️ 打分秘方:多行为加权与多样性调味 最终得分不是单一“相关度”,而是: ``` Final Score = Σ (weight_i × P(action_i)) ``` 正面行为权重为正,负面为负。权重由实验不断调优,反映不同行为的长期留存价值。例如,长时停留和视频完整观看往往权重更高,因为它们暗示深度内容消费。 此外还有**作者多样性衰减**:如果同一作者连续多条高分,会自动降低后续得分,防止你的时间线被一个人霸屏。这就像宴会主人刻意把不同圈子的朋友分散坐开,让对话更丰富。 ### 🚫 双重关卡:预过滤与后过滤 过滤分两波: **预评分过滤**(确保候选池干净): - 去重(包括转推同一内容) - 去太老帖子 - 去自己发的帖 - 去被屏蔽/静音作者 - 去包含静音关键词 - 去已看或本会话已推送 - 去无权访问的订阅墙内容 **后选择过滤**(最终安全审核): - 删除已删、垃圾、暴力、血腥等违规内容 - 对话线程内去重(避免同一话题多条分支重复出现) ### 💡 核心设计哲学:极简、端到端、可进化 这套系统最激进的地方在于**彻底抛弃手工特征和大部分启发式规则**。以前的推荐系统往往有数百上千个人工设计的特征(发帖时间、是否有媒体、作者粉丝数、关键词匹配等),容易引入工程师偏见且难以维护。现在,全靠Grok Transformer从原始互动序列中自己学到“什么是好内容”。这让系统更纯粹、更能适应用户口味的快速变化。 另外: - **候选隔离**保证分数稳定性 - **多行为预测**比单一分数更细腻 - **哈希嵌入**加速向量查找 - **可组合管道框架**让新增来源、过滤、评分模块像搭积木一样简单 ### 🎯 结语:个性化与多样性的微妙平衡 X的“For You”页面本质上是一场持续进行的个性化实验:它用你自己的行为训练一个专属的Grok副本,试图猜透你下一秒想看什么。同时通过多样性衰减、外网探索、负面信号惩罚,避免把你困在信息茧房。 下次你刷到一条“怎么这么懂我”的推文时,可以微微一笑——背后不是运气,而是一个几乎全由Grok驱动、极简却精密的推荐系统,正在默默为你服务。 ------ ### 参考文献 1. X For You Feed Algorithm Repository (核心系统概述与架构描述) 2. Grok-1 Open Source Release by xAI (排名模型所基于的Transformer实现) 3. Phoenix Component Documentation (检索双塔与排序Transformer详细设计) 4. Home Mixer & Candidate Pipeline Framework (管道编排与可组合模块设计) 5. Key Design Decisions Section (无手工特征、候选隔离、多行为预测等原则说明)

讨论回复

2 条回复
✨步子哥 (steper) #1
01-20 09:52
https://github.com/xai-org/x-algorithm
✨步子哥 (steper) #2
01-20 09:52
https://github.com/linkerlin/x-algorithm-php