撰文:KarenZ,Foresight News
馬斯克把推特的推薦系統從「人工堆砌規則和大部分啟發式算法」改成了「純靠 AI 大模型猜你喜歡」?
1 月 20 日,推特(X)正式披露新推薦算法,即推特首頁「為你推薦」(For You)時間線背後的邏輯。
簡單來說,現在的算法是:把「你關注的人發的內容」和「全網可能對你胃口的內容」混在一起,根據你之前在 X 上的一連串點讚、評論等動作按對你的吸引力排好序,中間經過兩次過濾,最終變成你刷到的推薦資訊流。
以下是用大白話翻譯的核心邏輯:
建立画像
系統首先收集用戶的上下文資訊,為後續的推薦建立「画像」:
用戶行為序列: 歷史互動記錄(點讚、轉發、停留時長等)。
用戶特徵: 关注列表、個人偏好設定等。
內容從哪來?
每當你刷新「為你推薦」時間線時,算法會從以下兩個地方找內容:
熟人圈(Thunder): 你關注的人發的推文。
陌生人圈(Phoenix): 你沒關注,但 AI 會根據你的口味,去茫茫人海中把你可能感興趣的貼文(哪怕你沒關注作者)撈出來。
這兩堆內容會混在一起,就是候選推文。
資料補全和初步過濾
撈上來成千上萬條貼文後,系統會拉取貼文的完整元資料(作者資訊、媒體檔案、核心文本),這一流程叫 Hydration。然後會先進行一輪快速清洗,剔除重複內容、舊帖、用戶自己發的貼文、已拉黑作者的內容或屏蔽關鍵詞的內容。
這一步是為了節省計算資源,避免無效內容進入核心打分環節。
怎麼打分?
這是最關鍵的部分。基於 Phoenix Grok 的 Transformer 模型會盯著每一條過濾後剩餘的候選貼文,計算你對它做各種動作的概率。這是一個加分與減分的遊戲:
加分項(正向反饋): AI 觉得你可能會點讚、轉發、回覆、點擊圖片、或者點進主頁看。
減分項(負向反饋): AI 觉得你可能會拉黑作者、Mute、舉報。
最終得分 = (點讚概率 × 權重) + (回覆概率 × 權重) - (拉黑概率 × 權重)…
值得注意的是,新推薦算法中 Author Diversity Scorer(作者多樣性打分器)通常會在 AI 算完最終得分之後介入。當檢測到某一批候選貼文裡,有同一個作者的多篇內容時,這個工具會自動「壓低」該作者後續帖子的分數,讓你刷到的作者更多元。
最後,根據按得分排序,挑分數最高的一批貼文。
二次過濾
系統把打分最高的前多少個貼文再檢查一遍,過濾掉違規的(比如垃圾郵件、暴力內容)、給同一個 thread 的多個分支去重,最後按分數從高到低排好,變成你看到的資訊流。
小結
X 已經在推薦系統中剔除了所有人工設計的功能和大部分啟發式算法。新算法的核心進步在於「讓 AI 自主學習用戶偏好」,實現了從「告訴機器怎麼做」到「讓機器自己學會怎麼做」的跨越。
首先是推薦更精準,「多維度預判」更貼合真實需求。新算法則靠 Grok 大模型預測多種用戶行為 —— 不僅算「會不會點讚 / 轉發」,還會算「會不會點進連結看」、「停留如何」、「會不會關注作者」,甚至會預判「會不會舉報 / 拉黑」。這種精細化的研判,讓推薦內容與用戶潛意識需求的貼合度達到了前所未有的高度。
其次,算法機制相對更公平,在一定程度上可以打破「大號壟斷」的魔咒,給新號、小號更多機會:過去的「啟發式算法」有個致命問題:大號靠歷史高互動量,發什麼內容都能獲得高曝光,新號即使內容優質,也因為「沒資料積累」被埋沒。候選隔離機制讓每條貼文獨立打分,和「同批次其他內容是不是爆款」無關。同時,Author Diversity Scorer 也會降低同一作者同一批次後續貼文的刷屏行為。
對於 X 公司: 這是一次降本增效的舉措,用算力換人力,用 AI 換留存。對用戶而言,我們面對的是一個時刻揣摩人心的「超級大腦」。它越懂我們,我們越離不開它,但也正因為它太懂我們,我們將更深地陷入算法編織的「資訊茧房」,並更容易成為情緒化內容的精準捕獲對象。