網站地圖 - 關于我們
您的當前位置: 首頁 > 科技 正文

馬斯克開源Twitter推薦算法,GitHub秒破萬星

作者:用戶投稿 時間:2023-04-04 06:30 點擊:
導讀:金磊 發自 凹非寺量子位 | 公眾號 QbitAI馬斯克的“開源承諾”,終于如約而至。就在剛剛,馬斯克正式宣布:大部分(Twitter的)推薦算法將在今天開源,

金磊 發自 凹非寺

量子位 | 公眾號 QbitAI

馬斯克的“開源承諾”,終于如約而至。

就在剛剛,馬斯克正式宣布:

大部分(Twitter的)推薦算法將在今天開源,剩下的也會跟進。

馬斯克開源Twitter推薦算法,GitHub秒破萬星

而且馬斯克緊接著亮出了GitHub上Twitter推薦算法源代碼的地址。

僅僅數小時,便攬獲上萬個Star:

馬斯克開源Twitter推薦算法,GitHub秒破萬星

除此之外,馬斯克還表示:

推特將每24到48小時更新一次基于用戶建議的推薦算法。

馬斯克開源Twitter推薦算法,GitHub秒破萬星

至此,這個號稱每天從5億條推文做推薦的大算法的廬山真面目,終于得以露出。

Twitter的推薦算法長什么樣?

據介紹,Twitter的推薦系統基于一組核心模型和功能,可以從推文、用戶和互動數據中提取潛在信息。

這些模型的作用是回答Twitter網絡中的重要問題,例如,“未來你與另一個用戶互動的概率是多少?”或者,“Twitter上有哪些社區以及其中的趨勢推文是什么?”

若是能夠準確回答這些問題,就可以讓Twitter提供更多相關的推薦。

Twitter的推薦系統由三大部分構成:

  • 從不同的推薦源獲取最好的推文,這個過程稱為候選源。
  • 使用機器學習模型對每條推文進行排名。
  • 應用heuristics和filters,例如過濾來自已屏蔽用戶的推文、NSFW內容和已看到的推文。

負責構建和提供“For You”時間軸的服務被稱為“Home Mixer”。

“Home Mixer”建立在“Product Mixer”之上,這是定制的Scala框架,有助于構建內容的動態流。

這項服務作為軟件主干,連接不同的候選源、評分函數、heuristics和filters。

馬斯克開源Twitter推薦算法,GitHub秒破萬星

候選源(Candidate Sources)

Twitter使用多個候選源來為用戶檢索最近和相關的推文。

對于每個請求,推特嘗試通過這些源從數億條推文池中提取最佳的1500條。

從您關注的人(內部網絡)和不關注的人(外部網絡)中尋找候選人。

如今,“為您推薦”時間軸平均由50%的內部網絡推文和50%的外部網絡推文組成(盡管這可能因用戶而異)。

內部網絡資源(In-Network Source)

內部網絡資源是最大的候選來源,旨在提供關注的用戶最相關、最新的推文。

它使用邏輯回歸模型高效地對關注的人的推文進行排名,以其相關性為基礎。然后將排名最高的推文發送到下一階段。

排名內部網絡推文最重要的組成部分是Real Graph。

Real Graph是一種模型,用于預測兩個用戶之間的互動可能性。用戶和推文作者之間的Real Graph分數越高,就會包括更多他們的推文。

內部網絡來源最近成為Twitter的研究對象。最近Twitter停止使用Fanout服務,這是一個12年前用來從每個用戶的推文緩存中提供內部網絡推文的服務。

馬斯克開源Twitter推薦算法,GitHub秒破萬星

外部網絡資源(Out-of-Network Sources)

在用戶網絡之外尋找相關的推文是一個棘手的問題。

因為如果你不關注作者,怎么知道某條推文是否與你相關?

為此,Twitter采取了兩種方法來解決這個問題。

一個是社交圖(Social Graph)。

這個方法是通過分析你關注的人或有相似興趣的人的活動,來估計你會發現什么是相關的。

主要遍歷參與的圖,并按照以下步驟回答以下問題:

  • 我關注的人最近在Twitter上發了什么消息?
  • 誰和我一樣喜歡類似的推文,他們最近還喜歡什么?

團隊根據這些問題的答案生成候選推文,并使用Logit模型對產生的推文進行排名。

這種類型的圖形遍歷對于外部網絡推薦是必不可少的;團隊開發了 GraphJet,一個維護用戶和推文之間實時交互圖的圖形處理引擎,來執行這些遍歷。

雖然這種搜索Twitter參與和關注網絡的啟發式方法已經被證明是有用的,但嵌入式空間方法已經成為外部網絡推文的更大來源。

第二個是嵌入空間(Embedding Spaces)

嵌入式空間方法旨在回答一個關于內容相似性的更普遍的問題——什么推文和用戶與我的興趣相似?

Embeddings通過生成用戶興趣和推文內容的數字表示來工作。然后可以計算這個嵌入空間中任意兩個用戶之間的相似度,推文或用戶-推文 對。

只要生成準確的embedding,就可以使用這種相似性作為相關性的替代。

Twitter 最有用的嵌入空間之一是 SimClusters。

SimClusters 使用自定義矩陣分解算法發現由一群有影響力的用戶錨定的社區(有14.5萬個社區,每三周更新一次)。

用戶和推文在社區空間中表示,并且可以屬于多個社區。社區的規模從個人朋友群的幾千名用戶到新聞或流行文化的數億用戶不等:

馬斯克開源Twitter推薦算法,GitHub秒破萬星

……

更多與之相關的詳細內容,可戳文末鏈接~

One More Thing

Twitter的算法開源了,然后手快的網友吧……都已經開始根據算法總結怎么成為大V了:

你關注的人數和關注你的人數比例很重要、訂閱TwitterBlue有一定作用……

馬斯克開源Twitter推薦算法,GitHub秒破萬星

參考鏈接:

[1]https://blog.twitter.com/engineering/en_us/topics/open-source/2023/twitter-recommendation-algorithm

[2]https://github.com/twitter/the-algorithm

[3]https://twitter.com/elonmusk/status/1641874582473695246

[4]https://twitter.com/steventey/status/1641892386564640768?s=46&t=iTysI4vQLQqCNJjSmBODPw

— 完 —

量子位 QbitAI · 頭條號簽約

打賞

取消

感謝您的支持,我會繼續努力的!

掃碼支持
掃碼打賞,你說多少就多少

打開支付寶掃一掃,即可進行掃碼打賞哦

相關推薦:

網友評論:

推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件

欄目分類
Copyright ? 2021 早報網 版權所有
蘇ICP備2024138443號

蘇公網安備32130202081338號

本網站所刊載信息,不代表早報網觀點。如您發現內容涉嫌侵權違法立即與我們聯系客服 106291126@qq.com 對其相關內容進行刪除。
早報網登載文章只用于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。
《早報網》官方網站:www.www.www126mk.com互聯網違法和不良信息舉報中心
Top 主站蜘蛛池模板: 国产精品白浆在线播放| 亚洲熟妇av一区二区三区宅男| 狠狠穞老司机的福67194| 亚洲美女视频一区二区三区| 欧美黑人bbbbbbbbb| 亚洲伊人久久大香线蕉在观| 日韩精品无码一区二区三区 | 健身私教弄了我好几次怎么办| 精品一区二区三区在线观看视频| 午夜理论影院第九电影院| 男人j放进女人p全黄| 人人妻人人做人人爽| 欧美日本免费一区二区三区| 亚洲最大的黄色网| 最近免费中文字幕大全高清10 | 男女一边做一边爽免费视频| 亚洲熟女少妇一区二区| 欧美XXXX黑人又粗又长精品| 久久伊人中文字幕| 岳的奶大又白又胖| 91黑丝国产线观看免费| 国产男人午夜视频在线观看| 被公侵犯肉体中文字幕电影| 内射老妇BBWX0C0CK| 浮力国产第一页| 亚洲av第一网站久章草| 日本三级高清电影全部| 一级特黄女人生活片| 国内色综合精品视频在线| 欧美色图亚洲激情| 国产国语在线播放视频| 精品深夜av无码一区二区老年 | 亚洲国产精品久久久久久| 日韩av片无码一区二区三区不卡 | 黄a大片av永久免费| 四虎影视成人永久在线观看| 精品少妇ay一区二区三区| 亚洲欧美精品中文字幕| 日韩欧美视频二区| 一级做a爰全过程免费视频 | freefron性中国国产高清|