日本在线免费视频,国产精品视频2020,亚洲一区二区色,亚洲精品在线播放

小紅書首頁推薦怎么上 詳細講解:小紅書上首頁推薦及熱門方法

最近比較忙,今天韓潤澤又抽時間給大家帶來了小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法干貨,以及關于小紅書首頁等等一系列的相關事項,希望各位能認真閱讀。因為,只有這樣才能真正理解和掌握!

本文整理自2019阿里云峰會·上海開發者大會開源大數據專場中小紅書實時推薦團隊負責人郭一先生現場分享。小紅書作為生活分享類社區,目前有8500萬用戶,年同比增長為300%,大約每天有30億條筆記在發現首頁進行展示。推薦是小紅書非常核心且重要的場景之一,本文主要分享在推薦業務場景中小紅書的實時計算應用。

實時計算在推薦業務中的場景

線上推薦流程

小紅書線上推薦的流程主要可以分為三步。第一步,從小紅書用戶每天上傳的的筆記池中選出候選集,即通過各種策略從近千萬條的筆記中選出上千個侯選集進行初排。第二步,在模型排序階段給每個筆記打分,根據小紅書用戶的點贊和收藏行為給平臺帶來的價值設計了一套權重的評估體系,通過預估用戶的點擊率,評估點擊之后的點贊、收藏和評論等的概率進行打分。第三步,在將筆記展示給用戶之前,選擇分數高的筆記,通過各種策略進行多樣性調整。

在此模型中最核心的點擊率、點贊數、收藏、評論等都是通過機器學習模型訓練對用戶各項行為的預估并給出相應分數。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

推薦系統架構

在小紅書線上推薦過程的背后是一套完整的從線上到線下的推薦系統,下圖展示了小紅書推薦系統架構,紅色表示實時操作,灰色則是離線操作。通過算法推薦之后,用戶和筆記進行交互,產生用戶的曝光、點贊和點擊的信息,這些信息被收集形成用戶筆記畫像,也會成為模型訓練的訓練樣本,產生分析報表。訓練樣本最終生成預測模型,投入線上進行算法推薦,如此就形成了一個閉環,其中分析報表則由算法工程師或策略工程師進行分析,調整推薦策略,最后再投入到線上推薦中。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

離線批處理

離線批處理流程如下圖所示,之前的處理流程是在客戶端產生用戶交互和打點,打點好的數據放入數倉中,以T+1模式更新用戶筆記畫像,生成報表并生成訓練樣本,最后進行模型訓練和分析。小紅書初級版本的離線批處理情況,整個流程都基于Hive進行處理,處理流程較慢,無法滿足業務需求。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

實時流處理

2018年開始小紅書將離線的pipeline升級為實時的pipeline,用戶一旦產生交互點擊,系統會實時維護數據,更新用戶筆記畫像,實時產生訓練樣本,更新模型及生成報表。實時的流處理大大提高了開發效率,同時實時流處理依賴于Flink。在實時流中,首先用戶的實時交互進入Kafka,借助Flink任務維護用戶筆記畫像,將其傳給線上用戶畫像系統。相對來說,用戶的筆記畫像比較簡單,不會存在過多的狀態,而實時流處理中非常重要的場景是實時歸因,這也是小紅書最核心的業務。實時歸因是一個有狀態的場景,根據打點信息產生用戶的行為標簽,所有實時指標和訓練樣本都依賴行為標簽,其中,實時指標放在Click
House,數據分析師和策略工程師基于ClickHouse數據進行分析,訓練樣本仍然落到Hive中進行模型訓練,同時在線學習系統中會將訓練樣本落到Kafka,進行實時模型訓練。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

實時歸因

實時歸因數據

實時歸因將筆記推薦給用戶后會產生曝光,隨即產生打點信息,用戶筆記的每一次曝光、點擊、查看和回退都會被記錄下來。如下圖所示,四次曝光的用戶行為會產生四個筆記曝光。如果用戶點擊第二篇筆記,則產生第二篇筆記的點擊信息,點贊會產生點贊的打點信息;如果用戶回退就會顯示用戶在第二篇筆記停留了20秒。實時歸因會生成兩份數據,第一份是點擊模型的數據標簽,在下圖中,第一篇筆記和第三篇筆記沒有點擊,第二篇筆記和第四篇筆記有點擊,這類數據對于訓練點擊模型至關重要。同樣,點贊模型需要點擊筆記數據,比如用戶點擊了第二篇筆記并發生點贊,反之點擊了第四篇筆記但沒有點贊,時長模型需要點擊之后停留的時間數據。以上提到的數據需要與上下文關聯,產生一組數據,作為模型分析和模型訓練的原始數據。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

Flink Job – Session Labeler

小紅書在處理實時歸因原始數據時應用了Flink任務。從Kafka
Source中讀數據再寫到另外一個Kafka
Sink。Key(user_id和note_id)根據用戶筆記和是否發生曝光和點擊分為兩個Session,Session使用Process
Function
API處理記錄,每條記錄都會記錄曝光的Session和點擊的Session。Session有20分鐘的定長窗口,即在收到用戶行為曝光或者點擊之后,開20分鐘的窗口查看是否這期間會發生曝光、點擊、點贊或者停留了多少時間。Session中有狀態信息,比如發生點擊并點贊,系統維護用戶在狀態中停留的時間,檢查點擊是否有效等。Flink窗口結束時,需要將Session
State中的內容輸出到下游,進行分析和模型訓練,同時清除ValueState。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

實際生產需要解決的問題

在實際生產中落地Flink任務需要解決較多的問題。首先是如何對Flink進行集群管理,上了生產環境之后需要做Checkpoint,將任務持久化,尤其需要注意的一點是Backfill,持久化一旦出錯,需要回到過去的某個時間,重新清除錯誤數據并恢復數據。

Flink集群管理:小紅書選擇將Flink部署在 K8s集群上,在小紅書看來,K8S或許是未來的趨勢之一。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

Checkpoint & State持久化:Flink
的State
分為兩種,FsStateBackend和RocksDBStateBackend。FsStateBackend支持較小的狀態,但不支持增量的狀態。在實時歸因的場景中有20分鐘的窗口,20分鐘之內發生的所有的狀態會放在內存中,定期做持久化。如果要避免這20分鐘的數據丟失,RocksDBStateBackend是更好的選擇,因為RocksDBStateBackend支持增量Checkpoint。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

RocksDB調優:具體使用RocksDBStateBackend時依然會遇到調優問題。小紅書在開始測試時,Checkpoint頻率設置較短,一分鐘做一次Checkpoint,而RocksDB每次做Checkpoint時都需要將數據從內存flash到磁盤中,Checkpoint頻率較高時會產生非常多的小std文件,RocksDB需要花大量時間和資源去做整合,將小文件合并為大文件。State本身已經比較大,假如flash持續Compaction,磁盤I/O將會成為瓶頸,最后導致產生反壓上游。

另一個問題是使用RocksDBStateBackend會有生成較多的MemTable,如果內存沒有配置好,會導致out
of memory,需要重新計算內存,調配MemTable,Parallelism和K8s
point的內存。調優之后任務運行較為穩定,這時需要把本地磁盤換成高性能的SSD,保證內存有足夠的空間。

此外,每次做Checkpoint都會產生性能損失。小紅書選擇將Checkpoint頻率改成十分鐘,同樣可以滿足生產需求,而且回填10分鐘的數據只需要一到兩分鐘,需要注意的是調大RocksDB
Compaction Threshold,避免頻繁進行小文件的合并。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

Backfill:回填是生產中常見的場景,實際生產中如果開發者寫錯代碼導致數據錯誤,則需要刪除錯誤數據,重新跑正確代碼回填正確的數據;另外,如果原本只有點贊功能,會產生新的回填場景,分析用戶點贊是否為有效點贊或者對其做簡單的邏輯恢復都需要Backfill。Backfill非常依賴Flink對Hive的支持,小紅書一直以來的數據都存放在Hive上,所以非常期待Flink
1.9版本性能的提高,尤其對Hive的支持的提升和對批的支持的加強。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

Red Flink實時流計算平臺

小紅書實時流計算平臺及周邊生態

小紅書推薦系統是一個流計算的平臺,同時涉及周邊的生態。如下圖所示,最右邊是數據接入的模塊,支持從客戶端接入數據,同時后端的服務提供LogSDK的模塊幫助業務直接接入實時計算的平臺。紅色模塊是流計算平臺中正在開發的模塊,比如,Canal通過事務的數據庫日志直接將訂單流對接到數據平臺,系統自動分析數據Schema,一旦Schema發生變化,自動重啟相應Flink任務。左下角是基于Flink
1.8做的開發,在此基礎上根據業務需要增加了Latency監控,便于分析Flink堵塞的Operator,同時將Latency監控直接接入到系統中。小紅書基于Flink的SQL也進行了開發,實現了不同的connector,比如ClickHouse、Hbase、Kafka等,目前這套平臺支持的業務除了實時歸因的場景外,還有數據ETL、實時Spam、實時DAU,包括我們正在開發的實時RGMV大促看板都是基于此平臺搭建的。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

小紅書Flink系統

下圖為系統的部分截圖,左邊為業務方使用小紅書Flink實時流計算平臺時,可以選擇數據目的地,比如aws-hive和rex-clickhouse表明數據需要放到Hive和ClickHouse中。然后在Schema中輸入JSON或PB格式數據,平臺可以自動識別Schema,同時將數據Schema轉成Flink
SQL ETL的命令,自動更新Flink ETL
Job的任務。此外,系統會對任務進行監控,監控任務的延遲時間、有無數據丟失,如果延遲過高或有數據丟失則產生報警及報警的級別。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

平臺小紅書推薦預測模型的演近

  • 9個行為的預測模型 (click, hide, like, fav, comment, share, follow, …)
  • Click模型規模: 5億樣本/天, 1T數據/天

上面簡單介紹了小紅書的實時計算平臺,另外一部分就是TensorFlow和Machine
Learning。2018年12月,小紅書的推薦預測模型只是非常簡單的Spark上的GBDT模型。后期在GBDT模型上加了LR層,后來還引入了Deep和Wide。到2019年7月,小紅書推薦預測模型已經演化到了GBDT
+ Sparse
D&W的模型。小紅書主要有9個預測任務,包括click、hide、like、fav、comment、share以及follow等。其中,Click是小紅書最大的模型,一天大概產生5億的樣本進行模型訓練,數據量達到1T/天。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

目前小紅書的Red ML模型基于KubeFlow,在小紅書開始做ML模型時,KubeFlow在開源社區中比較受歡迎,而且TFJob可以支持TensorFlow的分布式訓練。

小紅書首頁推薦怎么上,小紅書上首頁推薦及熱門方法,小紅書首頁

總結與展望

小紅書從去年年底開始做推薦系統,系統的搭建既依賴開源社區,也擁抱開源社區。整個實時計算平臺的搭建都是基于Flink,也十分期待Flink
1.9 的新功能對于Hive
和批的支持;AI是目前小紅書比較強的需求,包括模型訓練算力、效率等非常敏感,也會持續關注社區相關技術;后期希望能夠融合Flink與AI,將流計算與機器學習無縫整合實現更智能高效的推薦。

今天就分享到這里吧,希望你看到這篇文章以后能有所啟發,認真、仔細閱讀完小紅書首頁推薦怎么上「詳細講解:小紅書上首頁推薦及熱門方法」,對自己有幫助,麻煩記得點個贊哦!

本文發布者:百事通,不代表巢座耶立場,轉載請注明出處:http://www.sdwldmy.com/p/16032.html

版權聲明:本文內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容, 請發送郵件至 jubao226688#126.com 舉報,一經查實,本站將立刻刪除。

(0)
上一篇 2024年4月4日 13:48
下一篇 2024年4月4日 14:09

相關推薦

  • 淘寶店鋪招牌圖片怎么制作 秒懂:手把手教你制作店鋪招牌

    小伙伴們大家好,今天駿俊給大家分析下關于淘寶店鋪招牌圖片怎么制作,手把手教你制作店鋪招牌的事情,以及關于淘寶店鋪招牌圖片怎么制作等等各種相關干貨,其他的廢話在這里我也不說了,我們直接來進入正題吧! 我們在確定好標題之后,就應該對寶貝的圖片進行優化。 首先是主圖。 可能有一些剛剛接觸淘寶店的小伙伴們不知道什么是主圖。 當我們打開淘寶。在列表頁看到的方形的圖片就…

    2024年5月28日
  • 手機如何制作視頻相冊 新手必看:7天學會自媒體短視頻制作

    最近有很多朋友問李月娥關于手機如何制作視頻相冊,7天學會自媒體短視頻制作的事情,以及手機如何制作視頻等等各種一系列的相關干貨,思路很重要,希望我整理分享的這篇文章對你能有一定的幫助! 但是,對于一些不會剪輯視頻,或者不會制作炫酷視頻的新手來說。視頻制作起來,太難了。其實,在現在,早就有很多人想到了這點,直接用手機操作,就可以輕松剪輯/編輯視頻。 打開清爽視頻…

    2023年5月13日 ? 百科
  • 年輕人創業項目推薦 必看:目前特色創業項目有哪些

    小伙伴們大家好,這次許梓冰早帶大家來分析下關于年輕人創業項目推薦,目前特色創業項目有哪些,以及創業項目推薦等等各種一系列的相關干貨,思路很重要,希望我整理分享的這篇文章對你能有一定的幫助! 因為不想讓自己的積蓄毀于一旦,所以在選擇項目的時候,很是慎重,今天帶來了年輕人十大創業項目,希望大家可以從中選到適合自己的項目! 1、汽車維護: 像現在,如果只是單單的想…

    2023年10月20日
  • 2021年好的投資項目有哪些 必看:國內火熱朝天的6大投資項目

    各位朋友們大家好,這次陳妤晗想和大家聊聊關于2021年好的投資項目有哪些,國內火熱朝天的6大投資項目,以及好的投資項目相關的事項,成功的路上不會一帆風順,每一個成功的背后都有一個驚人的故事。 作為一個普通人,能夠想到賺錢的方法不多,除了打工就是創業。那么,創業投資好項目有哪些?下面我給大家盤點了2個創業投資好項目,希望大家能把握住機會。 在這個自媒體時代再也…

    2023年9月17日
  • 現在開淘寶網店賺錢嗎 推薦新手賣家入門必看教程

    HI,大家好,廢話不多說,直接上干貨:現在開淘寶網店賺錢嗎,新手賣家入門必看教程,還有網店賺錢嗎等各種干貨文章,精心為你準備的干貨,通過這篇文章相信你能有所收貨! “開一家淘寶網店現在還賺錢嗎?” 先看兩組數據: 淘寶現在一年交易額3萬億,還在每年30%增長。你過去看到賣家掙錢的很多賣家,今天只會更加多。 今天阿里巴巴一年的收入是1000億。意味著只占整個交…

    2024年4月24日 ? 百科
  • 新型致富項目投資「新手必看:6個新型網賺致富項目」

    美好的1天即將在這里開始,下面就由筆者何其銘來一起聊聊新型致富項目投資,6個新型網賺致富項目,還有關于新型致富項目等等其他相關干貨,其實這篇文章主要還是為新手朋友整理的,總的來說思路還是很重要! 1.有道眾包 這個平臺是網易有道詞典旗下的一個平臺,還是比較靠譜的,直接在百度上搜索“有道眾包”就可以找到。 大家可以看上面的圖片,關于圖片轉寫文字和音頻轉寫文字就…

    百科 2023年5月4日
日本在线免费视频,国产精品视频2020,亚洲一区二区色,亚洲精品在线播放
欧美在线观看视频一区二区 | 制服丝袜亚洲网站| 成人中文字幕在线| 国产电影精品久久禁18| 久久精品999| 国内久久精品视频| 捆绑调教美女网站视频一区| 日韩极品在线观看| 亚洲男人的天堂在线aⅴ视频| 欧美极品另类videosde| 国产女主播视频一区二区| 欧美成人激情免费网| 亚洲精品一区二区三区99| 欧美va亚洲va香蕉在线| 久久综合九色综合97婷婷| 国产三级一区二区| 一区二区三区国产豹纹内裤在线| 亚洲www啪成人一区二区麻豆| 日韩影院在线观看| 国产高清不卡一区| 欧美亚洲一区三区| 久久久不卡网国产精品二区| 亚洲免费av高清| 美女mm1313爽爽久久久蜜臀| 风间由美一区二区三区在线观看| 色香蕉久久蜜桃| 亚洲乱码国产乱码精品精98午夜 | 欧美伊人精品成人久久综合97| 婷婷综合五月天| 亚洲一区二区三区爽爽爽爽爽| 91视频国产观看| 欧美日韩国产综合视频在线观看| 色偷偷成人一区二区三区91| 99国产精品久久久| 亚洲欧洲国产专区| 亚洲精选在线视频| 九九九久久久精品| 一区二区三区中文在线| 国产精品视频你懂的| 国产精品天美传媒| 亚洲三级小视频| 欧美日韩国产免费一区二区 | 午夜欧美电影在线观看| jvid福利写真一区二区三区| 亚洲国产成人精品视频| 国产三级欧美三级日产三级99| 国产精品久久福利| 欧美性做爰猛烈叫床潮| 午夜精品福利视频网站| 樱桃国产成人精品视频| 国产日韩亚洲欧美综合| 91精品国产综合久久精品app | 日韩亚洲欧美综合| 91在线视频官网| 亚洲一区二区三区自拍| 亚洲青青青在线视频| 美女任你摸久久| 99久久免费视频.com| 99综合影院在线| 午夜精品123| 久久99热狠狠色一区二区| 色婷婷综合五月| 国产精品视频yy9299一区| 蓝色福利精品导航| 国产精品久久久久久久岛一牛影视| 精品一区二区影视| 国产精品入口麻豆原神| 在线观看一区二区视频| 日产国产欧美视频一区精品| 日韩一区二区三区视频在线| 国产盗摄精品一区二区三区在线| 精品av综合导航| 在线免费观看日本欧美| 国产成人亚洲综合a∨猫咪| 亚洲男人的天堂av| 精品国产自在久精品国产| 99精品视频中文字幕| 国产精品自拍在线| 免费高清在线一区| 一个色妞综合视频在线观看| 国产日韩精品一区二区浪潮av | 欧美日韩精品综合在线| 成人小视频在线观看| 蜜臀91精品一区二区三区| 亚洲狠狠爱一区二区三区| 亚洲乱码国产乱码精品精的特点 | 婷婷久久综合九色综合伊人色| 久久婷婷成人综合色| 久久综合九色综合97婷婷女人| 日韩一区二区三区电影在线观看 | 亚洲不卡一区二区三区| 三级精品在线观看| 爽好多水快深点欧美视频| 亚洲精品国久久99热| 亚洲国产精品尤物yw在线观看| 亚洲一区二区欧美日韩| 日韩电影一二三区| 精品一区二区三区久久| 成人高清视频在线| 欧美日韩视频不卡| 国产亚洲精品bt天堂精选| 亚洲一区二区高清| 国产在线精品国自产拍免费| 99综合影院在线| 亚洲精品在线观| 一区二区三区精品| 高清成人在线观看| 51精品久久久久久久蜜臀| 自拍av一区二区三区| 激情五月婷婷综合| 欧美肥妇毛茸茸| 亚洲国产美国国产综合一区二区| 国产精品 欧美精品| 日韩一区二区精品| 蜜桃视频一区二区三区| 欧美日韩在线观看一区二区| 亚洲图片欧美激情| 91影院在线免费观看| 国产喂奶挤奶一区二区三区| 久久精品二区亚洲w码| 91精品欧美综合在线观看最新 | 欧美电影免费观看高清完整版| 午夜精品福利一区二区蜜股av| 日韩专区中文字幕一区二区| 精品久久久久久久久久久院品网| 成人动漫一区二区三区| 国产精品一区二区免费不卡| 久久国产生活片100| 蜜桃精品视频在线观看| 亚洲v精品v日韩v欧美v专区| 久久久久久毛片| 日韩欧美精品在线视频| 91精品久久久久久久91蜜桃| 欧美日韩国产a| 制服丝袜av成人在线看| 欧美精品一卡二卡| 91麻豆精品久久久久蜜臀| 欧美色视频在线观看| 在线中文字幕一区二区| 欧美三级在线视频| 日韩一级精品视频在线观看| 8v天堂国产在线一区二区| 91麻豆精品国产自产在线| 欧美大片国产精品| 久久精品一区二区三区不卡| 国产精品久久久久久久久动漫| 国产精品蜜臀av| 天天色图综合网| 高清在线不卡av| 91精选在线观看| 樱桃国产成人精品视频| 国产在线麻豆精品观看| 久久99精品久久久久| av电影天堂一区二区在线观看| 日韩欧美国产系列| 樱花影视一区二区| 色视频一区二区| 亚洲人成网站色在线观看| 国产·精品毛片| 中文字幕第一区二区| 亚洲小少妇裸体bbw| 99久久婷婷国产综合精品电影| 日韩欧美久久一区| 国产精品久久久久影院| 国产精一品亚洲二区在线视频| 在线亚洲免费视频| 亚洲欧美色一区| 色综合天天综合狠狠| 一区二区三区在线免费| 色视频成人在线观看免| 亚洲一区二区五区| 这里只有精品视频在线观看| 强制捆绑调教一区二区| 日韩一区二区在线看| 国产精品一区不卡| 亚洲色图另类专区| 欧美日韩一级片网站| 婷婷综合在线观看| www国产成人| 91国模大尺度私拍在线视频| 一二三区精品福利视频| 宅男噜噜噜66一区二区66| 国产在线视频精品一区| 亚洲一区在线视频| 日韩美女啊v在线免费观看| 日韩欧美亚洲一区二区| 在线欧美日韩国产| 日韩美女主播在线视频一区二区三区 | 久久久久久一二三区| 日韩欧美一二三四区| 欧美情侣在线播放| 欧美精品色综合| 7777女厕盗摄久久久| 精品1区2区3区| 欧美吻胸吃奶大尺度电影| 欧美日韩精品系列| 欧美亚洲综合久久| 欧美日韩中文字幕一区| 欧美性xxxxxx少妇| 欧美日韩免费视频|