close
嘿,記得給「機器學習與推薦算法」添加星標

目前主流的基於圖神經網絡的推薦系統由於在實驗數據集以及評估指標上存在較大差異,導致不能直接進行比較。換句話說,沒有統一的benchmark來進行評判。另外,許多基於圖神經網絡推薦系統只在小規模數據集上提供了一個簡單的demo,這就導致直接應用於現實世界的推薦系統還有很大的距離。

為了解決上述問題,本文構建了一個基於Paddle的工具包Graph4Rec。
它將訓練圖神經網絡模型的範式統一為以下幾個部分:圖輸入、隨機遊走生成、自我圖生成、節點對生成和圖神經網絡選擇。通過構建的這個pipeline,可以進行一些配置很容易地搭建自己的GNN模型。另外,他們開發了一個大規模的圖引擎和一個參數服務器來支持分布式GNN訓練。

並進行了系統和全面的實驗,比較了不同GNN模型在不同場景和不同規模下的性能。大量的實驗證明了gnn的關鍵組成部分的有效性。然後他們還試圖弄清楚稀疏和稠密參數對gnn模型的性能影響。

最後,本文還研究了包括負抽樣、自我圖構造順序和暖啟動策略在內的方法,以尋找更有效和高效的gnn策略在推薦系統中的實踐。

paper:https://arxiv.org/abs/2112.01035

code:https://github.com/PaddlePaddle/PGL/tree/main/apps/Graph4Rec

本文的整體架構圖,其將Graph4Rec項目統一成了以下5個部分進行圖神經網絡的訓練,具體包括圖輸入、隨機遊走生成、自我圖生成、節點對生成以及圖神經網絡選擇等組件。

其在4個公開的異質數據集上進行了性能測試,具體數據集介紹如下:

其通過對比主流的圖學習系統展示了訓練效率方面的優越性。其中,GraphVITE是一個通用的圖嵌入引擎,PBG是一個基於Pytorch的大規模圖學習系統。相比於上述兩個圖學習框架,本文所提出的工具包可以利用附加信息來緩解冷啟動問題。
GraphViTE:https://github.com/DeepGraphLearning/graphvite
PBG: https://github.com/facebookresearch/PyTorch-BigGraph
GRecX:https://github.com/maenzhier/GRecX

另外,還對比了上述3個常用的圖學習框架利用不同的召回策略(ICF、UCF以及U2I)在不同的圖嵌入算法(Deepwalk、metapath2vec、lightgcn)上的性能比較。

隨後比較了在Graph4Rec上常用的圖神經網絡模型的性能比較。

最後,探索了熱啟動以及負採樣對性能的影響。

歡迎乾貨投稿 \論文宣傳\合作交流推薦閱讀

RecNN | 基於強化學習的新聞推薦系統框架
伯樂:一個易用、強大的PyTorch推薦系統開源庫
推薦系統領域13個開源工具總結

由於公眾號試行亂序推送,您可能不再準時收到機器學習與推薦算法的推送。為了第一時間收到本號的乾貨內容, 請將本號設為星標,以及常點文末右下角的「在看」。

喜歡的話點個在看吧👇

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()