作者:騰訊ARC Lab & 騰訊OVB-AI技術中心顛覆傳統「冷刷新」模型升級範式,騰訊 ARC Lab、清華大學及騰訊在線視頻 BU-AI 技術中心針對大規模檢索系統推出「熱刷新」模型升級的新機制,實現新模型即時部署上線、精度穩步在線提升等特性,並針對刷新過程中的模型退化問題提出有效解決方案。論文已被 ICLR 2022 接收,這是熱刷新模型升級在學術界的首秀,領域主席(AC)評價「這是真實世界的圖像檢索系統中一個非常實用且重要的問題」。「熱刷新」模型升級算法已成功部署在騰訊 PCG 視頻關係中台,為千億級向量索引系統提供快速模型升級服務,迭代效率提升 4 + 倍。

論文鏈接:https://arxiv.org/abs/2201.09724
代碼鏈接:https://github.com/binjiezhang/RACT_ICLR2022
圖像檢索的應用在生活中無處不在,例如人臉識別、版權檢測、圖像定位等等,檢索系統在推理時需要利用部署好的模型對查詢圖像進行特徵提取,再與底庫中所有預先提取好並存儲的圖像特徵進行比對。對檢索系統中部署的模型進行更新迭代是提升檢索精度、改善用戶體驗的必經之路。在傳統的檢索模型升級過程中,需要先用新模型離線刷新底庫中的所有特徵(稱之為特徵「回填」),再將新模型部署上線,這一過程被稱之「冷刷新」模型升級。大規模檢索系統往往存在海量的底庫圖像,將其全部離線刷新一遍可能花費數周乃至數月,冷刷新模型升級存在模型迭代的時間成本高、用戶體驗不能得到即時改善等幾大弊端。為此,研究者首次提出「熱刷新」模型升級方案,兼容學習 [1] 訓練的新模型所提取的新特徵由於可以與底庫中的舊特徵直接對比,所以無需特徵回填便可即時部署上線新模型;同時,由於新特徵與舊特徵直接可比、可互換,所以在新模型部署上線後,可以利用新模型在線刷新底庫特徵,實現檢索精度的逐步爬升,直至全部底庫特徵刷新完畢。如下圖所示,「熱刷新」模型升級機制無需等待離線特徵回填,精度即時提升 (O→A) 且用戶體驗逐步改善(A→B),離無縫模型升級更近一步。
在過往的兼容學習 [1] 工作中也曾有對模型即時部署的闡述,研究者提出新模型的兼容特性,使其可以在無特徵回填的情況下部署上線,這種升級策略被稱之為「無刷新」模型升級。在該策略下,底庫特徵始終保持不變,限制了新模型的精度上限,在多代模型升級後劣勢尤其顯著。如下圖所示,虛線為「無刷新」模型升級,實線為「熱刷新」模型升級。從三次模型升級迭代後的精度變化中,可以明顯觀察出「熱刷新」模型升級的優勢。大家可能發現,熱刷新過程中,模型精度出現了短暫的下降,這也就是下文要繼續介紹的「模型退化」(model regression)問題。
「熱刷新」模型升級(實線)& 「無刷新」模型升級(虛線)儘管現有的兼容訓練算法使得熱刷新模型升級成為了可能,但他們均面臨刷新過程中的「模型退化」問題,即升級中檢索精度的下降,如下圖所示(A→C)。
研究者發現,這實際上是由升級過程中的負翻轉造成,負翻轉指的是舊檢索系統中可以正確識別的查詢圖像在熱刷新升級過程中被錯誤識別。而造成負翻轉的最主要原因,是在底庫特徵在線回填過程中,存在新→新負樣本對距離小於新→舊正樣本對距離的情況,如下圖所示。
為了緩解熱刷新模型升級過程中的模型退化問題,作者提出了一種簡單有效的正則化,即約束新→舊正樣本對距離不光要小於新→舊負樣本對距離,也要小於新→新負樣本對距離(過往兼容學習算法只約束了前者),並以對比學習的形式呈現。如下圖所示,該正則化被稱之為緩解退化的兼容損失函數,具體公式不在此呈現,感興趣的讀者可翻閱論文。
這一正則化看似是對已有兼容損失函數的細微修改,但對於緩解模型退化問題來說起着本質的作用。如下圖所示,研究者在 Google Landmark v2 數據集上針對三種不同類型的數據設置(數據拓展、開放數據以及開放類別)進行了實驗,均可觀察到所提出算法的有效性。同時,他們對熱刷新模型升級過程中的負翻轉率進行了定義,量化模型退化程度,如圖中內嵌小圖所示,所提出的算法可有效減少負翻轉率。
傳統兼容訓練(虛線)& 緩解退化的兼容訓練(實線)上文提到的損失函數在訓練階段顯式地約束新模型減少負翻轉的可能性出現,同時研究者也提出一種基於不確定性的底庫回填策略,可以在熱刷新過程中隱式地減少負翻轉。該回填策略基於「辨識度差的特徵應優先被刷新」的原則,通過輕量快速地估計底庫舊特徵的分類不確定性,判斷特徵的可辨識度。如下圖所示,研究者在 Oxford 數據集上進行了測試,無論在部署傳統兼容訓練的新模型(虛線)還是緩解退化兼容訓練的新模型(實線)時,基於不確定性的回填策略(彩色)都可以間接減輕模型退化問題並實現精度更快更穩定的提升。
隨機回填策略(灰色)& 基於不確定性的回填策略(彩色)騰訊 PCG - 視頻關係中台主要提供視頻排重、視頻侵權、視頻語義關係的檢測及數據服務。目前,向包括騰訊視頻、騰訊小世界、微信視頻號、微視等多個視頻業務提供服務,涉及千億量級的視頻指紋特徵,模型迭代帶來的時間及機器成本十分高昂。而基於兼容特徵的「熱刷新」方案加速了 4+ 倍算法版本更新效率,同時節約了數百萬元的機器成本,使得中台的算法服務可以更加靈活的面對變化多樣的業務環境。該文對熱刷新模型升級及其過程中會出現的模型退化問題進行了首次研究和深入剖析,這是實際應用中非常重要的一項任務,研究者希望該論文能夠引起公眾對業界中高效模型升級瓶頸問題的關注。儘管引入的緩解退化的兼容性正則化可以在一定程度上減少負翻轉,但要徹底消除模型退化的問題還有很長的路要走,因此呼籲更多的研究人員加入這個方向進行進一步的研究。1. Yantao Shen, Yuanjun Xiong, Wei Xia, and Stefano Soatto. Towards backward-compatible representation learning. In CVPR, 2020.
©THE END
轉載請聯繫本公眾號獲得授權
投稿或尋求報道:content@jiqizhixin.com