
文 | 賣萌醬
"這不是無腦吹,也不是雞湯。她讓中國AI落地變得切實有解了。"
AI泡沫破了嗎?AI能落地了嗎?AI不是PPT問題嗎?AI終究只是夢一場?
面對行外的人,每當賣萌醬說起自己是做AI的,都經常收到以上「靈魂拷問」。做AI的這幾年裡,賣萌醬也常常為AI技術的落地感到迷茫,有時甚至覺得無解。
AI最應該落到哪裡去?
是互聯網老牌業務搜推廣嗎?還是激進的新型業務比如自動駕駛?還是...傳統行業?
誠然,AI在互聯網老牌業務上率先取得突破,提升了一眾互聯網企業的流量分發效率和商業營收;在自動駕駛這種新型業務上也取得了一些不錯的里程碑,但這些成果相比人們最初對AI的期待,似乎少了些什麼。
都說AI是解放社會生產力,提升行業生產效率的利器,國家近幾年也在大力號召「智能製造」,要實現「產業升級」等。而社會運轉是一台極其複雜的機器,這種宏大的目標,一定是建立在千行百業革新的基礎上才可能實現的,僅靠互聯網傳統業務和充滿不確定的新型業務,是一定無法充分釋放AI技術的潛力。
要顛覆,就要像20年前為千行百業引入計算機一樣引入AI技術,實現巨大的社會生產力提升,這才是AI技術真正的使命和價值。
為什麼為傳統行業引入AI技術會這麼難?都說AI落地太難,有人說是模型效果還是沒那麼好,有人說是模型部署起來難度高,成本大,利潤薄的傳統行業玩不轉也用不起。
其實這些都只是部分原因,而且都不是不可解的問題。
回想一下,20年前的傳統行業,大家普遍通過紙、筆和計算器完成各行各業的數字統計和數值計算,效率極低、容易出錯還不容易數據共享。計算機作為當時的高科技產品,單單是會熟練打字(五筆輸入法、智能ABC了解一下)、用word排版、用excel製作表格完成數據匯總和計算,在傳統行業裡面就是大家眼裡的「計算機大佬」了。要是還會重裝系統、搭建網站,那就是走起路來都帶風的人物。
直到後面出現了若干「智能輸入法」,且windows系統、office等各類平台軟件都變得更加簡單易用後,讓傳統行業接受計算機才不是那麼困難的事情了。
今天的AI,很像20年前的計算機。IT行內人知道它可以大幅提升生產效率,玩好了就是神器,但行外人眼裡,這就是個複雜無比的高科技產品,非「我等凡夫俗子」能駕馭的住的東西。
所以賣萌醬認為,若要在傳統行業現象級的引入AI技術,關鍵點有二:
第一, 破圈。對傳統行業進行觀念+案例疏導,讓傳統行業相信這是一場值得嘗試的變革,告訴大家「這螃蟹雖然長得醜,但是可以吃,而且很好吃。」
第二, 有譜。提供面向傳統行業小白的系統級解決方案+持續的易用性提升方案
先來談談破圈。
要破圈,讓傳統行業像互聯網行業一樣相信AI,關鍵的一步是在各個行業打造出成功案例。但這有點「雞生蛋,蛋生雞」了,如果每個客戶都在蹲這麼一個成功範例,那肯定最終全行業都一直蹲着了。所以要打破僵局,就需要有一個在中國公認的AI技術領頭人下場號召傳統行業吃第一批螃蟹,打造出一批各行各業的成功範例庫。有了範例庫,便會有更多的人願意嘗試吃螃蟹,進而出現滾雪球效應。這便是破圈的一個關鍵點。
但因此誕生了一個問題:
誰來做?範例庫做成了嗎?
再來聊聊有譜。
要解決本章開頭提到的兩個局部問題點,其實都不算難,甚至國內任何一家互聯網大廠多投入點AI人才,在具體的場景下可能都能搞定。但落地困難的地方在於把這兩個問題解決了,把AI框架、模型等丟給傳統行業,對方依然會一臉懵逼。這就是因為對傳統行業來說,需要的是一整套能讓小白上手打怪的解決方案,而不是零散的工具。
下面來做一個直觀的對比。
在互聯網行業,用AI技術創造業務價值有哪些要素?
而傳統行業AI落地,就是要把以上要素系統級的消滅掉,讓傳統行業小白也能輕鬆無負擔的把AI創造價值的全流程打通。
這真的太考驗一個企業的AI頂層設計能力和底層細節優化了。
要同時實現「破圈」和「有譜」的問題,着實是一件難度極高的事情。
她要扛起大旗直到賣萌醬參加了上周五的Wave Summit 2022深度學習開發者峰會,才發現原來AI在傳統行業的落地可能真的有解了!
打開大模型在傳統行業的想象力在前文提到的五點AI技術創造業務價值的要素中,數據問題與模型問題無疑是阻礙AI在傳統行業落地的重要因素,但本屆wave summit之後,現在似乎出現了一種可行的解法——面向行業的AI大模型。
為什麼這裡要突出「面向行業」呢?
以NLP為例,無論是BERT、RoBERTa還是GPT-3,歸根結底都屬於學術意義上的「通用」大模型,它們都致力於理解人類語言,但不一定具備很好的行業知識,懂得「行業語言」。導致學術層面的通用AI大模型直接應用於傳統行業時表現往往沒有想象中的驚艷。
而百度在本次峰會上一口氣發布了10個AI大模型,不僅包含通用大模型,還包括任務大模型和業內首次發行的行業大模型,甚至為大模型配套了專業的工具平台使得基於大模型的AI應用開發門檻得到進一步降低。
這裡重點說說行業大模型。
在互聯網上採集到的數據往往與傳統行業相去甚遠。例如車間中的某種零件質檢時的缺陷件圖片,幾乎無法在互聯網中獲取到;在法律文書、病歷等傳統行業文案中也常常存在大量在互聯網上很少見到的「專業術語」。
因此,這裡的行業大模型的核心特色便是做了 「行業知識增強」,先基於通用的文心大模型挖掘各行各業的知識,而後結合實際行業的數據、知識以及百度文心技術團隊設計的特有訓練算法來進行大規模無監督聯合訓練。
如此打造的大模型便可具備強大的零樣本學習能力和效果提升可觀的少樣本學習能力,在模型效果和數據依賴方面可謂一舉兩得。
除了行業大模型外,此次還發布文心基礎大模型和任務大模型共八個,包括:
本次全新發布的融合任務相關知識的千億大模型ERNIE 3.0 Zeus,在學習海量數據和知識的基礎上,進一步學習了百餘種不同形式的任務知識,增強了模型的效果。
另一方面,ERNIE 3.0 Zeus通過融合層次化提示的預訓練,更好地建模不同任務的共性與特性,再通過將不同的任務組織成統一的自然語言形式,統一建模增強模型的泛化能力。
相對其他模型,ERNIE 3.0 Zeus在各類NLP任務上表現出了更強的零樣本和小樣本學習能力。
與GPT-3這類基於語言模型訓練目標的千億大模型不同的是,ERNIE 3.0 Zeus在訓練過程中融合了100多個層次化的Prompt和相應的訓練任務,大類任務涵蓋了問答、信息抽取、文本分類、情感分析、語義匹配、摘要、對話、創作、文本糾錯等,使得大模型的優化目標更加逼近應用時的下游任務,因此ERNIE 3.0 Zeus相比學術界流行的BERT、RoBERTa等開源模型具備顯著更優的下游任務零樣本和小樣本學習能力。這不僅提升了模型的下游任務表現,而且大大緩解了模型對下游任務樣本量的依賴,直擊傳統行業的落地痛點。
值得注意的是,本次發布會還打造了一個基於文心大模型的創意社區——暘谷大模型創意與探索社區,可以提供最新大模型的API試用,零距離感受大模型在千行百業落地的潛力。
可以預期的是,大模型作為人工智能的「新一代基礎設施」,讓AI在傳統行業的落地變得愈加容易完成場景擴展、愈加有效提升應用效果並減少落地成本,是推動產業智能化升級的重要組件。
基於飛槳大航海計劃2.0的三大共創計劃在本次峰會上,百度飛槳還基於飛槳大航海計劃2.0,發布三大共創計劃,包含飛槳產業實踐範例庫共創計劃、飛槳AI for Science共創計劃和飛槳硬件生態共創計劃。其中AI for Science計劃可以推動基礎科學領域的科研創新與產業賦能,而硬件生態共創計劃和產業實踐範例庫共創計劃則與AI的傳統行業落地密切相關。
在前文中提過,範例庫是實現AI技術破圈必不可少的關鍵成分,一方面可以引導傳統行業自發的擁抱AI,另一方面可以為AI在傳統行業的落地提供切實的指導。
賣萌醬留意到,本次發布會提及的產業實踐範例庫中的產業範例已經多達 47 個,每個範例都覆蓋了任務解析、算法選擇、模型訓練及優化、推理部署及結果可視化等產業落地全流程,有完整的代碼實現。
這份範例庫無疑將成為AI技術破圈的強有力技術支撐。
而圍繞硬件發起的硬件生態共創計劃則致力於解決部署難題——傳統行業的硬件環境複雜多變。
截至2021年底,已經有20個硬件廠家、30種+的芯片適配了飛槳,而本次發布會上,飛槳與硬件夥伴聯合推出了廠商版本飛槳框架,讓飛槳的硬件適配變得更加簡單、高效、標準化,讓產業落地不再受困於「硬件未適配」。
一份讓落地變得有譜的導航圖與工具鏈如前文所述,缺乏系統級解決方案是傳統行業開發者面對AI時無處下手的關鍵因素,即使給予了先進的模型、海量的數據和強大的AI框架,傳統行業開發者也往往缺乏清晰的思路來解決具體業務場景中的問題。
對此,飛槳發布了一份源於產業實踐經驗的「訓推一體導航圖」。
導航圖就像一棵樹根發達、樹葉豐茂的大樹。這棵樹從樹根到頂部分別描繪了各個任務場景的訓練、推理、部署的路徑。比如,樹幹的部分是各種各樣的模型以及支持的訓練模式,樹冠的部分是該模型支持在怎樣的硬件上做部署。可以說,找到業務環境與業務目標對應的樹葉和樹根,就可以找到一條路徑來完成全流程的訓練推理和部署。
與訓推一體導航圖配套的還有訓推一體工具鏈。不但可以方便的基於飛槳生態完成模型的高性能訓練、模型壓縮、部署乃至前端展示全流程,而且支持將其他框架下研發的模型通過X2Paddle工具完成到該工具鏈的接入,實現了對不同來源模型做統一的軟硬件環境兼容。
而在飛槳最新發布的v2.3版本中,更是實現了自動調優的更性能訓練、自動壓縮與高性能推理部署,讓落地的全流程都得到了極大的簡化,降低了開發者的學習和使用門檻。而得益於訓推的自動化,飛槳充分發揮了軟硬一體化的優勢,實現了在訓練的關鍵環節感知硬件特性自動調優,開發者無需了解硬件特性,即可獲得與專家級手工優化水平相當的性能;在推理部署的關鍵環節,可以感知硬件延時,自動選擇最優壓縮方案,壓縮精度與手工方法相當,代碼量減少 50% 以上。
可以說,無論是行業大模型、行業範例庫、導航圖、工具鏈還是框架v2.3的新特徵,都從不同的維度上有力的緩解了AI在傳統行業落地的痛點。而點連成線,就是AI迸發真正社會價值的時刻。
她叫百度飛槳,她要扛起中國AI落地的大旗。