作者 | 李揚霞
行至2021年並即將接近尾聲,在外行還在瞻前顧後的時候,雷鋒網聯合楊強教授;邀請信工所研究員、博導,信息安全國家重點實驗室副主任侯銳擔當主持人;邀請一線創業公司里的四家——星雲Clustar CTO張駿雪;洞見科技創始人、董事長姚明;上海富數科技有限公司智能決策分析部負責人吳海斌;瑞萊智慧RealAI首席架構師徐世真,分別從上海,北京,深圳趕來GAIR 2021深圳會場;邀請隱私計算一線投資機構基石資本天使基金合伙人黃依群;沸點資本董事總經理馬蘭現場給隱私計算創業公司的未來把脈。在疫情之中難得的群雄齊聚,我們決定問一些對這個行業從業者真正在思考的問題,解決一些心中的疑惑,尋求一份友商的答案,所以有了此次特別的圓桌呈現。
問題一:2020年和2021年相比,隱私計算市場最明顯的變化是什麼?
問題二:多行業隱私計算的可複製性局限可能會限制公司的發展,這個問題如何解?
問題三:面對「僧多粥少」的困境,創業公司如何破局?
問題四:隱私計算的行業互聯互通何時實現?
問題五:2020年和2021年相比,投資人視角,看到最明顯的變化是什麼?
問題六:若投資人2022再投隱私計算,只關注什麼?
一、侯銳:2020年和2021年相比,隱私計算市場最明顯的變化是什麼?
畢馬威發布的《2021隱私計算行業研究報告》指出,受到大數據融合應用和隱私保護的雙重需求驅動,國內隱私計算市場將快速發展,三年後技術服務營收有望觸達100億至200億元空間,甚至將撬動千億級數據平台運營收入空間。
如此大的市場空間,最近兩年隱私計算逐漸從小眾領域為大眾熟知,這兩年當中隱私計算究竟發生了哪些變化?
1、市場對算力有了迫切的需求
星雲Clustar CTO 張駿雪表示,「從沒有隱私計算到有隱私計算,再到軟件、算力,就發生在最近兩三年中,迭代非常之快。」
據透露,從香港科技大學孵化前,星雲Clustar的主攻方向是大規模機器學習系統的算力加速。在隱私計算的落地過程中,由於隱私計算巨大的算力代價,嚴重加大了隱私計算落地成本,制約了該技術的商業化速度。如何通過算力加速技術賦能隱私計算,這是必須要思考的。也就是從今年下半年開始,金融行業已經從聊軟件需求變為聊硬件加速,這是因為隱私計算落地的時候需要尋找新的硬件體系結構,加速計算性能。
2、隱私計算客戶行業在泛化,技術應用在深化
洞見姚明談到了,他過去兩年來所體會到的市場變化:
第一,隱私計算的客戶行業在泛化。去年,我們更多談論的是金融機構在風控、營銷等場景內有使用隱私計算進行業務創新或科技創新的需求。到了今年,我們發現非常多的行業都有了隱私計算需求,因為隱私計算技術能夠從數據開放角度和數據應用角度兩方面,重構原有數據要素流通的方式。
比如政務領域,當去年數據被納入國家第五大生產要素之後,國家鼓勵數據要素市場進一步地開放和流通,越來越多的地方政府在建設自己的數據能力開放平台,希望通過自己的數據開放賦能當地實體經濟的發展,對於開放過程中如何保護數據安全和隱私產生了比較強烈的需求,特別是今年下半年,越來越多的政府平台建設,開始引入隱私計算技術,包括在招投標時希望採購隱私計算模塊。
此外,在工業互聯網、車聯網及生活化的場景,越來越多的機構開始注重在業務場景中引入外部第三方數據,並在引入的過程中保障這些數據的使用安全和客戶隱私不泄露等訴求。所以,其實隱私計算的行業客戶在發生泛化,越來越多的行業客戶在對隱私計算產生訴求,這是第一個變化。
第二,隱私計算技術的應用在深化。去年我們在面對大部分客戶的時候,客戶會關註:隱私計算到底是什麼?隱私計算到底有幾種技術路徑?但到了今年上半年,大家關注的點是:你的隱私計算技術和其他家相比有什麼特點?我能怎麼用?
現在,我們發現銀行、保險客戶會問更精準的業務問題:我用了你的隱私計算技術,能給我帶來哪些數據資源?能幫我改善哪些業務效果?比如風控模型的KS值能達到多少,營銷的ROI是否能有明顯提升?這些說明客戶對隱私計算技術由好奇到試用,到希望用它來改善業務,這是客戶心態和需求上的同步變化。
3、數據源廠商對隱私計算更感興趣
富數吳海斌有着近20年的金融經驗背景,投入到隱私計算行業的他表示:「隱私計算給金融機構打開了一個新世界的大門。」
過去金融機構傳統建模都會結合行內數據或直連外部相關數據,但是隨着政策法規的落地,有些數據已經不能使用,但是拓展數據的話,就需要讓數據保證可用不可見,既安全又合規。數據源廠商更加青睞隱私計算這一新興技術,一來可以讓數據足不出戶,保障數據的安全性,二來,數據價值得到保證和管理,每次調用數據的時候都是透明的、可控的。
同時,吳海斌表示隱私計算也為保護個人信息產生了一定作用,從而對一些行業的運營模式促進了變革,比如富數科技人臉識別案例就是一個典型的創新,「我們基於多方安全計算的人臉識別解決方案,可以讓校驗數據方並不知曉被檢驗人的身份,但又能做出是否為本人的正確判斷,實現個人隱私的保護。」
這種技術在以前是不可想象的,而富數的研發團隊讓其在性能上實現了從十幾秒到幾秒,甚至向毫秒飛躍,這其實已經達到可以商業應用的性能了,由此也開始改變業務模式。
4、用戶需求從「大而全」到「小而精」越來越清晰
瑞萊智慧的徐世真分享了他兩年來對隱私計算行業的觀察。他認為用戶需求從「大而全」到「小而精」越來越清晰。
以前用戶對隱私計算的場景和能力還處在探索中,追求大而全,MPC、聯邦學習都要使用,多種算法和功能都要涵蓋,但是如果問將來如何使用,可能還比較迷茫。現在用戶已經了解哪個模塊可以解決哪個問題,同時針對大數據下的某項具體業務有了較為清晰的需求。
但是隨之而來的是小數據變大數據的問題,以前百萬級別的數量現在變為億級或十億級,TB甚至PB級別。這一問題也是亟需解決的一大難題。
二、侯銳:多行業隱私計算的可複製性局限可能會限制公司的發展,這個問題如何解?
說到商業導向,其實當我們談商業的時候有一個另外的問題,可複製性。比如在金融領域,這裡面存在可複製性和規模化挑戰的問題。比如公司A做了工行,但可能到交行就搞不定了,需要另一個。複製性和通用性的潛在局限可能會限制公司的發展,大家對這個問題怎麼看?
星雲Clustar CTO 張駿雪表示,隱私計算還是相對比較早期的技術,從技術發展到場景應用並沒有太長時間,一定程度上存在產品難以複製的問題。星雲Clustar在隱私計算領域做了很長時間,我們把自己的業務分成三大塊。從上到下,分別是通過隱私計算給客戶輸送合規合法的數據,幫助他們實現風控、營銷等應用;第二,是數據平台、隱私安全、數據底座產品;最後,星雲Clustar獨特的算力產品。
從行業上看,最上面這一層(通過平台輸送數據),相對來說可複製性比較強,比如給一個銀行引入新的數據,跟它完成了一定的風控建模,知道這個數據在這個業務上有很好的效果,這個模式複製給另外一個有相同業務的銀行金融機構,底層的算力產品是相對標準的硬件,可以本地或雲批量化部署到不同機構、平台。
唯一難以標準化的是中間的平台部分,不同機構、領域可能存在不同需求,比如銀行A可能在安全方面需要較高,但銀行B可能需要在用戶界面更易用。所以,星雲Clustar的應對方法是,技術棧需要全面,通過相對可複製的產品,抵消不可複製產品帶來的問題。
洞見姚明覺得軟件產品的標準化程度,一定是伴隨行業差異化產生的。在他看來,金融是標準化程度最高的領域了,比如金融風控場景,金融科技從業者都了解其模式比較純粹、標準化程度極高。如果服務於其他行業,比如工業物聯網、製造業、車聯網、政務等,它的定製化程度就會更高,差異化和非標準化程度更嚴重。
他說,如果放開軟件市場,從外延去看,當軟件部署或軟件的行業應用達到一定規模之後,大家都在使用隱私計算作為數據協同、數據交換、數據流通的工具,這些工具之間一旦連接,會構成一張數據智能網絡平台,在這張數據智能網絡平台,可以衍生的產品豐富程度和標準化程度會進一步提高,它鏈接了數據,形成了智能,最終提供給客戶真實業務場景中的降本增效和業務創新。
因此,姚明認為隱私計算生態的產品和隱私計算軟件產品,是兩個不同的概念。隱私計算軟件平台產品,會隨着不同行業應用的擴大化或服務的標準化,快速形成標品的複製能力。但對於隱私計算所構成的數據智能網絡市場,他認為它的潛力會更大。
富數吳海斌則覺得,金融這個產品的複製性特別強,所以我們不擔心這個問題,每次去銀行他們都問,某某家銀行怎麼做的?一說,覺得好,他們也這麼做,所以複製性特別強。所以這個一旦通了,特別是我們給最複雜的銀行部署了之後,把最複雜的網絡環境全看了一遍之後,我們覺得給這些中小銀行進行布設,困難程度更小,業務模式複製過來更容易,所以我對這一點是非常樂觀的。
瑞萊智慧徐世真接着表示,隱私計算其實也可以成為其他現有成熟產品的fearture,比如隱私計算數據庫、隱私保護大數據分析引擎、隱私保護分析文件系統,剛剛也有廠商提到類似的概念。一個文件系統,本身就是成熟的標品,具有隱私保護功能的文件系統,一定也是標品,也是成熟的。所以一方面,要看它的需求是否規範成熟,是否是少量定製化的。另一方面,隱私計算是否可以結合現在已有的成熟標品去做,這也是我們現在正在考慮的事情。
三、楊強:面對「僧多粥少」的困境,創業公司如何破局?
目前隱私計算行業領域需求出來,一大波公司就會蜂擁而上,如此激烈的競爭,各家公司憑藉什麼才能勝出?
張駿雪總結了星雲Clustar的三點經驗:
第一,作為創業公司,最大的特性就是靈活。目前在整個隱私計算賽道里,不僅僅有創業公司,也有一些大廠在入局,相對來說競爭更加激烈。創業公司的作為純粹的技術供應商能夠更加中立。
第二,差異化競爭。找到自己不一樣的特色,星雲Clustar是一家以算力為核心的隱私算全棧技術提供商,特色在於高性能算力,因此和其他隱私計算廠商更多是競合關係不是完全的競爭狀態。隱私計算作為非常新興的行業,在商業模式方面與充滿了「戰爭迷霧」,但目前業內公認也是技術壁壘最高的需求,就是加密帶來的對更高性能算力的訴求。星雲Clustar希望以高性能的算力加速為行業賦能。
第三,堅持做新的科技創新。這些投入可能短期內看不到效益,但是從長期角度來說,一是形成技術壁壘,二是能在充分競爭的市場上找到一些別的出路。
洞見科技姚明認為:現在隱私計算的市場是迷霧期,大家似乎感覺方向是正確的,但路徑不夠清晰。隱私計算公司首先必須要明確自身是「To 客戶」還是「To VC」的公司,然後要找到自己差異化服務的模式和特點。
他提出了隱私計算創業要經歷起跑、發力、衝刺三個階段。在創業長跑過程中,在起跑階段,憑藉的確實是技術,包括算法的先進性、技術的成熟度、產品模式的差異等;但是在發力階段,憑藉的更多是耐力、資源和商務關係,這些都是to B的隱私計算行業不可或缺的要素,如同「木桶理論」,任何一個短板缺失,都會導致你的上限很低;在衝刺階段,to B要有深刻的行業理解,比如服務於金融,不管是信貸市場還是資管市場,你有多麼強的行業積累和行業KnowHow、能給客戶提供什麼樣的端到端的服務能力,決定了你能給客戶帶來的商業價值有多強。
所以隱私計算也會經歷從起跑、到發力、到衝刺的三個階段,每個階段所依賴的能力、資源和支持都是各不相同的,每一家隱私計算企業如何在這三個方面做出差異化、做到堅持和有耐心都是很關鍵的。
他表示:「即使現在的市場是僧多粥少,但任何競爭總是強者為王,總是那些能夠堅持,能夠踏踏實實服務用戶者最後能勝出,這是行業發展的規律,我也深信這一點。」
富數吳海斌認為:「差異化的優勢很重要,只要專注一個領域定位好,差異化的優勢就凸顯出來了,相對來說競爭就會小很多。站在商業化的角度,更多的是做解決方案,而不是介紹技術有多牛,技術固然重要但更重要的解決問題的能力,為用戶帶來價值的能力。」
徐世真表示:「瑞萊智慧定位於打造安全可控人工智能基礎設施,數據安全、算法可控和應用可控,都是新一代安全可控人工智能基礎設施的重要組成部分,以AI需求為牽引,也確實誕生出大量數據安全和隱私保護的強需求,比如金融、人臉識別等領域,AI廠商布局隱私計算具有必然性。另外從隱私計算落地角度,AI公司常常自帶場景,結合AI的隱私計算也更容易落地,結合AI強大的數據處理和分析能力,也更能實現數據價值閉環。」
據徐世真了解,純隱私計算的平台,在招標的過程中可能會出現狼多肉少的情況,但是結合具體業務場景的隱私計算需求,市場廣闊,競爭壓力沒有那麼大。
總結以上幾位嘉賓的發言,可能都不是純做隱私計算,但是我們也可以從中窺見一個道理,隱私計算不是目的只是一種手段而已,最重要的是商業需求驅動。
四、現場提問:隱私計算的互聯互通或許很好實現也或許很難?
會議現場,與會的聽眾也對台上的嘉賓發起了疑問,作為數據源公司可能要同時接好幾家不同的隱私計算平台,為了降低成本隱私計算的互聯互通什麼時候能實現?目前推進怎麼樣?
姚明表示,洞見科技、富數科技等隱私計算廠商,都在推進互聯互通從標準研製到落地實施的具體工作。到目前為止,不管是政府客戶,還是金融機構客戶,包括通信運營商類的數據源客戶,洞見科技都有互聯互通真實的案例和需求的落地。
姚明認為,隱私計算的開源,不管從科研角度還是從實驗角度,對整個行業都有着極大的促進和幫助作用。在這個基礎之上,如何保證閉源的隱私計算平台既能保持算法的獨立性,還能避免從「數據孤島」到「計算孤島」的演變路徑,讓大家共享接入的數據資源,以及獨特的算法,這是洞見科技做互聯互通這件事的初衷。
他進一步介紹,從標準層面來說,今年下半年,中國信通院首先出台了互聯互通整體框架,目前正在進行通信層和協議層標準的制定過程中,應該近期會發布;金標委行標和信安標委國標的互聯互通標準也在制定過程中。;除了深度參與了上述標準的制定,洞見科技也聯合了幾家友商在共同推進隱私計算跨平台互聯互通國際標準的制定。
從這件事的終極角度來看,如果大家最終認定隱私計算是跨行業屬性的、有不同廠商在為數據智能網絡提供服務的話,互聯互通就是一件必不可少的事情。也就是說,在整個中國的數據智能市場,如果大家認為最後是有限競爭的市場,而不是由一家壟斷來提供跨層級、跨行業、跨區域的服務,互聯互通就是必需的。
姚明闡述道,所以我們既要尊重通過開源方式的互聯互通,達成從學術到研究生態的建立,也要達成黑盒方式(即閉源模式下)保持算法獨立性、資源獨特性來實現的互聯互通。在這個構建下,洞見科技所推動以及踐行的,是以黑盒的方式來做互聯互通,即提供算法容器,讓除了洞見科技以外第三方隱私計算廠商的算法,可以像網卡的熱插拔一樣,插在這個算法容器里,以這種方式兼容閉源和開源的互通。目前這種模式也被國家標準、行業標準所認可,從客戶角度來說,政府、金融機構和數據源三類客戶都有案例實施,目前我們推動的進展還比較理想。
富數吳海斌表示,富數在開放這塊做了很多嘗試,我們早期跟騰訊、螞蟻、洞見這邊做過很多項目,進行互聯互通的嘗試。
但是就目前整個行業發展階段來看,互聯互通沒有放到最緊急層面,因為大家還有自己生存狀況的問題。
目前,我們幾家主流廠商也在討論這個問題,看看通過什麼方式能包括自己的IP在裡面,同時讓甲方或數據乙方都布上一套體系,通用我們不同的算法,能夠把這個數據打通,這也是我們樂見其成的,但確實還需要一點時間。
星雲Clustar張駿雪補充道,開源也是推動隱私計算互聯互通的重要可行路徑之一。星雲Clustar作為FATE開源社會的技術委員會單位,未來也會在FATE社區中積極推動互聯互通的協議、標準等草案。
徐世真表明,短期實現互聯互通走容器化、可插拔是比較可行的方式,但長期來看,與安全隱私相關的產品,還是必須要開源。如果不開源,從公信力來說,安全性還是有一定問題,所以我們認為從長期的角度來看,密碼學操作符和執行邏輯的開源,會對互聯互通方面產生更強的助力。執行邏輯可以用數據流圖表示,可以在數據流圖這個層面做更高層次的互聯互通。但短期在熱插拔以及可運行的算法容器層面的互聯互通還是比較現實的選擇。
徐世真介紹道,參考AI發展路徑,瑞萊智慧目前採用的是底層編譯器路線,通過數據流圖調度執行底層算子。以「底層數據流圖」的形式,在集成新機器學習算法時,不用針對每個參與方編寫對應的計算邏輯,能夠自動改寫,而且支持適配上層多種機器學習算法。
五、侯銳:2020年和2021年相比,投資人看到最明顯的變化是什麼?
1、從不成熟到成熟需要耐心
二十年前,互聯網剛剛起來的時候,誰都不知道這到底是什麼?當年一頭扎進互聯網的無外乎不燒錢的,但是如今互聯網已經成為基礎設施,像水和空氣一樣,人們的生活離不開它。
基石資本的黃依群從投資人的角度分析了她的體會:「一個科技成果的商業化,必然要走過很漫長的孤獨期,摸着石頭過河一般找到一個合適的場景落地,生根發芽,慢慢長大。」
她感受到,隱私計算在去年下半年因為出現數據安全問題,而被投資圈提及,當時有投資機構想去星雲Clustar交流一下了解隱私計算到底是做什麼的、怎麼做的、訂單是從哪來的?
今年以來,隱私計算這個概念為大家所知,市場上出來一批隱私計算的項目,但所有的項目到今天,成規模的大單其實也不太多,像金融用戶比較靠前的應用,也是從POC開始慢慢往前做嘗試的,也就是說市場需求因為這些政策的原因被激發起來了。但它真正成為一個成熟的產品,其實現在這個點還沒有看到它有正式地爆發。
黃依群認為;「現在大家都管自己叫「隱私計算」,或許明年隱私計算就會更加細分,除了主標題外還應該有一個副標題,更加精細化。」
2、隱私計算呈現積極動態發展
沸點資本馬蘭從另一個投資人的角度分析了她的體會:大概在2018年的時候,很多金融機構將合規化放在第一位,合規化優於商業化,所以那時候很多以監管作為切入口的企業成長起來。到了2019年,政府正式提出數據化要素這件事,合規化重要,數據安全也同等重要,期間還嘗試了最早的數據交易所,發現數據既做資產,又做交易,存在很大的數據安全問題,而隱私計算技術其實是可以協助解決這個這個問題的。所以到了2020年,已經入局的相關企業持續發力,同時又加入了一些新的創業公司,資本也很積極的跟進,其實這恰恰是一種肯定。2020年到2021年,不斷有創業者找到新的落地場景,甚至產生收入,所以這個行業還是比較動態的,在往積極、更安全的狀態發展。
六、楊強:若投資人2022再投隱私計算,只關注什麼?
面對隱私計算崛起的投資風潮,這些手握重金的投資機構是如何看待隱私計算這一賽道的,他們關注的點是什麼?這場關於隱私計算投資的背後傳遞了什麼信號?
楊強老師表示:「隱私計算從一個技術發展成為一個產業還需要經歷陣痛的過程。」那麼作為投資人會更關注哪些方面?
1、種瓜或許得豆
黃依群表示,瑞萊智慧和星雲Clustar都是基石資本天使基金投的項目。星雲Clustar是2019年投的,當時還沒有隱私計算這個明確的主題。其實這兩個項目在投之前,主要關注的是團隊的論文發表的數量和質量,以及歷年來論文被引用的次數和影響因子。
瑞萊過投審會的時候,坦白說我們覺得他們當時的技術非常好,但業務比較散,還不能非常準確地找出他們聚焦的領域,可能金融是非常好的方向,但也許工業、製造領域也是非常好的方向。如今整個瑞萊的隱私計算的平台,包括架構已經非常清晰了。
因此不是看隱私計算的概念進行投資,也看重了這兩個團隊非常強的技術優勢,然後再看到整個團隊創業的動力。雖然當時是一個初創團隊,可是團隊人員的配置已經相對完整,基礎研究、產品研發、公司運營、銷售等崗位初具雛形。
早期投資的魅力就在於,最開始投的A,可能中間變成了B,最後它上市的時候是C。
隨着數字科技的不斷發展,作為早期的投資人,可以跟初創公司一起想可以在哪些場景上得到應用。
2、因定位而異
沸點資本馬蘭表示:「資本關注一個公司的可行性主要包括四個方面:第一技術,是否有行業領先性,是否能解決根本問題,產品是否有標準化的趨勢;第二團隊;第三拓展市場能力;第四,融資力,也就是持續供給能力。未來兩年還會關注政策/標準的趨勢,關注公司自上而下的服務和整合能力。」
隱私計算領域涉及到交叉融合科學,包括人工智能、密碼學、數據科學等交織在一起,非常重要的兩點,一是人才,二是技術。
當技術成熟到一定程度,企業連接到to G、to B時,拓展市場的能力尤為重要,如何讓用戶信任你的技術、選擇你的產品,如何做好持續的優質服務,是另一個要解決的難題。
融資力是讓企業、創業者持續成長的能力。隱私計算的爆發大概率還會需要幾年的時間,而技術團隊等都需要很高的成本去維護,所以要有持續的融資能力,這是比較現實的問題。
當然,不同階段的投資人,對公司發展的關注點可能會有所不同,比如早期可能更看重團隊,成長期可能會偏向拓展市場能力,但最終是對企業能力綜合考量的結果。
GAIR 2021大會首日:18位Fellow的40年AI歲月,一場技術前沿的傳承與激辯
2021-12-10

致敬傳奇:中國並行處理四十年,他們從無人區探索走到計算的黃金時代 | GAIR 2021
2021-12-09

時間的力量——1991 人工智能大辯論 30 周年紀念:主義不再,共融互生|GAIR 2021
2021-12-12

未來已來,元宇宙比你想象中來得更早丨GAIR 2021
2021-12-12

由於微信公眾號試行亂序推送,您可能不再能準時收到AI科技評論的推送。為了第一時間收到AI科技評論的報道, 請將「AI科技評論」設為星標賬號,以及常點文末右下角的「在看」。