美國小說家菲利普·迪克曾在他2013年出版的小說《少數派報告》的開篇為我們描繪了這樣的一幅圖景:在未來,人們發明了測罪系統,通過將海量數據源源不斷注入到三個先知的大腦中進行分析,就可提前對可能犯罪的人進行抓捕,從而將重案的犯罪率,降低百分之九十九點八。
而在斯皮爾伯格的同名改編電影中,將對於未來「數據分析」的想象進一步具像化。當主角阿湯哥走在路上時,廣告可以隨時隨地識別他的視網膜,通過提前預測人們的個人需求,追着你到處跑。
那個年代的小說和電影的創作者,似乎都有着同一種焦慮,我們是否真正的需要這樣三百六十度無死角,被科技籠罩着的未來?
然而,不管是正方還是反方,都無法否認,這個五十多年前的科幻小說情節,已經藉由「大數據」「機器學習」「人工智能」,這樣的人造「先知」逐漸的變為了現實。
保護隱私,
並未「一刀切」地阻止數據流通
2018年歐盟發布《通用數據保護條例》,2021年我國出台的《個人信息保護法》,都加強了企業對於用戶個人信息獲取的監管,但與此同時也都並沒有一刀切徹底斷絕「精準化營銷」的發展可能。

就在2月16日,谷歌宣布正式推出自己研發了兩年多的新產品Android「隱私沙盒」,企圖在效率和隱私間做好平衡。

簡單來說,谷歌傳統的廣告推送模式是,基於此前用戶的行為搜集,得到一個用戶畫像,然後推送相關的廣告,廣告商可以精確地看到具體用戶的個人信息、愛好等數據。
隱私沙盒的模式則是,將具體的人隱秘在人群中,通過機器學習,將具有相似興趣的人群劃到一堆,讓廣告商向這一群人投放個性化廣告。這樣,既享受了大數據的便利,又保護了隱私,阻止廣告商過度使用用戶的數據。
聽起來真是完美。但是,完美正是我們這個時代最該警惕的詞語。
問題繞了一圈,似乎由技術引發的問題,也只能在技術上尋求突破。畢竟,人性是經不起考驗的。結局似乎也就只能想到如《少數派報告》最後那種,將系統徹底關停了。
而現在,在我們普通人接觸不到的前沿領域。存在更為現實的「解決方案」嗎?數據和隱私之間是否天然矛盾?
技術專家:
數據流通和隱私保護並不矛盾
知識博主「江湖舉人」採訪了浙江大學計算機系博士、數據安全專家,螞蟻集團可信隱私計算框架「隱語」負責人王磊,王磊給出了這樣的解答——通過隱私計算技術,可以實現數據與隱私共存,但現在仍處在探索的階段。

王磊認為,從技術上來看,隱私沙盒是把原來通過第三方cookie精準收集的個人信息模糊化保護起來的處理,是針對數據使用和隱私保護矛盾問題的一個很好的嘗試,根據公開方案,使用了隱私計算領域常見的聯邦學習、差分隱私的技術。
但其中一個問題是,出於商業的考慮,搜索引擎為商家制定廣告投放規則和人群分析,而商家只能按照既定規則來選擇廣告投放人群,因此也引來了很多同行的反對。
實際上,隱私計算技術的技術方案、應用空間遠遠不止這些。除了隱私沙盒使用的技術,其他如多方安全技術、同態加密、可信執行環境等技術,都是可以解決數據使用和隱私保護問題的技術方案。
這裡面反覆提到一個詞,就是隱私計算。

隱私計算是一系列試圖實現數據安全的技術統稱。當我們在享受各種app、應用精準化、個性化的服務同時,我們的收入、職業、興趣、等等一大批的個人信息,如何能不暴露在陽光之下,是研究者最為關心的問題。
目前,市面上有三種主流隱私計算技術發展的方向:聯邦學習、多方安全計算和可信執行環境。
簡單來說,聯邦學習是把數據在本地加密好發給需求者,如果想利用這些數據建模,只能使用這個打包好的數據包,不能看到裡面詳細原始數據。
多方安全計算則有點像玩狼人殺這樣的遊戲,想要公平公正進行,就必須要一個大家都信得過的中間人,只不過,這裡法官是加密算法。通過數學理論保證參與計算的各方成員輸入信息不暴露,且同時能夠獲得準確的運算結果。
可信執行環境,就是通過硬件,提供物理層面的安全隔離和計算環境,在保護用戶隱私和數據安全的前提下,以此來保證其內部加載的程序和數據,在機密性和完整性上得到保護。
但三個方向各有優劣,並不能單獨完美地解決這一矛盾。聯邦學習可以解決複雜的算法建模問題,性能也不錯,但是安全性不如多方安全計算,且不能處理數據分析類問題。可信執行環境具備更好的性能和算法適用性,但是對國外的硬件有極大的依賴性。多方安全計算不依賴硬件,且具備較高的安全性,但是性能相對較差。正如王磊說,如何用最小的成本實現最大的效果,是國內外公司都在關注的問題,隱私計算技術尚屬一片藍海。
未來,隨着平均生活水平的提高,公民個人隱私保護意識,數據安全的意識也一定會隨之提高,未來對數據的使用一定不是簡單粗暴的「裸奔」形式,通過隱私計算技術為數據加上一把「鎖」,這把鎖鎖得住隱私,但是鎖不住價值,也就是現在互聯網行業常說的,我們正在邁向數據密態時代。
關於未來如何進一步解決隱私保護的問題,在技術領域尋求新的突破,王磊認為,把數據真正流通起來是個系統化的工程,需要法律法規上,技術上也要突破。但當前的技術有一定的限制,比如單一技術只能解決一定場景下的一些問題,因此我們能不能把這些技術融合起來,形成一個能夠解決更大範圍內場景的更通用技術,正是王磊團隊基於隱語框架在解決的一個問題。
「讓數據流動起來,並且能夠確保數據安全和用戶隱私,是一個系統化的工程。想要通過隱私計算技術實現數據與隱私的共存,需要整合技術實現突破。」
「安全」的便利
才能讓每個人放心
王磊是螞蟻集團可信隱私計算框架隱語開發團隊的帶頭人,他和他的團隊應該屬於全中國最想也是最懂怎麼把數據用起來的那一小撥人。但有意思的是,這樣一群人,天天研究的卻是「怎麼把數據保護起來用。」
但在王磊看來,隨着數據應用越來越廣泛,用戶對隱私保護的心智會逐漸被建立起來。以https協議為例,剛開始其實並沒有人意識到https在整個交互過程中對信息做加密有什麼意義,但當這個協議被大家接受以後,最終所有的上網都會採用協議,來保護整個訪問鏈路的安全性。
「一個技術是不是真的好,需要實踐去檢驗,有沒有價值,要看能不能解決實際中的問題。」王磊說,「現在大家對隱私計算的認知並不清晰,但當用戶能在使用中感受到技術的安全性,他就會更信任這個技術,並注重隱私的保護。」
正如福山在《我們的後人類未來》中所說:「我們站在人類與後人類的歷史這一巨大分水嶺的另一邊,但我們卻沒意識到,分水嶺已經形成。」
作為被數據化的第一代人,參與其中的我們可能還沒有完全意識到,我們正在見證着某種歷史的誕生。我們對於隱私抱持什麼態度,直接決定了我們將獲得一個什麼樣的未來。
正如王磊所說,隨着隱私計算技術迭代,用戶在使用場景中感受到了安心,更加放心的投入使用,只有完成了這種信任的閉環,才能讓數據產業真正地騰飛。
以上內容整理自
知識博主【江湖舉人】創作的視頻
原視頻標題為《我們是否需要被數據籠罩着的未來?| 對談頂尖技術專家》

網易文創浪潮工作室出品 未經授權禁止轉載
微信編輯 | 唐不苦
❖ 歡 迎 分 享 到 朋 友 圈 哦 ❖

浪潮工作室長期招聘作者,稿費千字300到800
公眾號後台回復「招聘」即可查看。
