close
很多人把Web 3.0的發展歷程,與以人為本的網絡發展的黎明時代相提並論,認為其本質是一場文藝復興。
在初代Web誕生的90年代,許多人對待新鮮事物持謹慎態度,卻很少有人真正預見到人類的創新活動將會在未來 20 年中拓展到多遠的邊界。

如今Web已經將我們現實生活萬事萬物投射到了線上,形成龐大圖譜。但是,Web是否已經走到了進化的巔峰呢?下文是鮑捷博士在W3C 2022年度全球技術大會研討會上的演講實錄,他將帶我們一起回顧Web 3.0概念誕生時被寄予的理想,發展歷程,並前瞻其可能帶來的未來。

1

價值互聯,殊途同歸的理想

非常高興時隔三年,再次見到W3C的同學。十幾年前,我們剛剛開始在W3C工作的時候,沒有什麼中國人。我們記得第一次遇到安琪(李安琪,W3C時任中國區總經理),那中國區的人很少,現在很高興有這麼多中國區的同事們在這裡。以前我們經常開玩笑說W3C的「C」是「China」,相信這一天會到來的!W3C成立於2001年,當時語義網剛剛起步。我於2007年開始參加W3C標準化工作,到現在已經十五年了,這個期間我們見證了許多事情。今天想和大家回顧一下我們在這個過程中取得的成績,犯過的錯誤,以及我們如何克服了這些錯誤。首先正一下名。最近Web 3.0這個詞非常火,實際上Web 3.0最早是由Tim提出來的。Tim在2006年的文章《更加革命的Web》當中,提出了Web 3.0的這個詞。雖然現如今這個詞的外延有了很大的變遷,但內涵沒有變化。



我們要理解Web 3.0就要知道Web 1.0、2.0,其實07~09年W3C的社區裡有很多同事們已經用這個詞了:這是當時W3C的CEO 史帝芬的演講,這是我翻到Jim有封郵件里提到的Web 3.0,還有Project10X,還有2009年IEEE雜誌Jim Hendler組織的專題,還有2009年春天我們組織的Web 2.0+Web 3.0的研討會。可見這不是全新的詞了!

JIM Hendler 2007年給OWL工作組的一封電郵,信中有提到Web 3.0的概念

2009 年,Project10X 提出宣言

2009 年的IEEE Computer 的雜誌出版的Web 3.0專刊

2009 AAAI 研討會:Web 2.0 + Web 3.0 = ?

但是14年Gavin Wood重新定義了Web 3.0,也就是從傳統語義網的Web 3.0,衍生到今天以區塊鏈為基礎的Web 3.0。但是他們所要想解決的問題,就是我今天想去陳述的,兩個版本的Web 3.0,本質上做的是一件事,都是要解決Web的信任問題、確權問題以及分布式應用問題。所有都是為了實現Tim的最終願景:This is for everyone。一個更加開放、更加自由的、更加的去中心化的Web。

倫敦奧運會開幕式現場,Tim Berners-Lee 有一個 performance 重演當年他發明Web的原場景:1991 年,他在電腦上寫了願景——This is for everyone。即,要讓全世界所有人能夠自由去訪問知識。

回顧一下Web的初衷,我們需要把時間撥回30 年前,Web剛剛從 Internet 上演進出來的時候,Internet是關於數據的,而Web是關於內容,但更多是關於信任。有一次我問Jim,Web 是什麼,他說 Web 就是驚喜。在Web上我們可以發現更多沒有發現的東西,Web就是Serendipity。Web就這樣一個儘可能的把麻煩交給我們——我們是指W3C——然後把自由交給整個世界上的其他人民的這樣一種設計。在「Weaving The Web」書中,Tim就提出了一個很宏偉的計劃,不僅要把全世界的內容聯繫在一起,還要把全世界的知識聯繫在一起。後來Web的很多東西,其實在其誕生的第一天就已經在規劃里。

所以這是一個很宏大的規劃,我們把它分為三個階段:第一個階段是文檔的Web,第二個階段把Web加上了元數據,就變成了Semantic Web,這個階段稱之為「知識的互聯」。再後來我們遇到了很多挫折,有一段時間大家認為語義網的技術已經過時了。但是,我們發現它又從另一個角度衍生出來了,以知識圖譜和圖數據庫的面貌重新出現。這幾年又出現新的Web 3.0,我們發現以前我們犯了很多錯誤,但是我們原來想達到的目標用不同的途徑,最後反而實現了。

2

語義網,上一代Web3.0

Web 1.0是文檔的互聯,這個很容易理解,不多說了。到2000年之後,出現了Facebook等一系列社交媒體,就是Social Web,我們稱之為Web 2.0時代。Web 2.0被稱為Social Web,我認為不應該是社交網絡,應該是社會網絡,它的本質是人與人之間的關係,是把線下的各種關係投射到網絡上。它的另一個本質就是把線下的實體搬到線上來,線下的各種人、公司、各種商務關係,甚至於今天訂餐時所需要的每一道菜、每一個餐館、打車時的每一個建築物都是一個個實體,我們把線下的實體搬到線上來,構成了線上的生活。今天大家用餓了麼、滴滴、美團的時候,都要意識到其背後是很大的實體網絡,我們把這個實體網絡稱之為「知識圖譜」。它映射了實體關係,這些實體關係就是知識,所以當年的語義網的理想其實已經實現了。

我記得08年統計全世界的Web頁面有30%在用元數據,相信今天統計會遠大於這個比例,所以語義網的理想已經實現了。07~08年階段,出現了一個新的問題,那時候Tim大聲疾呼希望這些大型社交網絡可以開放數據。這些大型的社交網絡不願意開放數據,構成了walled garden,即「有牆的花園」,所以07年之後W3C的領袖們大聲疾呼open data,開放數據。

因為自Web誕生之日起,其核心價值觀就是開放。如果把數據封閉起來的話,就意味着我們將喪失大量的價值。這些預言在之後的十幾年之內逐一得到了印證。比如說數據集資產,數據成為 21 世紀最重要的資產,其價值未來或將超過石油。這個概念在中國過去十幾年的大數據時代已經被廣泛認可。

去年Facebook 將整個澳大利亞國家的新聞屏蔽掉

‍‍過去這幾年發生了很多事情表明如果我們控制了大量數據,就會擁有與之不相稱的權利。而我們整個世界的治理體系尚沒有相應的更新。

所以說,權力如何界定,價值如何交換,成為 Web 上最大的問題之一。如果我們沒有一個更加分布式的 Web ,以及不能更好地保證內容的權益界線的話,那 Web 是可能走向更加沒有前途的方向。‍‍

這是一系列先驅們提出語義網很重要的背景。只是在當時大家想的得比較學術化,大家想如果要讓機器理解網頁到底在說什麼,就需要有元數據,所以那時候大家想要有語義,想要有知識。提到這一系列就會想到應該把人工智能的分支——知識表現——引入進來,既然是知識表現就應該有各種邏輯的表現力。沿着這個方向我們走了十年,後來發現走偏了。如果深度探討,今天的時間就不夠用了。語義網到底是什麼?今天是在W3C的會場上,我們應該說W3C就是用語義網一系列技術棧的應用。但是我們要反問更深刻的問題:如果拋開「用什麼」的話,那麼我們真正想達到的核心目標應該是什麼呢?在我看來有三件事:第一,動態的數據建模;

第二,能夠讓數據流動起來,而不是分布在一個個網站裡;

第三,支持更多任務的自動化。在此基礎上,我們衍生了更多新的東西,比如Web 3.0時代的各種確權,但底層的訴求是上面的三點——更敏捷、更分布式、更靈活的Web。為了達到這一點需要各種各樣的元數據。如果將這三點進一步總結,在應用層面上,對於客戶和用戶而言,他們並不關心底層數據如何實現,他們希望有更聰明、更自動化的機器。Tim等人在2001年《科學美國人》上的奠基文章里舉的例子,就是如何做一個可以預約醫生的機器人。對於廣大的Web用戶而言,他們不關心用什麼技術標準,只關心是否已經實現了,今天是否已經實現了?其實已經實現了,現在有很多在線預約醫生的網站和APP,它可以幫助我們做事情,有可以幫助我們規劃路線等方面的機器人,它是不是用了之前提到的技術呢?沒有,但我們的目的實現了,我們應該擁抱的這些發展。

歸根結底,這是一個semantic WEB和SEMANTIC web兩種不同的技術路線之間的衝突。這個比喻是Jim Hendler在2005年前後提出來的。他說Web上所謂的語義網,最關鍵的東西不是semantics,而是Web。真正帶來價值的是我們把它放到網上來了,所以是我們的開放,讓數據更加有流通性。這就是以人為核心的思想。後來工業界繼續把這條路向前推進,把Semantic全部去掉了,就有了後來的Knowledge Graph。
再回顧一下語義網,如果拋開它到底「用」的是什麼的話,去思考它到底能給我們「帶來」什麼?我認為最核心一點就是Web的任務自動化,這一點其實目前已經實現了,雖然沒有用OWL。從另一個角度來說,語義網是上一代的分布式應用。從07年~14年我花了很長時間研究Semantic Wiki,在 Semantic Wiki 上,我們發現可以把各種各樣的規則也寫成模板。這些模板天然的就是一種數據,如果一段代碼是數據,就可以被查詢,就可以被使用,就可以被集成。後來在Tim團隊一起研究AIR(一種可追責語言)的時候,本質上就是我們把這些代碼放在可以查詢的平台上,就是RDF。今天這種平台成為了以太坊平台、區塊鏈平台,我們管它叫「智能合約」,代碼變成了數據的一部分,這就是一個分布式的應用。今天我們可以理解很多年前無法理解的,語義網的本質就是這兩個,一個是任務的自動化,一個分布式應用。

3

從語義網到知識圖譜

當我快速回顧語義網的演進,發現其實它是整個知識表現領域與Web結合的產物。之前從框架網絡到專家系統,經歷了很長的發展階段。在2000年前後,語義網誕生,2007~2008年,關聯數據是這個領域的最高峰,但是到2008年金融危機之後進入了低谷,2012年Google提出了知識圖譜,之後中國開始出現了這樣的概念,並逐漸開始發展起來。很多技術的演進過程就不逐一說了。OWL 這個語言,大概 04 年出現第一個版本,09年是第二個版本,是基於描述邏輯的語言。它給了語義網以語義,就是Semantics。但是從某種程度上來說,這種很強的語義也導致了後來這種語言比較難以理解,所以它在工業界的應用就不夠,最終在工業中真正應用起來的並不是語義非常豐富 OWL,而是RDF 以及 RDF 各種簡化的版本。比如其中有一個版本叫 RDFa,我們對其再進一步簡化,將其中一部分思想融合到了 HTML 5 的 semantics 裡面。前端工程師現在都在用,大家可能並沒有意識到這背後有一個很長的技術發展路徑,有 semantics 也不知道為什麼有這種東西,也不知道這個技術是怎麼來的,但是挺好用。

後來就衍生出非常巨大的鏈接數據以及各種各樣的開放數據,07年前後有Linked Data,以及Schema.org,以及到2012年Google 知識圖譜。

總結下來,十幾年的時間,我們從無到有地把 semantic Web 整個領域創建起來以後,發現沒人用,因為太過複雜就不停地簡化它,簡化它到 12 年之後,開始把它簡化成知識圖譜。

我們來回顧一下06年版本的W3C語義網底層技術棧,從URI到XML、RDF、RDFS等等,上面還有Proof、Trust,當時這些工作還沒有做,後來這些領域的興趣減弱了,被其他的領域繼承了。到底怎麼被繼承呢?12年之後,最底層的是圖譜技術,我們現在稱之為知識圖譜,這個領域是比較成功的;第二塊是知識技術,有SPARQL、OWL、RIF等等,直到最近兩三年又重新興起;第三部分是互信技術,後來變成了區塊鏈的技術。

知識圖譜顧名思義就是知識+圖譜,知識就是schema,圖譜就是 instance 。我們把知識圖譜拆成七層,從底層的文本一直到上層的規則,更加貼近非結構化數據的格式。這個金字塔更貼近目前工業界用的知識圖譜,和技術棧之間是有對應關係的,這個知識部分相對於知識技術部分就是SPARQL 、OWL 、RIF這一部分,圖譜部分也是數據部分,相當於 RDF 、XML 的這一部分。

這兩年數字化轉型非常火爆,尤其是各種中台技術、流程機器人技術。雖然大家在不同的時間提出了這樣的技術,但是在數字化轉型的幾個核心的階段,比如流程的自動化、服務的開放化等,恰好可以對應到語義蛋糕的不同層次上。技術總是有這樣的特點,一開始我們想是這樣,發現原來的路走不通,這個過程中誕生了各種副產品反而走成功。知識圖譜和大數據也很有關係,從傳統的數據倉庫,內部的結構化數據到後來的數據湖,多個來源的這種類型化的數據,是我們有了融合了 NLP 的能力之後,再有了知識提取之後,就有了智能中台的能力;再有了跨平台的信任能力,比如智能合約,區塊鏈的開放平台的能力。整個技術棧和目前在企業界的應用有很大的關係。05~06年時候看得不是很清楚,那時候想到企業級的應用都是醫藥、政府的應用,Web當時用得不是很多。12~15年,我們開始嘗試,亞馬遜、Google等做成了推薦、搜索、智能音箱等應用,都是已知的應用。未知的應用是什麼呢?後來發現在ToB企業數字化轉型當中有大量的應用。這是15年認識到的。

4

數據資產權利將催生新的產業

剛才講的是我們犯的錯誤以及無意中取得的成績,再往後,從語義網到知識圖譜這個版本,它和另外一個版本的 Web 3.0 融合在一起,就是區塊鏈相關的這種嘗試。新一代的Web 3.0的幾個核心特點:一是價值,或是貨幣,將成為互聯網固有特徵;其次是去中心化應,為用戶提供新的功能;第三是數字身份和數字資產權利。這三點並不是新的,10年左右Tim已經開始為之努力。

從長遠來看,我認為Web 3.0 最重要的價值是要催生一種基於數字資產的市場經濟。正如財產的私有制促進了產業的分工,知識產權的保護促進了知識的傳播,那麼數據資產權利將催生全新的產業。

Web3.0是什麼?

可能我比較偏頗,但是我認為這件事才是當前世界上最重要的事情。現在世界上發生貿易戰、國家衝突等,但十年之後、二十年之後或沒有人再會記得這些。但是大家的生活將被改變,有一群Web的人、有一群技術的人創造了數字資產產業,創造了數字資產市場經濟,為未來一代人帶來了最大的經濟增長點。這是地球上現在最重要的事情。

這個觀念已經不新了,09年David Siegel已經在《Web 3.0》這本書里展望了。一說Web 3.0,一定會提到區塊鏈,它一定是去中心化的系統嗎?不一定。這裡我提出一個不可能三角,安全性、去中心化和可擴展性,不可能同時滿足,所以在Web上做需要犧牲,我相信被犧牲的是去中心,因為安全性和可擴展性不可能被犧牲。去中心化又往往表現為強中心化,今天就不展開討論了。08年同時提出了區塊鏈和互信技術。Tim 提出了AIR就是基於 RDF 的可追責語言,他的觀點是Web是開放的組織,不能事先禁止大家做一些事情,但要進行事後追責。所以分布式信任技術並不僅僅是區塊鏈,它是一個龐大的技術體系。鏈式追責也不是新的概念了,Git就是這樣的系統,區塊鏈也是類似的系統。Web 3.0是否必然建立在區塊鏈之上?Tim最近說不一定。我相信它在一開始的時候肯定還是跟區塊鏈是有關係的,完全拋開區塊鏈做一套去中心化的工作系統很難做到,但區塊鏈未必是這件事唯一的實現路徑,也不是最核心的本質,因為它的核心本質仍然是可追責性,不是區塊鏈的分布式賬本。

現在領域發展早期,更多強調的是革命,甩開原來的那一套鬧革命,但是,我們面對利維坦,不可能革命,最多就是改良。AIR是Accounability。Solid是Tim最近做的身份認證系統,現在在做一個新的公司Inrupt在實現這個想法。

總結來說,從Web發展來講,我認為未來知識圖譜再往前走了,肯定會發展Web3.0,它依然會變成一個很龐大的體系,我把它分為七層,上面的合約層、邏輯層,恰恰是當年做語義網時候最終沒有實現的那部分願景,也就是Proof、Trust等等,我們希望在新的平台上重現大家的理想。


未來的Web,基於資產的互聯網

Web過去已經有三十年時間,我相信未來還有很長的路要走,如果把第一代Web稱之為Doc Web,第二代是Social Web,過去十年是Data Web,未來20年可能還要實現Token Web和Value Web,就是萬物可通證,通證之後,所有數字資產都要可分發、可清算,相信2040年之後一定會有Value Web,這個過程中將建立新的市場經濟形態。相信在W3C同仁的努力下,一定會實現!謝謝大家!提問:最後幾頁PPT里提到了通證、確權、清算等等,這些詞都是動詞,誰來做呢?

鮑捷:我覺得在不同的國家會有不同的路徑,如果在中國,可能會有一些體制內的方式來推進,如果在海外,更多的是由分布式推。

提問:給我的感覺將來是有大而無形的企業或者是實體,很難成為真正的去中心化的狀態?

鮑捷:這個問題我也在思考,Tim等領袖發明了這個詞「社會機器」,我42歲之前很擁護這個東西。但是,在此之後我改變了想法。最近我看了一本劉慈欣的科幻小說《2185》,非常推薦大家去看看。

聯繫我們



商務諮詢(需求對接、產品試用等):contact@memect.co

也可聯繫微信18500686425,加入智能金融社群,添加好友,請附上姓名、所屬機構、部門及職位。

如果您有意願加入我們,在智能金融領域做一番事業,請聯繫:hr@memect.co。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()