文因互聯 - 行業觀察|Web 3.0或將帶來全新的市場經濟形態－鑽石舞台

Jan 12 Thu 2023 02:00
文因互聯 - 行業觀察|Web 3.0或將帶來全新的市場經濟形態

很多人把Web 3.0的發展歷程，與以人為本的網絡發展的黎明時代相提並論，認為其本質是一場文藝復興。

在初代Ｗeb誕生的90年代，許多人對待新鮮事物持謹慎態度，卻很少有人真正預見到人類的創新活動將會在未來 20 年中拓展到多遠的邊界。

如今Web已經將我們現實生活萬事萬物投射到了線上，形成龐大圖譜。但是，Web是否已經走到了進化的巔峰呢？下文是鮑捷博士在W3C 2022年度全球技術大會研討會上的演講實錄，他將帶我們一起回顧Web 3.0概念誕生時被寄予的理想，發展歷程，並前瞻其可能帶來的未來。

價值互聯，殊途同歸的理想

非常高興時隔三年，再次見到W3C的同學。十幾年前，我們剛剛開始在W3C工作的時候，沒有什麼中國人。我們記得第一次遇到安琪（李安琪，W3C時任中國區總經理），那中國區的人很少，現在很高興有這麼多中國區的同事們在這裡。以前我們經常開玩笑說W3C的「C」是「China」，相信這一天會到來的！W3C成立於2001年，當時語義網剛剛起步。我於2007年開始參加W3C標準化工作，到現在已經十五年了，這個期間我們見證了許多事情。今天想和大家回顧一下我們在這個過程中取得的成績，犯過的錯誤，以及我們如何克服了這些錯誤。首先正一下名。最近Web 3.0這個詞非常火，實際上Web 3.0最早是由Tim提出來的。Tim在2006年的文章《更加革命的Web》當中，提出了Web 3.0的這個詞。雖然現如今這個詞的外延有了很大的變遷，但內涵沒有變化。

我們要理解Web 3.0就要知道Web 1.0、2.0，其實07~09年W3C的社區裡有很多同事們已經用這個詞了：這是當時W3C的CEO 史帝芬的演講，這是我翻到Jim有封郵件里提到的Web 3.0，還有Project10X，還有2009年IEEE雜誌Jim Hendler組織的專題，還有2009年春天我們組織的Web 2.0+Web 3.0的研討會。可見這不是全新的詞了！

JIM Hendler 2007年給OWL工作組的一封電郵，信中有提到Web 3.0的概念

2009 年，Project10X 提出宣言

2009 年的IEEE Computer 的雜誌出版的Web 3.0專刊

2009 AAAI 研討會：Web 2.0 + Web 3.0 = ?

但是14年Gavin Wood重新定義了Web 3.0，也就是從傳統語義網的Web 3.0，衍生到今天以區塊鏈為基礎的Web 3.0。但是他們所要想解決的問題，就是我今天想去陳述的，兩個版本的Web 3.0，本質上做的是一件事，都是要解決Web的信任問題、確權問題以及分布式應用問題。所有都是為了實現Tim的最終願景：This is for everyone。一個更加開放、更加自由的、更加的去中心化的Web。

倫敦奧運會開幕式現場，Tim Berners-Lee 有一個 performance 重演當年他發明Web的原場景：1991 年，他在電腦上寫了願景——This is for everyone。即，要讓全世界所有人能夠自由去訪問知識。

回顧一下Web的初衷，我們需要把時間撥回30 年前，Web剛剛從 Internet 上演進出來的時候，Internet是關於數據的，而Web是關於內容，但更多是關於信任。有一次我問Jim，Web 是什麼，他說 Web 就是驚喜。在Web上我們可以發現更多沒有發現的東西，Web就是Serendipity。Web就這樣一個儘可能的把麻煩交給我們——我們是指W3C——然後把自由交給整個世界上的其他人民的這樣一種設計。在「Weaving The Web」書中，Tim就提出了一個很宏偉的計劃，不僅要把全世界的內容聯繫在一起，還要把全世界的知識聯繫在一起。後來Web的很多東西，其實在其誕生的第一天就已經在規劃里。

所以這是一個很宏大的規劃，我們把它分為三個階段：第一個階段是文檔的Web，第二個階段把Web加上了元數據，就變成了Semantic Web，這個階段稱之為「知識的互聯」。再後來我們遇到了很多挫折，有一段時間大家認為語義網的技術已經過時了。但是，我們發現它又從另一個角度衍生出來了，以知識圖譜和圖數據庫的面貌重新出現。這幾年又出現新的Web 3.0，我們發現以前我們犯了很多錯誤，但是我們原來想達到的目標用不同的途徑，最後反而實現了。

語義網，上一代Web3.0

Web 1.0是文檔的互聯，這個很容易理解，不多說了。到2000年之後，出現了Facebook等一系列社交媒體，就是Social Web，我們稱之為Web 2.0時代。Web 2.0被稱為Social Web，我認為不應該是社交網絡，應該是社會網絡，它的本質是人與人之間的關係，是把線下的各種關係投射到網絡上。它的另一個本質就是把線下的實體搬到線上來，線下的各種人、公司、各種商務關係，甚至於今天訂餐時所需要的每一道菜、每一個餐館、打車時的每一個建築物都是一個個實體，我們把線下的實體搬到線上來，構成了線上的生活。今天大家用餓了麼、滴滴、美團的時候，都要意識到其背後是很大的實體網絡，我們把這個實體網絡稱之為「知識圖譜」。它映射了實體關係，這些實體關係就是知識，所以當年的語義網的理想其實已經實現了。

我記得08年統計全世界的Web頁面有30%在用元數據，相信今天統計會遠大於這個比例，所以語義網的理想已經實現了。07~08年階段，出現了一個新的問題，那時候Tim大聲疾呼希望這些大型社交網絡可以開放數據。這些大型的社交網絡不願意開放數據，構成了walled garden，即「有牆的花園」，所以07年之後W3C的領袖們大聲疾呼open data，開放數據。

因為自Web誕生之日起，其核心價值觀就是開放。如果把數據封閉起來的話，就意味着我們將喪失大量的價值。這些預言在之後的十幾年之內逐一得到了印證。比如說數據集資產，數據成為 21 世紀最重要的資產，其價值未來或將超過石油。這個概念在中國過去十幾年的大數據時代已經被廣泛認可。

去年Facebook 將整個澳大利亞國家的新聞屏蔽掉

‍‍過去這幾年發生了很多事情表明如果我們控制了大量數據，就會擁有與之不相稱的權利。而我們整個世界的治理體系尚沒有相應的更新。

所以說，權力如何界定，價值如何交換，成為 Web 上最大的問題之一。如果我們沒有一個更加分布式的 Web ，以及不能更好地保證內容的權益界線的話，那 Web 是可能走向更加沒有前途的方向。‍‍

這是一系列先驅們提出語義網很重要的背景。只是在當時大家想的得比較學術化，大家想如果要讓機器理解網頁到底在說什麼，就需要有元數據，所以那時候大家想要有語義，想要有知識。提到這一系列就會想到應該把人工智能的分支——知識表現——引入進來，既然是知識表現就應該有各種邏輯的表現力。沿着這個方向我們走了十年，後來發現走偏了。如果深度探討，今天的時間就不夠用了。語義網到底是什麼？今天是在W3C的會場上，我們應該說W3C就是用語義網一系列技術棧的應用。但是我們要反問更深刻的問題：如果拋開「用什麼」的話，那麼我們真正想達到的核心目標應該是什麼呢？在我看來有三件事：第一，動態的數據建模；

第二，能夠讓數據流動起來，而不是分布在一個個網站裡；

第三，支持更多任務的自動化。在此基礎上，我們衍生了更多新的東西，比如Web 3.0時代的各種確權，但底層的訴求是上面的三點——更敏捷、更分布式、更靈活的Web。為了達到這一點需要各種各樣的元數據。如果將這三點進一步總結，在應用層面上，對於客戶和用戶而言，他們並不關心底層數據如何實現，他們希望有更聰明、更自動化的機器。Tim等人在2001年《科學美國人》上的奠基文章里舉的例子，就是如何做一個可以預約醫生的機器人。對於廣大的Web用戶而言，他們不關心用什麼技術標準，只關心是否已經實現了，今天是否已經實現了？其實已經實現了，現在有很多在線預約醫生的網站和APP，它可以幫助我們做事情，有可以幫助我們規劃路線等方面的機器人，它是不是用了之前提到的技術呢？沒有，但我們的目的實現了,我們應該擁抱的這些發展。

歸根結底，這是一個semantic WEB和SEMANTIC web兩種不同的技術路線之間的衝突。這個比喻是Jim Hendler在2005年前後提出來的。他說Web上所謂的語義網，最關鍵的東西不是semantics，而是Web。真正帶來價值的是我們把它放到網上來了，所以是我們的開放，讓數據更加有流通性。這就是以人為核心的思想。後來工業界繼續把這條路向前推進，把Semantic全部去掉了，就有了後來的Knowledge Graph。

再回顧一下語義網，如果拋開它到底「用」的是什麼的話，去思考它到底能給我們「帶來」什麼？我認為最核心一點就是Web的任務自動化，這一點其實目前已經實現了，雖然沒有用OWL。從另一個角度來說，語義網是上一代的分布式應用。從07年~14年我花了很長時間研究Semantic Wiki，在 Semantic Wiki 上，我們發現可以把各種各樣的規則也寫成模板。這些模板天然的就是一種數據，如果一段代碼是數據，就可以被查詢，就可以被使用，就可以被集成。後來在Tim團隊一起研究AIR（一種可追責語言）的時候，本質上就是我們把這些代碼放在可以查詢的平台上，就是RDF。今天這種平台成為了以太坊平台、區塊鏈平台，我們管它叫「智能合約」，代碼變成了數據的一部分，這就是一個分布式的應用。今天我們可以理解很多年前無法理解的，語義網的本質就是這兩個，一個是任務的自動化，一個分布式應用。

從語義網到知識圖譜

當我快速回顧語義網的演進，發現其實它是整個知識表現領域與Web結合的產物。之前從框架網絡到專家系統，經歷了很長的發展階段。在2000年前後，語義網誕生，2007~2008年，關聯數據是這個領域的最高峰，但是到2008年金融危機之後進入了低谷，2012年Google提出了知識圖譜，之後中國開始出現了這樣的概念，並逐漸開始發展起來。很多技術的演進過程就不逐一說了。OWL 這個語言，大概 04 年出現第一個版本，09年是第二個版本，是基於描述邏輯的語言。它給了語義網以語義，就是Semantics。但是從某種程度上來說，這種很強的語義也導致了後來這種語言比較難以理解，所以它在工業界的應用就不夠，最終在工業中真正應用起來的並不是語義非常豐富 OWL，而是RDF 以及 RDF 各種簡化的版本。比如其中有一個版本叫 RDFa，我們對其再進一步簡化，將其中一部分思想融合到了 HTML 5 的 semantics 裡面。前端工程師現在都在用，大家可能並沒有意識到這背後有一個很長的技術發展路徑，有 semantics 也不知道為什麼有這種東西，也不知道這個技術是怎麼來的，但是挺好用。

後來就衍生出非常巨大的鏈接數據以及各種各樣的開放數據，07年前後有Linked Data，以及Schema.org，以及到2012年Google 知識圖譜。

總結下來，十幾年的時間，我們從無到有地把 semantic Web 整個領域創建起來以後，發現沒人用，因為太過複雜就不停地簡化它，簡化它到 12 年之後，開始把它簡化成知識圖譜。

我們來回顧一下06年版本的W3C語義網底層技術棧，從URI到XML、RDF、RDFS等等，上面還有Proof、Trust，當時這些工作還沒有做，後來這些領域的興趣減弱了，被其他的領域繼承了。到底怎麼被繼承呢？12年之後，最底層的是圖譜技術,我們現在稱之為知識圖譜，這個領域是比較成功的；第二塊是知識技術，有SPARQL、OWL、RIF等等，直到最近兩三年又重新興起；第三部分是互信技術，後來變成了區塊鏈的技術。

知識圖譜顧名思義就是知識+圖譜，知識就是schema，圖譜就是 instance 。我們把知識圖譜拆成七層，從底層的文本一直到上層的規則，更加貼近非結構化數據的格式。這個金字塔更貼近目前工業界用的知識圖譜，和技術棧之間是有對應關係的，這個知識部分相對於知識技術部分就是SPARQL 、OWL 、RIF這一部分，圖譜部分也是數據部分，相當於 RDF 、XML 的這一部分。

這兩年數字化轉型非常火爆，尤其是各種中台技術、流程機器人技術。雖然大家在不同的時間提出了這樣的技術，但是在數字化轉型的幾個核心的階段，比如流程的自動化、服務的開放化等，恰好可以對應到語義蛋糕的不同層次上。技術總是有這樣的特點，一開始我們想是這樣，發現原來的路走不通，這個過程中誕生了各種副產品反而走成功。知識圖譜和大數據也很有關係，從傳統的數據倉庫，內部的結構化數據到後來的數據湖，多個來源的這種類型化的數據，是我們有了融合了 NLP 的能力之後，再有了知識提取之後，就有了智能中台的能力；再有了跨平台的信任能力，比如智能合約，區塊鏈的開放平台的能力。整個技術棧和目前在企業界的應用有很大的關係。05~06年時候看得不是很清楚，那時候想到企業級的應用都是醫藥、政府的應用，Web當時用得不是很多。12~15年，我們開始嘗試，亞馬遜、Google等做成了推薦、搜索、智能音箱等應用，都是已知的應用。未知的應用是什麼呢？後來發現在ToB企業數字化轉型當中有大量的應用。這是15年認識到的。

數據資產權利將催生新的產業

剛才講的是我們犯的錯誤以及無意中取得的成績，再往後，從語義網到知識圖譜這個版本，它和另外一個版本的 Web 3.0 融合在一起，就是區塊鏈相關的這種嘗試。新一代的Web 3.0的幾個核心特點：一是價值，或是貨幣，將成為互聯網固有特徵；其次是去中心化應，為用戶提供新的功能；第三是數字身份和數字資產權利。這三點並不是新的，10年左右Tim已經開始為之努力。

從長遠來看，我認為Web 3.0 最重要的價值是要催生一種基於數字資產的市場經濟。正如財產的私有制促進了產業的分工，知識產權的保護促進了知識的傳播，那麼數據資產權利將催生全新的產業。

Web3.0是什麼？

可能我比較偏頗，但是我認為這件事才是當前世界上最重要的事情。現在世界上發生貿易戰、國家衝突等，但十年之後、二十年之後或沒有人再會記得這些。但是大家的生活將被改變，有一群Web的人、有一群技術的人創造了數字資產產業，創造了數字資產市場經濟，為未來一代人帶來了最大的經濟增長點。這是地球上現在最重要的事情。

這個觀念已經不新了，09年David Siegel已經在《Web 3.0》這本書里展望了。一說Web 3.0，一定會提到區塊鏈，它一定是去中心化的系統嗎？不一定。這裡我提出一個不可能三角，安全性、去中心化和可擴展性，不可能同時滿足，所以在Web上做需要犧牲，我相信被犧牲的是去中心，因為安全性和可擴展性不可能被犧牲。去中心化又往往表現為強中心化，今天就不展開討論了。08年同時提出了區塊鏈和互信技術。Tim 提出了AIR就是基於 RDF 的可追責語言，他的觀點是Web是開放的組織，不能事先禁止大家做一些事情，但要進行事後追責。所以分布式信任技術並不僅僅是區塊鏈，它是一個龐大的技術體系。鏈式追責也不是新的概念了，Git就是這樣的系統，區塊鏈也是類似的系統。Web 3.0是否必然建立在區塊鏈之上？Tim最近說不一定。我相信它在一開始的時候肯定還是跟區塊鏈是有關係的，完全拋開區塊鏈做一套去中心化的工作系統很難做到，但區塊鏈未必是這件事唯一的實現路徑，也不是最核心的本質，因為它的核心本質仍然是可追責性，不是區塊鏈的分布式賬本。

現在領域發展早期，更多強調的是革命，甩開原來的那一套鬧革命，但是，我們面對利維坦，不可能革命，最多就是改良。AIR是Accounability。Solid是Tim最近做的身份認證系統，現在在做一個新的公司Inrupt在實現這個想法。

總結來說，從Web發展來講，我認為未來知識圖譜再往前走了，肯定會發展Web3.0，它依然會變成一個很龐大的體系，我把它分為七層，上面的合約層、邏輯層，恰恰是當年做語義網時候最終沒有實現的那部分願景，也就是Proof、Trust等等，我們希望在新的平台上重現大家的理想。

未來的Web，基於資產的互聯網

Web過去已經有三十年時間，我相信未來還有很長的路要走，如果把第一代Web稱之為Doc Web，第二代是Social Web，過去十年是Data Web，未來20年可能還要實現Token Web和Value Web，就是萬物可通證，通證之後，所有數字資產都要可分發、可清算，相信2040年之後一定會有Value Web，這個過程中將建立新的市場經濟形態。相信在W3C同仁的努力下，一定會實現！謝謝大家！提問：最後幾頁PPT里提到了通證、確權、清算等等，這些詞都是動詞，誰來做呢？

鮑捷：我覺得在不同的國家會有不同的路徑，如果在中國，可能會有一些體制內的方式來推進，如果在海外，更多的是由分布式推。

提問：給我的感覺將來是有大而無形的企業或者是實體，很難成為真正的去中心化的狀態？

鮑捷：這個問題我也在思考，Tim等領袖發明了這個詞「社會機器」，我42歲之前很擁護這個東西。但是，在此之後我改變了想法。最近我看了一本劉慈欣的科幻小說《2185》，非常推薦大家去看看。

聯繫我們

商務諮詢（需求對接、產品試用等）：contact@memect.co

也可聯繫微信18500686425，加入智能金融社群，添加好友，請附上姓名、所屬機構、部門及職位。

如果您有意願加入我們，在智能金融領域做一番事業，請聯繫：hr@memect.co。

文因君

鑽石舞台

鑽石舞台發表在痞客邦留言(0) 人氣()

歷史上的今天

▲top

留言列表

禁止留言

文章搜尋

誰來我家

參觀人氣

本日人氣：
累積人氣：

鑽石舞台

鑽石鑽石亮晶晶