close

2022年全國知識圖譜和語義計算大會(CCKS)於2022年8月24日至8月27日在秦皇島以線上線下混合的方式召開,主題是「知識圖譜賦能數字經濟」,旨在探討數字產業化與產業數字化過程中的語言理解、知識獲取、知識融合、知識推理等方面的關鍵技術,以知識驅動創新應用,加快數字社會建設步伐,營造良好數字生態,建設數字中國。鮑捷作為【工業論壇】主席,受邀參加此次大會。

會後鮑捷就知識圖譜的相關問題接受採訪,內容如下:


主持人:鮑老師您好,請問知識圖譜是數據的最終形態嗎?

鮑捷:那肯定不會,我們在對知識進行組織的過程中,經歷了很長的路。知識圖譜並不是今天才有的,60 年前就已經有知識圖譜,只是叫不同的名字。在過去的 20 多年中,數據的組織不停地發生變化,一開始是線下數據,分離的數據,然後是大數據,最後到數據倉庫、數據湖。所以數據的組織程度是不斷地加深的。最近七八年,知識圖譜被廣泛應用,我們的很多應用領域逐漸解鎖,知識起作用的地方和場景越來越多。 但是今天的知識圖譜還是非常薄弱的,應該說只有圖譜沒有知識,甚至可以極端一點說是只有圖,沒有譜。所以我相信未來 10 年到 20 年,隨着應用進一步地加深,我們會逐步加深圖的表現力。現在的圖譜相較於 20 年前的語義網的研究是非常簡單的,可以說是把所有關於知識表現的部分都去除了。這麼做是有原因的,因為當時的應用不夠充分,另外當時的算法和算力也跟不上。隨着過去20 年的發展,圖數據庫和問答引擎在金融、教育、醫療、軍事等各方面的應用,使整個產業鏈得以建立。今後 20 年內,我們相信「譜」又會加回來,圖譜之上的「知識」也會加回來。

在過去的 20 年當中,我們看到這樣一個周期,從簡單的圖譜開始,1999 年我們有RDF,2004 年是OWL ,2009 年有了OWL 2 、RIF,由此實現了一系列表達力的上升。但是自 2009 年之後,我們迎來了表達力的下降。2012 年之後有了知識圖譜,隨後有了圖數據庫,所以今天是表達力一個低谷。我相信今後 20 年表達力會再次上升,我們能夠表達的知識會越來越多,所以今天的知識圖譜肯定不是最終的形態。今後可能還有一個 10 年甚至 20 年的長周期,我們會迎來表達力更豐富的知識圖譜。

主持人:那麼您認為是否會有新的數據組織形式呢? 鮑捷:答案是一定的,因為數據的組織形式經歷了很多次。從最早期的無組織的數據,到後來的文件系統,在文件系統之上,我們構造了數據庫系統;在圖數據庫系統之上,我們又構造了面向對象的數據庫系統以及分布式的數據系統,就是Web;面向對象的系統加上 Web 後來又衍生出來了語義網,語義網又衍生了知識圖譜,這是清晰的數據組織方式的演進。

那麼未來我相信至少會沿着三個方向向前走:

第一,提高數據的可發現性,就是Findability ;像我們現在使用的推薦引擎、問答引擎等這些應用,知識圖譜都在其下發揮了很大的作用。

第二,提高數據的 Portability ,即數據的可分發性;過去三四年的時間裡,有大量的流程自動化工作,這就提高了數據的可分發性。而這背後也有大量的知識在起作用,它不僅僅是圖譜,而是各種各樣的規則系統。

第三個很重要的特性是讓機器自己去發現新的數據的能力,Reasonability。通常這一點我們把它稱為"智能"或者叫做"推理"。在這一方向上,之前的知識圖譜是遠遠不夠的。

所以,我相信未來在 Findability 、Portability 和 Reasonability 方面上,數字組織都會進一步增強,所以一定會有更加智能的數據組織方式出現。

主持人:最後請您談談知識圖譜與我們日常生活有什麼關聯。

鮑捷:在 2008 年前後,曾經有一個預言,10 年左右時間語義網會成功。但是到了 2010 年前後,大家認為這個預言可能已經失敗了,因為那時候是該領域的低谷。但是今天如果打開我們的手機,會非常有信心地說當年的預言是完全得到了驗證。因為今天不管是訂餐還是打車,還是找房子或者在線教育,(圖譜)覆蓋任何一個場景。App 里本質上就是一個 Web 頁面,只是封裝在一個 App 里而已。打開它的底層數據,內部全部都是元數據,即結構化數據。所以說我們今天能夠跟小度這種音箱或者 Siri 手機問答系統對話,就是因為背後有大量知識圖譜(應用)。今天的搜索引擎,和比如說餓了麼、美團這種訂餐應用背後也有大量的知識圖譜。從線下到線上,從每一個人到每一個房子、每一道菜、每一個餐館,都是實體,我們花了將近 20 年的時間把這些實體給搬到線上來。這些從線下到線上的映射,使我們構造了一個覆蓋世間萬事萬物的龐大圖譜。

這個圖譜就是今天我們能夠在線上生活的重要一環。比如說今年的疫情,很多行政力量觸達不到的地方,社區團購卻能使當地的居民可以得到供應,如果沒有知識圖譜的話,這一點又怎麼能夠實現呢?所以知識圖譜是隱藏在下面的,不被看到,但在生活中的方方面面都得到了應用。 2008 年的四川地震時,我跟當時的導師 James Hendler 討論一個問題,我當時寫了一篇文章,說如果未來有更好的知識圖譜讓地震現場的居民把現場的情報快速地整合在一起的話,將來的救災工作會更加順暢,這可以讓更多的生命被挽救。

經過了 14 年的時間,我們今天看到在防疫過程當中,知識圖譜就發揮了當年我們預想的作用。所以說不管是從日常生活還是在應急響應當中,其實知識圖譜都已經造福了整個社會,不僅在中國,整個世界都是這樣。在過去十幾年的時間裡,整個人工智能產業鏈上的應用更偏向於統計,但今天會上也有很多老師說了知識在未來會發生更大的作用。所以我相信未來十年天平會再往迴轉,知識圖譜一定還會在更多領域,創造出更多財富,挽救更多生命。

主持人:好的,謝謝鮑老師的分享。

鮑捷:謝謝。

聯繫我們



商務諮詢(需求對接、產品試用等):contact@memect.co

也可聯繫微信 18500686425,加入智能金融社群,添加好友,請附上姓名、所屬機構、部門及職位。

如果您有意願加入我們,在智能金融領域做一番事業,請聯繫:hr@memect.co

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()