close

已有很多有關事件序列的可視分析工作,他們大多從給定用戶事件序列的概覽出發,並在用戶探索的過程中給予細節。但是,現有的相關可視分析系統往往只會給用戶單一的概覽作為探索的起點,而這可能會遺漏一些發現。系統應允許用戶改變概覽的詳細程度。

而本文[1]則從事件序列的垂直和水平方向提出了構建多層級概覽的方法,在垂直方向進行事件序列的聚類,而在水平方向進行事件序列集合不同程度的壓縮。此外,對於這些不同層級的概覽,用戶很難決定從哪一個入手進行探索。因此該工作也提供了一些可能最優的概覽供用戶進行選擇。最後,該工作提出了一個可視分析系統Sequen-C來支持用戶多層級的探索。

在垂直方向進行的事件序列的聚類依託於構建的聚類樹。首先需要計算事件序列之間的距離矩陣,並類似於哈夫曼樹一樣迭代地選取距離最近的事件序列對進行合併。如果有k個獨立的事件序列,該方法可以生成1-k中任意數量的事件序列集合。

圖1 垂直方向的事件序列聚類

對於水平方向,該工作提出了一個方法來進行事件序列集合的壓縮。首先,基於此前研究工作提出的方法[2],在每個集合內進行序列的對齊。然後,該工作提出了基於信息熵的計算公式,來計算每一列的信息分數。這個分數衡量了這一列的同質化程度。最後,根據用戶指定的閾值,將相鄰的低於該閾值的列合併起來。用戶可以指定0-1之間任意的閾值,閾值越大,概覽越粗略。

圖2 水平方向的事件序列集合的壓縮

以上的方法提供給用戶十分靈活的概覽。但是,用戶往往不知道如何設置相應的參數。該工作基於平均輪廓寬度準則[3],為用戶推薦最優的序列集合數量。序列的平均輪廓寬度越大,對應的集合數量越優。

最後,該工作提出了可視分析系統Sequen-C來支持多級概覽的探索。用戶可以指定集合數量和閾值大小,或者從提供的最優集合數量中選擇。下方便會展示指定條件下的事件序列概覽。用戶可以選擇一個集合,在右邊便會展示其中所有獨立的序列。用戶可以再選擇其中之一,下方便會展示其中包含的全部個體序列的具體信息,包括時間信息。用戶也可以在左邊進行篩選,並查看屬性的分布。

圖3 Sequen-C的系統界面

[1] Magallanes, Jessica, et al. Sequen-C: A Multilevel Overview of Temporal Event Sequences. IEEE VIS 2021.

[2] D.-F. Feng and R. F. Doolittle. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. Journal of molecular evolution, 25(4):351–360, 1987.

[3] L. Kaufman and P. J. Rousseeuw. Finding groups in data: an introduction to cluster analysis, volume 344. John Wiley & Sons, 2009.

可視化前沿進展

可視化前沿進展是我們選取近期一些國內外在可視化方面的新進展的論文做簡要介紹,以饋對可視化有興趣的讀者。也歡迎有興趣的讀者撰稿聯繫刊登。投稿郵箱:pkuvis@pku.edu.cn。電子郵件標題請命名為:「公眾號前沿論文介紹投稿+文章名稱」。請在郵件里註明投稿人相關信息。


歡迎大家關注北京大學可視分析微信公眾號(VisualAnalytics),獲取最新消息。

北京大學可視化/可視分析博客(http://vis.pku.edu.cn/blog/)

我們在這裡和大家共享對可視化與可視分析研究領域的理解,一同探討可視化研究的進展,觀察和評論最新的可視化技術和應用。我們關心可視化與可視分析核心的成就,也關注相關領域的發展。歡迎關注!


arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()