close
偏見影響着人們分析數據的方式和決策的結果。在可視分析系統中,人的偏見會體現在只對部分數據進行分析而進行決策,使得決策產生偏差。該工作研究如何通過可視化用戶的交互歷史(用戶與哪些數據點和屬性進行了交互),來降低人在可視化系統探索過程以及決策時的潛在偏見。

在這個工作中[1],作者將用戶在分析過程中的偏見定義為用戶的實際交互行為和期望行為的偏差。期望的交互行為指數據集中的任何數據點有相同的交互可能性。作者使用了兩種指標來量化交互過程的偏見,分別是交互數據點分布指標(DPD)和屬性分布指標(AD)[2]。在一個數據集中,數據點分布指標描述了用戶的交互在所有數據點的分布情況。用戶的交互只圍繞部分數據,表明交互過程有較大的偏見。屬性分布指標描述了用戶的交互在某個屬性值的分布情況。用戶的交互只涉及某個屬性的部分值,表明交互過程針對該屬性有較大的偏見。

圖1:系統界面。用戶使用該系統來從數據集中選擇10個代表性數據點。

為了可視化用戶的交互歷史,作者設計了兩種可視化形式。一種是原位(in-situ)可視化方式(圖1B),即在用戶交互視圖中直接可視化用戶的交互數據。圖1B中,紅色表示用戶已經選擇的數據點,藍色表示用戶檢查過的數據點,顏色越深表明用戶與該數據點交互次數越多。用戶能夠直接觀察到與各個數據點的交互情況;另一種是非原位(ex-situ)可視化方式(圖1C),每個圖標表示一個數據屬性,顏色越深表明針對該屬性用戶的交互偏見越嚴重。在下方的直方圖中,灰色表示數據點在該屬性上的實際分布,藍色表示用戶交互過的數據點的分布。

圖2:用戶實驗結果。通過可視化用戶交互歷史,更多用戶結果中男性成員的比例與數據集中比例更接近。

為了驗證上述可視化用戶的交互歷史能否減低用戶的偏見,作者設計一個對比試驗。圖1中的系統稱為干預(intervention)系統,圖1中去除了視圖C以及視圖B中可視化交互數據點功能後的系統稱為控制(control)系統。分別有兩組用戶各使用兩種系統來完成任務。任務的內容是從180位政治人物中選擇10位來決定一個政治法案是否實施。實驗分為兩個階段,第一個階段是用戶選擇10位成員後然後提交;第二個階段是用戶查看各個屬性的數據分布於自己交互數據分布差異(圖1C)來決定是否修改結果(控制系統分組用戶沒有提供該功能)。圖2是兩種系統用戶的的決策結果,可以看出更多使用干預系統的用戶選擇的結果更具有代表性。作者進一步的實驗表明可視化用戶的交互數據能夠改變用戶與可視化系統的交互次數,使得交互數據點分布指標更低,降低在分析過程中的無意識的偏見。
可視化強調人的參與,而人的選擇和決策往往會和自己的知識背景、偏見等具有關聯。可視化的流水線包括數據選擇、處理、視覺映射和交互等多個步驟,因而在每個步驟中都可能存在人的偏見或者錯誤。如何減少可視化流水線中的偏見和錯誤需要可視化研究者們更多的研究。

參考文獻:

[1] Emily Wall, Arpit Narechania, Adam Coscia, Jamal Paden, and Alex Endert. Left, Right, and Gender: Exploring Interaction Traces to Mitigate Human Biases. IEEE VIS 2021.

[2] Emily Wall, Leslie M. Blaha, Lyndsey Franklin, Alex Endert. Warning, Bias May Occur: A Proposed Approach to Detecting Cognitive Bias in Interactive Visual Analytics. VAST 2017: 104-115.

可視化前沿進展

可視化前沿進展是我們選取近期一些國內外在可視化方面的新進展的論文做簡要介紹,以饋對可視化有興趣的讀者。也歡迎有興趣的讀者撰稿聯繫刊登。投稿郵箱:pkuvis@pku.edu.cn。電子郵件標題請命名為:「公眾號前沿論文介紹投稿+文章名稱」。請在郵件里註明投稿人相關信息。


歡迎大家關注北京大學可視分析微信公眾號(VisualAnalytics),獲取最新消息。

北京大學可視化/可視分析博客(http://vis.pku.edu.cn/blog/)

我們在這裡和大家共享對可視化與可視分析研究領域的理解,一同探討可視化研究的進展,觀察和評論最新的可視化技術和應用。我們關心可視化與可視分析核心的成就,也關注相關領域的發展。歡迎關注!

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()