大數據文摘出品
最近兩年關於學術造假的爆料一直不少,尤其是「圖像復用」,一些頂尖高校的教授甚至院士都被指出存在一圖多用的情況。
顯然,這樣的情況除了有人專門去深扒,審稿人自己肯定記不住這些圖片是不是和前面的論文雷同了,所以只依靠審稿人去判斷,「圖片復用」的情況肯定還是會一直發生。
情況在現在有了轉機。
據Nature官網的News欄目報道,在一項研究發表在美國癌症研究協會(AACR)出版的十種期刊上之前,它要接受一次不同尋常的額外檢查——AI審稿。
自2021年1月以來,AACR在經過同行評審後擬定接受的所有稿件上都使用了AI軟件,其目的就是找出存在雷同的圖像,包括已被旋轉、濾波、翻轉或拉伸的。
先自動再手動,爭取不放過一個,已經有四家在使用
美國癌症研究協會(AACR)是這一AI技術的早期採用者。
為了避免發表帶有篡改圖片的論文,許多期刊僱人手工審查提交的稿件,通常使用軟件來輔助檢查發現的內容,這些被篡改的圖片可能是由於徹頭徹尾的欺騙,也可能是為了美化發現的不當企圖。
但Nature獲悉,在過去一年裡,至少有4家期刊已經開始將這一過程自動化,依靠人工智能軟件在手稿發表之前發現圖片重複或者部分重複。
「AACR在接收以色列Rehovot的一家名為Proofig的公司提供這項服務之前,也嘗試了很多軟件產品。」Daniel Evanko說,他是該協會在賓夕法尼亞州費城的期刊運營主管。「我們對此非常滿意,」他補充道。他希望這種篩查將有助於研究人員,並在發表後減少問題。
AI只是完成第一次初篩,當AI標記有問題的圖像後,仍然需要專業的編輯來判斷。
例如,如果數據集本來就需要顯示兩次——並論文中附有解釋——那麼重複的圖像可能是合適的,或者有些複製可能只是簡單的論文排版過程中的複製粘貼錯誤,這樣不算造假,AI發現的所有這些問題只能通過編輯和作者之間的討論來解決。
然而,既然人工智能正變得足夠高效和低成本,專家們表示,未來幾年內,一波AI自動圖像檢查助手可能會席捲學術出版行業,就像10年前使用軟件檢查手稿是否抄襲成為一種常規做法一樣。出版業組織也說,他們正在研究如何比較不同期刊的手稿圖像。
其他圖像完整性專家對這一趨勢表示歡迎,但同時也警告說,目前還沒有對各種軟件產品進行公開比較,而且自動檢查可能會出現太多的誤報或遺漏的操作。
從長遠來看,對軟件審查的依賴可能也會促使欺詐者使用AI反過來來欺騙AI,就像某些人通過修改文本來逃避審查一樣。
「我擔心,我們正在進入一場與基於AI的技術的軍備競賽,這可能導致不可能找到的深度造假,」德國《EMBO報告》(EMBO Reports)的主編貝爾納德•波拉爾表示。
進入AI審查時代?一些機構還在觀望
2016年,由微生物學家、加利福尼亞州的圖像分析顧問伊麗莎白·比克領導的一項對大約20000篇生物醫學論文的人工分析表明,多達4%的論文可能包含有問題的圖像複製。
現實是,通常每年只有大約1%的論文得到更正,更少比例的論文被撤銷。
儘管事實如此,但很多機構對於AI查找圖片複製還是持謹慎態度。公共科學圖書館(PLOS)的一位發言人表示,他們正在「熱切地」監測工具的進展情況,這些工具可以「可靠地識別常見的圖像完整性問題,並且可以大規模應用」。
Elsevier表示,他們「仍在測試」軟件,不過也指出,其部分期刊在發表前會篩選所有接受的論文,「使用軟件工具和手工分析相結合的方法」,檢查圖像是否存在問題。
2020年4月,Wiley引入了一項臨時接受的手稿圖像篩選服務,目前已有120多種期刊使用這項服務,但這項服務目前是由軟件輔助手工篩選,一位發言人說。
出版Nature的Springer Nature表示,它正在評估一些外部工具,同時整理數據,以訓練自己的軟件,這些軟件將「結合相互互補的人工智能和人類元素,以識別有問題的圖像」。
