大數據文摘 - 圖片也要查重了？期刊用AI審論文防造假，旋轉/翻轉/拉伸都不行－鑽石舞台

大數據文摘出品

最近兩年關於學術造假的爆料一直不少，尤其是「圖像復用」，一些頂尖高校的教授甚至院士都被指出存在一圖多用的情況。

顯然，這樣的情況除了有人專門去深扒，審稿人自己肯定記不住這些圖片是不是和前面的論文雷同了，所以只依靠審稿人去判斷，「圖片復用」的情況肯定還是會一直發生。

情況在現在有了轉機。

據Nature官網的News欄目報道，在一項研究發表在美國癌症研究協會（AACR）出版的十種期刊上之前，它要接受一次不同尋常的額外檢查——AI審稿。

自2021年1月以來，AACR在經過同行評審後擬定接受的所有稿件上都使用了AI軟件，其目的就是找出存在雷同的圖像，包括已被旋轉、濾波、翻轉或拉伸的。

先自動再手動，爭取不放過一個，已經有四家在使用

美國癌症研究協會（AACR）是這一AI技術的早期採用者。

為了避免發表帶有篡改圖片的論文，許多期刊僱人手工審查提交的稿件，通常使用軟件來輔助檢查發現的內容，這些被篡改的圖片可能是由於徹頭徹尾的欺騙，也可能是為了美化發現的不當企圖。

但Nature獲悉，在過去一年裡，至少有4家期刊已經開始將這一過程自動化，依靠人工智能軟件在手稿發表之前發現圖片重複或者部分重複。

「AACR在接收以色列Rehovot的一家名為Proofig的公司提供這項服務之前，也嘗試了很多軟件產品。」Daniel Evanko說，他是該協會在賓夕法尼亞州費城的期刊運營主管。「我們對此非常滿意，」他補充道。他希望這種篩查將有助於研究人員，並在發表後減少問題。

AI只是完成第一次初篩，當AI標記有問題的圖像後，仍然需要專業的編輯來判斷。

例如，如果數據集本來就需要顯示兩次——並論文中附有解釋——那麼重複的圖像可能是合適的，或者有些複製可能只是簡單的論文排版過程中的複製粘貼錯誤，這樣不算造假，AI發現的所有這些問題只能通過編輯和作者之間的討論來解決。

然而，既然人工智能正變得足夠高效和低成本，專家們表示，未來幾年內，一波AI自動圖像檢查助手可能會席捲學術出版行業，就像10年前使用軟件檢查手稿是否抄襲成為一種常規做法一樣。出版業組織也說，他們正在研究如何比較不同期刊的手稿圖像。

其他圖像完整性專家對這一趨勢表示歡迎，但同時也警告說，目前還沒有對各種軟件產品進行公開比較，而且自動檢查可能會出現太多的誤報或遺漏的操作。

從長遠來看，對軟件審查的依賴可能也會促使欺詐者使用AI反過來來欺騙AI，就像某些人通過修改文本來逃避審查一樣。

「我擔心，我們正在進入一場與基於AI的技術的軍備競賽，這可能導致不可能找到的深度造假，」德國《EMBO報告》（EMBO Reports）的主編貝爾納德•波拉爾表示。

進入AI審查時代？一些機構還在觀望

2016年，由微生物學家、加利福尼亞州的圖像分析顧問伊麗莎白·比克領導的一項對大約20000篇生物醫學論文的人工分析表明，多達4%的論文可能包含有問題的圖像複製。

現實是，通常每年只有大約1%的論文得到更正，更少比例的論文被撤銷。

儘管事實如此，但很多機構對於AI查找圖片複製還是持謹慎態度。公共科學圖書館（PLOS）的一位發言人表示，他們正在「熱切地」監測工具的進展情況，這些工具可以「可靠地識別常見的圖像完整性問題，並且可以大規模應用」。

Elsevier表示，他們「仍在測試」軟件，不過也指出，其部分期刊在發表前會篩選所有接受的論文，「使用軟件工具和手工分析相結合的方法」，檢查圖像是否存在問題。

2020年4月，Wiley引入了一項臨時接受的手稿圖像篩選服務，目前已有120多種期刊使用這項服務，但這項服務目前是由軟件輔助手工篩選，一位發言人說。

出版Nature的Springer Nature表示，它正在評估一些外部工具，同時整理數據，以訓練自己的軟件，這些軟件將「結合相互互補的人工智能和人類元素，以識別有問題的圖像」。

點「在看」的人都變好看了哦！

鑽石舞台

鑽石舞台發表在痞客邦留言(0) 人氣()

鑽石舞台