學術(shù)不端行為是全球?qū)W術(shù)界和社會的一顆毒瘤,要清除這顆毒瘤需要各界共同行動并采取各種有效手段。目前,學術(shù)打假之路充滿崎嶇和風險,除了各國的法律和行政規(guī)定無法統(tǒng)一,且處罰輕重不一,對造假者形成不了有效阻遏外,還由于打假手段的技術(shù)局限,對學術(shù)造假的打擊非常有限。
對于學術(shù)不端行為,除了在法律和行政規(guī)定上對造假進行更嚴厲的懲處,讓造假的成本大得足以震懾造假者外,還需要在打假的技術(shù)上有所作為,如讓AI參與學術(shù)打假,在事前進行論文和科研資金的審核并協(xié)助事后的查處,建立起一個全面、立體的“學術(shù)高壓線”,或許能有效減少學術(shù)不端行為。
人工打假當然是最重要的學術(shù)監(jiān)管,但是,人工打假也面臨以下問題:一是效率較低;二是打假者會受到報復,可能會遇到人身安全問題。伊麗莎白·比克的打假就面臨這樣的問題。
2016年,比克與另外兩位美國學者費雷克·方和阿圖羅·卡薩德沃爾組成了打假團隊,審閱了自1995年以來在40種國際期刊上發(fā)表的2萬多篇帶圖生物醫(yī)學論文,其中有700多篇(約3.8%)涉嫌圖像復用或造假。
比克以實名方式舉報或在網(wǎng)站上公布有問題的論文后,遭到了威脅。有些論文的作者在網(wǎng)上公布比克的家庭住址;有些被揭露有問題的論文作者會對打假者的雇主和資助者進行“地毯式轟炸”,不斷發(fā)郵件,以恐嚇和勸阻打假者進行下一步的打假;有些有問題的論文作者還會對打假者提起訴訟。在實際打假中,比克意識到,有些造假手段高超,難以識別,因此特別希望有精確識別功能的AI軟件給予幫助,以獲得明確答案。如果用AI圖片識別軟件打假,效率更高,效果會更好。如果AI鑒定出造假,再結(jié)合人工鑒定確認,就可以AI的鑒定為準,使得造假者無法遷怒于他人。
在過去5年里,國家自然科學基金委員會(NSFC)收到的科研基金申請數(shù)量以每年約10%的速度增長,但合格的審核(稿)人又極為欠缺。因此,NSFC被迫進行創(chuàng)新,提出創(chuàng)建一個新的綜合性更強、更全面的AI系統(tǒng)來幫助審核科研基金的申請材料。這個AI系統(tǒng)將利用自然語言處理技術(shù)抓取在線科學文獻數(shù)據(jù)庫和科學家的個人網(wǎng)頁,收集申請者和潛在申請者的出版物或研究項目的詳細信息,再綜合人工審核,以判斷申請人是否造假,是否為某一科研基金的最佳申請者。
NSFC主任李靜海表示,希望這個工具能夠減少評審人評審時的偏見,因為有不少科學家試圖利用人脈關(guān)系來推動他們的項目。這一問題在全球也普遍存在。瑞士國家科學基金會發(fā)現(xiàn),與基金會所推薦的審核者相比,申請人推薦的審核人認可項目的可能性更大。但如果用AI審定,是不會被賄賂收買的。同時,AI參與評審也很難受到造假者和利益方的威脅和報復。
同樣,AI系統(tǒng)也可以用于論文的造假和作弊審查。現(xiàn)在,知網(wǎng)的查重軟件就是中國人熟悉的監(jiān)控學術(shù)不端行為的AI軟件,可以說這是一個相當有效的AI學術(shù)打假工具。
世界著名學術(shù)出版商愛思唯爾也特別注重學術(shù)成果的打假,并積極研發(fā)、利用AI軟件來打假。早在2017年,愛思唯爾就研發(fā)了一套名為Evise的軟件來進行論文的同行評審??偛课挥谌鹗柯迳5穆迳G把刂暎‵rontiers Media,是一個科學技術(shù)和醫(yī)學領(lǐng)域的學術(shù)出版商)也推出了AI軟件AIRA進行審稿,并希望AI審稿能提升同行評審質(zhì)量。
洛桑前沿之聲的做法是,先用AI軟件標記有潛在問題的稿件,并告知下一步人工審核需要重點審核的內(nèi)容,從而使審查更加準確。實踐表明,AI在抄襲檢查方面比人工檢查更高效。
AI參與打假和文件審查也并非僅限于科研領(lǐng)域,在其他領(lǐng)域,如法律方面也有廣泛應(yīng)用。LawGeex是美國一家利用AI進行合同審查的公司,2018年3月,該公司與斯坦福大學、杜克大學等院校的法學教授合作,舉辦了一場AI與20名律師之間的業(yè)務(wù)競賽。競賽內(nèi)容是對5項保密協(xié)議進行審查,并確定30個法律問題。結(jié)果AI的正確率為94%,律師的平均正確率為85%,而且AI效率極高,在26秒內(nèi)就能完成任務(wù),但律師平均需要花費92分鐘才能完成任務(wù)。
當然,也有人質(zhì)疑AI打假的準確性,擔心其既傷害無辜,又放走了真兇。其中,最大的質(zhì)疑是:AI連自然語言的處理都還無法過關(guān),又如何能審核學術(shù)期刊和論文呢?另外,也有人懷疑AI系統(tǒng)會很快學習和復制人類思維和推理中根深蒂固的偏見,這對于論文審核是極其不公正的。
其實,這些疑問都可以通過AI與人工審查相結(jié)合來解決,AI只是第一道關(guān)口,會大大加快和改善論文審查并發(fā)現(xiàn)問題,而且AI只是幫助人工查處和判斷造假,最終的結(jié)論還需要人工審核來做出。因此,未來AI打假與人工打假或?qū)徍讼嘟Y(jié)合,是一種必然的趨勢。
從現(xiàn)實需要看,科研領(lǐng)域的打假任重道遠,技術(shù)的創(chuàng)新和投入勢在必行,也大有可為。未來,無論是對于文字、數(shù)據(jù),還是圖片的篩查軟件都會有大量需求,這對于科研領(lǐng)域、出版商和獨立期刊有重大意義。人工和AI結(jié)合,會有力地阻遏科研不端行為,對于全社會都是一件幸事。