2026年5月9日,柳葉刀發(fā)表了一篇“CORRESPONDENCE“,對250萬生物醫(yī)學論文的參考文獻進行審查發(fā)現(xiàn):2023年,約每2828篇論文中有一篇論文包含虛假參考文獻;到2025年,該比例上升至每458篇論文中有一篇;2026年初收錄的論文中,每277篇論文中就有一篇包含至少一條假文獻。
![]()
原文鏈接:https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(26)00603-3/fulltext
既往研究估計,生物醫(yī)學領域大語言模型(LLM)生成的參考文獻中,30%至69%是虛構(gòu)的。這些參考文獻看起來格式正確,歸屬于真實的研究者,出版日期也很合理,導致同行評審難以察覺。
柳葉刀發(fā)表的這篇“CORRESPONDENCE“文章,納入近3年250萬篇生物醫(yī)學論文,對參考文獻進行了系統(tǒng)審查。
具體來講,研究團隊開發(fā)了一套自動化參考文獻驗證系統(tǒng),掃描了2023年1月1日至2026年2月18日期間PubMed Central收錄的文獻:共計2,471,758篇論文和125,615,773條結(jié)構(gòu)化參考文獻。
研究者從中提取的參考文獻,保留了具有PubMed 標識符(PMID)的文獻。在1.256億條參考文獻中,9710萬條(77%)帶有PMID并通過驗證,其余23%參考文獻主要是網(wǎng)站、書籍和灰色文獻,被排除在外。
對通過驗證的參考文獻,研究者從 PubMed 和 Crossref 獲取標識符對應的文獻,并將其與論文引用的文獻進行對比。
研究者還會在以下數(shù)據(jù)庫進行驗證:PubMed、Crossref、OpenAlex以及Google Scholar。在所有數(shù)據(jù)庫中均未找到的參考文獻被歸為“虛假參考文獻”;若能找到文獻但關聯(lián)了錯誤的PMID,則歸類為“錯誤引用”。
虛假參考文獻的情況
![]()
在9710萬條經(jīng)過驗證的參考文獻中,識別出了4046條虛假參考文獻,來源于2810篇論文:
2023年,大約每2828篇論文中就有1篇包含至少一條虛假參考文獻
2025年,比例上升至每458篇中有1篇
2026年的前7周內(nèi)(2月18日前),每277篇論文中就有1篇
2023年每萬篇論文約有4條虛假參考文獻,2025 年第四季度每萬篇論文有51.3條,在2026年初達到了每萬篇論文56.9條。虛假參考文獻率增長了12倍以上。
![]()
圖. 2023年1月至2026年2月期間,PubMed Central收錄論文的虛假參考文獻率
舉個例子, 2025年一篇發(fā)表在開放獲取腫瘤學期刊、關于輸尿管回腸吻合技術的論文中,在30條經(jīng)驗證的參考文獻中,有18條(60%)是虛假參考文獻,每一條都針對該論文主題量身定制,發(fā)表年份顯示為2023年或2024年。
研究還發(fā)現(xiàn)了“論文工廠”活動的跡象。有兩位作者在2025年某一外科期刊的11篇論文中署名,這些論文包含15條虛假參考文獻,涵蓋CRISPR診斷、AI引導的納米疫苗和腸道微生物組標志物。
大多數(shù)論文(91%,n=2564)僅包含一兩條虛假參考文獻;246篇包含三條或以上。綜述類文章的虛假參考文獻率顯著高于其他類型論文(16.7/10000篇 vs 10.6/10000篇;p<0.0001)。
2024年年中出現(xiàn)的急劇轉(zhuǎn)折,與LLM普及后的預期相吻合。LLM于2022年底和2023年開始廣泛可用;考慮到100-200天的投稿至出版周期,使用LLM輔助的論文預計在2024年年中起出現(xiàn)在PubMed Central中。
這些虛假參考文獻并沒有明顯缺陷:與論文主題相關、格式正確、歸屬于真實的研究人員,出版日期看起來合理。
本研究建議采取四項行動:
出版商應在同行評審開始前,將自動化參考文獻核查集成到投稿工作流程中;
文獻收錄系統(tǒng)應在文章記錄中添加完整元數(shù)據(jù),以便下游用戶評估參考文獻的可靠性。
出版商應追溯篩查現(xiàn)有出版物,并在虛假參考文獻危及論文結(jié)論時發(fā)布更正或撤稿。
在主要的科研誠信數(shù)據(jù)庫中,“偽造參考文獻”目前還不是一個獨立的分類;建立這一分類將有助于進行系統(tǒng)性的追蹤和問責。
參考文獻:Lancet, 407, 1779-1781. doi:10.1016/S0140-6736(26)00603-3
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.