美捷登Wendy Dai 2022年,法國圖盧茲大學(xué)的計算機科學(xué)家Guillaume Cabanac發(fā)現(xiàn)了一種不尋常的現(xiàn)象:一篇文章在發(fā)表不到兩個月內(nèi)就獲得了100多次引用。最初,Cabanac在PubPeer上標(biāo)記了這項研究,因為該研究被“Problematic Paper Screener”突出顯示,這一工具能夠自動識別存在潛在問題的研究論文。被標(biāo)記的論文中存在異常的短語,這些短語對既定術(shù)語進行了奇怪的扭曲,可能是由翻譯軟件或規(guī)避抄襲檢查器造成。然而,Cabanac注意到更奇怪的一點:根據(jù)“Altmetrics donut”,該研究已被引用107次,但其下載次數(shù)卻僅為62次。
更重要的是,根據(jù)Google Scholar的統(tǒng)計,這篇論文僅被引用了一次。Cabanac指出,“Google Scholar的引用計數(shù)與Altmetrics/Dimensions上的計數(shù)之間存在明顯差異。尤其值得注意的是,Google Scholar通常會高估引用次數(shù)!經(jīng)過深入調(diào)查,Cabanac和其團隊最終在提交給Crossref(這是一個學(xué)術(shù)元數(shù)據(jù)唯一標(biāo)識符的存儲庫)的元數(shù)據(jù)文件中找到了額外引文的來源。研究小組將這些發(fā)現(xiàn)于2022年10月4日上傳至arXiv服務(wù)器上的預(yù)印本。Cabanac解釋道,Google Scholar的引用統(tǒng)計基于研究論文PDF版本的文本挖掘,而不是Crossref的元數(shù)據(jù)文件!拔覀兿嘈牛@是一種此前未被記錄的引用計數(shù)操縱方式,”他在接受《Retraction Watch》采訪時表示,“這一方法的獨特之處在于,不需要篡改論文的正式版本(如PDF或HTML),而是通過操作元數(shù)據(jù)文件實現(xiàn)的! Cabanac指出,有問題的論文的元數(shù)據(jù)文件包含的參考文獻數(shù)量明顯多于HTML或PDF版本。這些額外的引用被悄悄添加至元數(shù)據(jù)文件中,并提交給Crossref并被自動提取。由于元數(shù)據(jù)文件隨時重新提交,因此更新后的文件可在文章發(fā)表后任意時間加入更多引用。這些多余的引用最終會顯著提高Altmetrics分?jǐn)?shù)(該分?jǐn)?shù)描述了文章在社交媒體平臺上的傳播及提及頻率)。這種人為夸大的分?jǐn)?shù)進一步影響了Dimensions等書目平臺的引用統(tǒng)計。由于引用計數(shù)常被用于評價研究人員的學(xué)術(shù)影響力和分配科研經(jīng)費,這種“注水”行為可能對學(xué)術(shù)界和科研資源分配造成誤導(dǎo)。
根據(jù)Cabanac的研究,新增的引用大多來自Technoscience Academy出版的期刊。Technoscience Academy是一家總部位于印度古吉拉特邦的開放獲取出版商,同時也是Crossref的成員。該出版商未對媒體的置評請求做出回應(yīng)。目前尚不清楚誰在操縱元數(shù)據(jù)文件,抑或該問題是否因技術(shù)故障所致。Cabanac認為,這種現(xiàn)象反映了監(jiān)督缺失的問題。他建議,建立定期比對PDF、HTML和元數(shù)據(jù)文件中參考文獻的工具與系統(tǒng),將是解決這一問題的關(guān)鍵。 Cabanac表示,如果某出版商的輸出明顯包含異常引用,其Crossref成員資格應(yīng)受到嚴(yán)格審查。作為Crossref協(xié)議的簽署方,“出版商應(yīng)對其行為負責(zé)!薄斑@看起來真的很狡猾,”Crossref會員與社區(qū)拓展總監(jiān)Ginny Hendricks也對此發(fā)表了評論,她指出這是他們首次聽說這種“隱形引用”的問題!斑@絕對是學(xué)界執(zhí)著于將引用作為衡量影響或重要性的指標(biāo)的副作用,令人遺憾。”她補充道,Crossref將啟動調(diào)查,并指出Crossref通常不會撤銷會員資格,過去僅因Omics International對科學(xué)界造成嚴(yán)重影響而被撤銷會員資格。Hendricks表示,Crossref到目前為止還沒有考慮引入廣泛的審查,但她鼓勵第三方使用Crossref的開放數(shù)據(jù)來開發(fā)系統(tǒng)從而做到這一點!翱茖W(xué)合法性不是由我們來決定!
在對Technoscience Academy出版的三本期刊分析后,Cabanac的團隊發(fā)現(xiàn),這些期刊通過Crossref生成了超過1,000個DOI(數(shù)字對象標(biāo)識符)。研究顯示,三本期刊發(fā)表論文的元數(shù)據(jù)中約9%的引用(即65,836篇參考文獻中的5,978篇)僅使兩名研究人員受益。其中一位是印度維沙卡帕特南Vignan信息技術(shù)研究所的J. Nageswara Rao,他從3,103次額外引用中獲益;另一位是印度甘地訥格爾LDRP技術(shù)與研究所的Bhavesh Kataria,他從1,564次額外引用中獲益。 此外,三本期刊自身也從這些“隱形引用”中獲利。例如,International Journal of Scientific Research in Science, Engineering and Technology的引用次數(shù)增加了826次,International Journal of Advanced Science and Technology和Turkish Journal of Physiotherapy and Rehabilitation分別增加了537次和428次引用。
在出版商進行調(diào)查后,Hindawi撤回了這篇文章。調(diào)查顯示,該論文存在以下一項或多項系統(tǒng)性操縱發(fā)布過程跡象的證據(jù):
(1) 范圍差異 (2) 報告的研究描述存在差異 (3) 數(shù)據(jù)的可用性與所描述的研究之間的差異 (4) 引用不當(dāng) (5) 文章中包含的不連貫、無意義和/或不相關(guān)的內(nèi)容 (6) 同行評議過程被操縱 除“隱形引用”之外,Cabanac的研究還揭示了“丟失引用”的現(xiàn)象,即論文HTML/PDF中存在的部分引用并未出現(xiàn)在Crossref的元數(shù)據(jù)文件中!癈rossref元數(shù)據(jù)(例如Dimensions)用戶可能忽略這些引用,因為這些不在他們的數(shù)據(jù)庫中,或者因為他們未能正確地對元數(shù)據(jù)中提供的引用文本進行文本挖掘,”Cabanac補充道。研究表明,HTML版本中高達56%的引用(即36,939篇參考文獻中的65,836篇)未包含在Crossref元數(shù)據(jù)文件中。
參考資料:
retractionwatch.com
校對:Leste Wang 審核:Joy Liao
數(shù)以千計的隱形引文潛入論文,被引指數(shù)真的還真實嗎? |