當前位置: 華文天下 > 辟謠

超過200萬篇研究論文已經從互聯網上消失了

2024-03-06辟謠

圖片來自「Slave Societies Digital Archive」(數碼檔案)官網。

據【自然】(Nature)雜誌官網報道,一項針對超過七百萬份數碼出版物的研究表明,超過四分之一的學術論文未被妥善存檔和保存,研究結果表明,當下的數碼保存工作未能跟上不斷增長的學術研究產量。

該研究發表於今年1月24日的【圖書館學和學術交流期刊】(Journal of Librarianship and Scholarly Communication),研究作者、倫敦伯克貝克大學文學、科技和出版研究員馬丁·伊夫(Martin Eve)解釋道,這個研究的認識論都依賴於註腳鏈,「如果您無法核實其他人所說的話,那麽您就只能盲目地相信您自己無法再閱讀的證據。」

馬丁·伊夫檢查了7438037份帶有數碼物件識別元的作品是否被存檔。數碼物件識別元是一套辨識數碼資源的機制,由一系列數碼、字母和符號組成,用於辨識和連結特定出版物(例如學術論文和官方報告)。一個數碼化物件的DOI是唯一的,一經產生就永久不變,不隨其所標識的數碼化物件的版權所有者或儲存地址等內容的變更而改變。

研究樣本來自於每個註冊成員組織的最多1000個DOI的隨機選擇。研究結果顯示,其中28%的作品(超過200萬篇文章)沒有出現在主要數碼檔案庫中,盡管它們有活躍的DOI。只有58%的DOI參照了至少一個存檔庫中的作品,其余14%的作品因釋出時間太近、不是期刊文章或沒有可辨識的來源而被排除在外。

圖片來源於【自然】雜誌官網。

伊夫同樣指出了這項研究的局限性,這項研究只追蹤了帶有DOI的文章,並且沒有搜尋每個數碼儲存庫中的文章。例如,研究沒有檢查帶有DOI的物品是否儲存在機構儲存庫中。

盡管如此,數據保存專家肯定了這份研究的價值。「許多人盲目地認為,只要你擁有DOI,你的研究論文就會永遠存在。但這並不意味著連結將永遠有效」,芬蘭漢肯商學院的米凱爾·拉克索(Mikael Laakso)說道。拉克索和他的同事在2021年釋出報告稱,2000年至2019年期間,超過170本開放獲取期刊已經從互聯網上消失。

還有專家指出,小型出版商比大型出版商更容易因無法保存文章而面臨風險。因為數據儲存需要成本,許多小型組織也無法獲取存檔涉及的基礎設施、技術和專業知識等資源。

馬丁·伊夫指出了一些改善研究論文的數據儲存現狀的方案,包括加強DOI序號產生器構的要求,以及提升出版商和研究人員對該問題的認識。「每個人都在考慮他們可能從在某個地方發表論文中獲得的直接利益,但我們真的應該考慮研究生態系的長期可持續性。在你去世100年後,人們還能夠存取你曾經努力研究過的東西嗎?」

參考資料:

(1) More than 2 million research papers have disappeared from the Internet

https://www.nature.com/articles/d41586-024-00616-5

編譯/李永博

編輯/羅東

校對/朱名恬