當前位置: 華文天下 > 辟謠

原著論文不該成為訓練人工智慧的免費工具

2024-08-18辟謠

來論

日前,知網警告AI搜尋初創公司秘塔科技,未經授權在AI搜尋結果中呈現學術文獻題目、目錄及摘要內容,構成嚴重侵權。對此,秘塔科技表示疑惑和不理解。此外,國際著名期刊【自然】(【Nature】)雜誌編輯伊莉莎白·吉普尼最近在一篇文章中指出,當前有越來越多的學術出版商正在將研究論文授權給科技公司,用於訓練人工智慧模型。有學術出版商借此賺取了2300萬美元,而作者卻收入為零。

人工智慧日漸成為眾人所皆知的新鮮事物和先進技術。大語言模型(LLM)通常依賴從互聯網上抓取的大量數據進行訓練。學術論文因其內容豐富、資訊密度高,相比大量普通數據更有價值,是AI訓練中的重要數據來源。

這看似比較正常,畢竟,參照前人研究成果能增強論文的說服力和可信度,參考文獻也是一篇合格的學術論文必不可少的部份。但這一現象實際涉及到嚴肅的智慧財產權問題。根據【著作權法】,著作權人對作品享有發表權、姓名標示權、發行權、保護作品完整權、資訊網路傳播權、改編權、組譯權等權利。作者授權的出版社也享有相應的權利。

當然,著作權也受到相應的限制。具有相應情形的,使用作品是可以不向作者支付報酬,但應當指明作者姓名或者名稱、作品名稱。如為個人學習、研究或者欣賞,使用他人已經發表的作品;為介紹、評論某一作品或者說明某一問題,在作品中適當參照他人已經發表的作品;為報道新聞,在報紙、期刊、廣播電台、電視台等媒體中不可避免地再現或者參照已經發表的作品;為學校課堂教學或者科學研究,轉譯、改編、組譯、播放或者少量復制已經發表的作品,供教學或者科研人員使用;圖書館、檔案館等為陳列或者保存版本的需要,復制本館收藏的作品;免費表演已經發表的作品,該表演未向公眾收取費用,也未向表演者支付報酬,且不以營利為目的。

由上可知,合理使用他人的作品,應具有公益性和非營利性。如果基於營利目的而「免費」使用他人的作品,顯然構成侵權。就以訓練人工智慧為例,企業訓練人工智慧的目的是提高商業價值,以便在激烈的市場競爭中占據優勢。當然,如果註明了作者,為網路使用者提供搜尋服務時也連結了原文,提升了原文的知名度、下載量和參照量,則屬於合理使用,不構成侵權。

需要說明的是,雖然一些期刊和出版社已經「買斷」了版權,註明出版社有發表權和傳播權,但不代表出版社具有完全取代作者的權利。總體上看,訓練人工智慧有利於科技進步,但相關公司不能因此免費地、毫無限制地使用作品,仍應在【著作權法】框架內執行,不能打著科技創新的旗號侵權。

□史洪舉