當前位置: 華文天下 > 辟謠

高艷東:人工智能時代,從法律層面保護好數據主權

2024-07-31辟謠

來源:環球時報

近日,微軟高管蘇萊曼認為,為了訓練人工智能(AI)模型使之更好地服務人類而抓取互聯網上的任何內容都屬於合理使用,既不需要支付著作權人報酬亦無需征求著作權人同意。在他看來,開放網絡上的內容屬於「免費軟件」,任何人都可以復制,用它來再創造、再生產。微軟高管的這一觀點,表面上是公開數據的合理使用問題,實質是演算法權力對數據主權的挑戰。

發展人工智能和保護知識產權應當並列,可以使用網絡上的公開數據訓練AI,但不能侵犯著作權。毫無疑問,AI的廣泛套用對人類社會發展具有重要價值,將把人類推向智能時代,我們應當鼓勵其發展並給予熱烈掌聲。但同時,其發展過程也不能無視知識產權保護體系。訓練AI大模型需要投餵大量數據,而其中的高質素數據都是由人類創造。皮之不存,毛將焉附?人工智能的前提是「人工」,在可以預計的未來,人工智能的學習物件還將是人的作品。如果沒有知識產權保護體系,人類創作優秀作品的動力和數量也將銳減,AI發展也必然受到阻礙。顯然,我們要平衡人工智能發展需要與知識產權保護需要。不能為了發展人工智能而忽視建立知識產權保護體系的重要性,微軟高管觀點的實質,是站在商業立場上,為企業減少生產成本的片面言論,是為利用技術優勢掠奪他人利益行為的辯護。

微軟等AI巨頭爬取海量數據用於訓練人工智能,已經遠遠超出了「合理使用」的範疇。其實,基於商業目的爬取海量數據訓練AI模型的行為,在絕大多數國家都很難被認定為合理使用。美國【版權法】中的合理使用首先要考慮「使用作品的目的與特性:具有商業性質還是為了非營利的教學目的」。這也是2023年【紐約時報】起訴OpenAI和微軟的原因——在未經特許的情況下使用受版權保護的新聞文章來訓練AI聊天機器人。相關行為同樣不屬於中國【著作權法】中的合理使用,【著作權法】第24條對於「可以不經著作權人特許,不向其支付報酬」而使用作品的情況有著明確規定,其中合理使用的標準是:在特殊情況作出;與作品的正常使用不相沖突;不得不合理地損害著作權人合法權益。合理使用的關鍵在於判斷「特殊情況」。【著作權法】第24條第十三項規定了「適當參照」「不可避免」「少量復制」「不以營利為目的」等屬於「特殊情況」。顯然,微軟公司的商業行為無法被認為是「特殊情況」,可見微軟高管的觀點是基於公司私利而無視各國法律的商業邏輯。

中國應當警惕演算法權力威脅數據主權。近年來,美國AI領域發展迅速,有較大的技術優勢。微軟高管的觀點,也代表目前人工智能領域的數據殖民主義。一些AI巨頭利用演算法、算力優勢免費爬取海量全球數據訓練AI大模型,然後再將訓練出的AI產品賣給其他國家,這種數據掠奪是數碼時代的沙文主義。無論是航海時代、工業時代抑或二戰後,歷史上以各種方式掠奪其他國家資源的情況一直存在。在人工智能時代,這種剝削的方式就包括免費海量獲取他國數據。面對這種新型的數據侵犯,中國應當積極應對,防止淪為數據殖民地。

首先,防範技術剝削的最好辦法就是技術反制。近年來,中國人工智能產業發展迅速,但仍需全方面加快技術發展節奏,不斷完善促進技術發展的法律體系。歐洲在近年相繼出台了【通用數據保護條例】(GDPR),透過了監管AI的【人工智能法案】。但這種強監管主義並沒有帶來歐洲數碼產業的大爆發,而美國立法的寬松主義及對數碼巨頭的保護政策則幫助該國企業不斷收割全球數碼利益。所以,先發展再監管的人工智能立法政策值得學習,畢竟只有掌握了技術優勢,中國才能反制美國的數據侵略。

其次,應積極倡導數據主權平等,抵制數據沙文主義。在人工智能時代,各國對如何維護數據主權雖共同需求但尚無統一行動,中國應當提出具有全球號召力的數碼共識,同時推動建立一套維護各國數據主權的國際法準則。在實作路徑上,應本著友好協商原則,在「一帶一路」機制、金磚國家合作機制的「朋友圈」裏倡導數據有主權範圍、演算法涉及國家利益的觀念,並建立符合各國利益的國際數據仲裁院、國際數碼法庭等機構,為未來可能的演算法權力爭端做好法律準備。

數據無小事,演算法之爭也是國力比拼。在人工智能時代應當著眼未來國家發展,在政策上,積極發展人工智能技術,以技術優勢打贏算力競賽;在立法上,本著包容審慎監管的態度,出台技術友好型法律;在國際上,倡導數據主權平等主義,構建數據爭端解決國際機構。只有堅持發展主義,才能在數據霸權時代走好民族復興之路。(作者是浙江數碼化發展與治理研究中心研究員)