界面新聞記者 | 陳振芳
界面新聞編輯 | 宋佳楠
新晉人工智慧霸主OpenAI開始挑戰搜尋市場格局。
OpenAI很可能推出基於ChatGPT技術的新搜尋引擎。5月6日,界面新聞註意到,名為「GPT Search」的網頁已經上線,但目前只有會員才能存取。
上述訊息最早是創業孵化器Y Combinator中的一篇貼文透露的,文中稱「search.chatgpt.com」的網域名稱和安全證書已經建立。知名記者Pete Huang也發推特預告,表示GPT Search將在5月9日正式上線。
OpenAI如何提供更個人化的深度整合搜尋體驗,以及帶來怎樣的人與資訊的互動方式變革備受外界期待。自從ChatGPT誕生,科技圈都在等待著一場OpenAI與谷歌在搜尋市場的正面對決。已經有大量使用者透過微軟的Bing Chat、谷歌的Gemini等聊天機器人,獲得人工智慧生成檢索答案。
目前,OpenAI估值超800億美元,微軟已向該公司投入130億美元。OpenAI在搜尋市場上顯得「野心勃勃」。
「將LLM(大型語言模型)與搜尋進行深度整合,ChatGPT可能是搜尋的未來。」今年4月,OpenAI執行長Sam Altman已經向人們昭示了該公司的宏大野心。
這家手握微軟130億美元投資的公司,目前估值超800億美元。無論在技術還是資金上,它已然成為能夠威脅到谷歌搜尋地位的新勢力。
事實上,OpenAI已經在借助微軟之力不斷向搜尋引擎逼近。去年5月,微軟在其「2023 Build開發者大會」上宣布,Bing搜尋將很快直接整合到OpenAI的ChatGPT聊天機器人中,從而在Bing上內建部份即時搜尋功能。
微軟還表示,ChatGPT將內建一個世界級的搜尋引擎,以提供更及時、更新的答案,並從網頁上獲取資訊。
彼時,微軟公司CEO、董事長薩提亞·納德拉曾樂觀地表示,「整個搜尋類別正在經歷翻天覆地的變化,這樣的機會很少出現。」
更有樂觀者認為,此舉或將成為人工智慧的「iPhone時刻」,有望削弱或顛覆谷歌在搜尋市場的主導地位。
到了去年10月,微軟Bing將OpenAI最新版本的影像生成模型DALL-E3納入其中,幫助存取者生成逼真的影像,從而提升使用者使用頻率。
微軟公司副總裁兼Copilot和Bing工程與產品負責人Jordi Ribas稱,「DALL-E3加入後,必應使用量增加了10倍,這確實對產品的參與度和使用者產生了影響。」
彭博社分析稱,2023年第二季度,美國Bing月度活躍使用者同比增長一倍以上,達到310萬,使用者在搜尋引擎上花費的時間增加了84%。SensorTower的數據則顯示,到年底,Bing的月活躍使用者已穩步增長至440萬。
然而要談Bing挑戰谷歌的霸主地位還為時尚早。StatCounter數據顯示,截至2023年底,微軟Bing僅占全球搜尋市場的3.4%,自宣布整合ChatGPT以來,其市場份額上升了不到1個百分點,而谷歌仍然占據全球90%的搜尋市場總量。
對搜尋而言,數據是決定搜尋品質的關鍵因素,即搜尋次數越多,搜尋答案越精準。
生成式人工智慧將如何改變搜尋及排名結果,也將對谷歌頗為依賴的廣告模式產生影響。過去,搜尋廣告主要依靠點選次數盈利,導致大量劣質廣告資訊前置,使用者體驗極差。在中國,類似的情況同樣存在。
「如果我們能夠建立一個比谷歌更好的搜尋引擎,那就應該這樣做。」Sam Altman指出:「谷歌向你展示了13個廣告和10個藍色連結,也許有更好的方法來幫助人們搜尋資訊,並根據提示采取行動。」
但要拿下搜尋市場,還需要硬體公司和內容數據方的深度配合。眼下,OpenAI仍為搜尋數據所困。
就在4月30日,奧爾登全球資本旗下的八家日報起訴OpenAI和微軟,指控兩家公司非法使用新聞文章為其人工智慧聊天機器人提供動力。
這些公司在訴狀中稱,OpenAI和微軟在未經授權的情況下使用數百萬篇受版權保護的文章來訓練和餵養他們的生成式人工智慧產品,包括ChatGPT和Microsoft Copilot。該訴訟沒有要求具體的金錢賠償,但要求陪審團審判,並表示出版商因使用內容而應獲得賠償。
「我們花費了數十億美元在出版物上收集資訊和報道新聞,我們不能允許OpenAI和微軟擴大竊取我們工作成果,以犧牲我們的利益為代價建立自己的業務。」奧爾登報紙的執行主編Frank Pine在一份聲明中說。
OpenAI發言人則回應稱,公司此前並不了解奧爾登的擔憂,但正在與許多新聞機構建立合作夥伴關系並進行對話,以探索合作機會。當地時間5月6日,英國【金融時報】宣布已與OpenAI達成內容授權合約,後者能夠利用其資料庫來訓練GenAI模型。
與此同時,不少作家也開始行動,包括瑪格麗特·阿特伍德、丹·布朗和喬迪·皮考特在內的8500多名作者,聯合敦促ChatGPT和Bard等負責生成人工智慧套用的科技公司,在未經適當授權的情況下停止使用他們的作品或提供補償。
【紐約時報】最近的一項調查發現,許多科技公司在努力跟上人工智慧步伐的過程中忽視了相關政策,並討論規避版權法,以獲取盡可能多的數據來訓練聊天機器人。國內的大模型同樣無法避免這一問題,各類大模型產品的參考答案多來自於媒體報道或已有的數據。
生成式人工智慧從根本上改變搜尋市場,距離這一天也許不會太遙遠。但在此之前,這些AI公司需要首先解決好數據來源以及版權爭議等問題。