「未來,自然語言將成為新的通用程式語言,你只要會說話,就可以成為一名開發者。」4月16日,百度(Nasdaq:BIDU,09888.HK)創始人、董事長兼行政總裁李彥宏在2024百度AI開發者大會上發表主題演講,他指出,AI(人工智能)正掀起一場創造力革命,未來開發套用就像拍個短影片一樣簡單,人人都是開發者。
李彥宏表示,百度作為一家技術公司,定位是盡可能為大家提供所需的開發工具,這包括了1個基礎模型系列和三大AI開發工具,「今天的中國,有10億互聯網使用者,有強大的基礎大模型,有足夠多的AI套用場景,有全球最完備的產業體系,國家也在大力鼓勵和支持‘人工智能+’行動,每一個人,每一家企業,只需要充分利用這些工具,就可以釋放無限的創造力和生產力。
值得關註的是,李彥宏在開發者大會上談到的工具和案例大部份都是基於大語言模型。面向未來,他認為多模態大模型,抑或是文字、圖片、語音、影片等多模態的融合,是基礎模型非常重要的長期發展方向,是通往AGI(通用人工智能)的必經之路。而百度在這些領域有著長期投入,並將及時更新技術進展。
文心最新成績單:使用者數、API日均呼叫量均超2億
李彥宏首先公布了文心一言和文心大模型的最新進展。
據悉,文心一言於去年3月16日釋出,當時較受外界關註。時隔一年零一個月,文心一言使用者數、API日均呼叫量均突破了2億,服務的客戶數達到了8.5萬,利用千帆平台開發的AI原生套用數超過了19萬。
支撐文心一言的基座模型是文心大模型。過去一年,它經歷了從3.0版本到3.5,再到4.0版本的前進演化。李彥宏稱,文心4.0在理解、生成、邏輯、記憶四大能力方面,均達到了業界領軍水平。近幾個月來,文心大模型在程式碼生成、程式碼解釋、程式碼最佳化等通用能力方面實作了進一步顯著提升,達到國際領先水平。
最新數據顯示,相比一年前,文心大模型的演算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理效能提升了105倍,推理的成本降到了原來的1%。
會上,百度釋出了文心大模型4.0的工具版,該工具版可以讓開發者體驗程式碼直譯器功能,開發者不僅可以透過自然語言互動實作對復雜數據和檔的處理與分析,還可以生成圖表或檔,能夠快速洞察數據中的特點、分析變化趨勢、為後續的決策提供支撐。
「客戶原來一天呼叫1萬次,同樣成本現在可以呼叫100萬次。媒體可能不會因為成本下降99%而興奮。但是企業也好,開發者也好,一旦用起來,最關註的就是效果和成本。」李彥宏指出,把推理成本降到1%,是因為百度在芯片、框架、模型、套用這四層架構上有著全棧的布局,能不斷地把成本打下來。
李彥宏表示,大模型相關的話題在2024年依然會很熱,各類技術突破還會不斷湧現,但他想強調的是,大模型本身並不直接創造價值,基於大模型開發出來的AI套用才能滿足真實的市場需求。而這樣的觀點,李彥宏已多次在公開場合強調,希望大家可以在文心大模型上開發AI套用。
百度開發AI原生套用的思路,是過去踩坑交學費換來的
李彥宏指出,他分享的一些基於大模型開發AI原生套用的具體思路和工具,是百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。他判斷,MoE、小模型和智能體是值得關註的三個方向。
具體來看,一是未來大型的AI原生套用基本都是MoE(大小模型的混用),不依賴一個模型來解決所有問題。
二是小模型推理成本低,響應速度快,在一些特定場景中,經過精調後的小模型,使用效果可以媲美大模型,這也是百度釋出Speed,Lite、Tiny三個輕量模型的原因。
三是智能體是當下較熱的話題之一,隨著智能體能力的提升,會不斷催生出大量新的套用。智能體機制,包括理解、規劃、反思和前進演化,它讓機器像人一樣思考和行動,可以自主完成復雜任務,在環境中持續學習、實作自我叠代和前進演化。
在這三個方向之上,百度釋出了三種不同的工具,分別是:智能體開發工具AgentBuilder、AI原生套用開發工具AppBuilder、各種尺寸的模型客製工具ModelBuilder。
會上,李彥宏再次提及開源模型的弊端,「大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的。」
關於文心大模型開源還是閉源,澎湃新聞記者在4月11日獲取的一份李彥宏的內部談話實錄中看到,李彥宏認為,目前國外像Llama(編註:Meta開源模型),Mistral(編註:法國人工智能初創公司 Mistral釋出的模型)都有相當的影響力,國內的智源、百川、阿裏的通義也都是開源模型,市場上不缺百度這一家開源的模型。百度要開源還得自己去維護一套開源的版本,這不劃算。
李彥宏的判斷是,閉源才有真正的商業模式,才能聚集人才和算力。
百度2月28日釋出的2023年第四季度及全年財報顯示,百度去年總營收達1345.98億元,同比增長9%;歸屬百度的凈利潤(non-GAAP)287億元,同比增速達39%;四季度營收349.51億元,同比增長6%,歸屬百度的凈利潤(non-GAAP)77.55億元,同比大漲44%。2023年,百度全年營收和利潤均超市場預期。李彥宏在財報會上預計,2024年生成式人工智能與基礎模型業務將為百度帶來數十億元人民幣的增量收入,這也將為百度的總收入帶來正向影響。
財報顯示,百度2023年的研發支出為242億元,較2022年增長4%。百度在財報中表示,這主要由於支持生成式AI研發投入的伺服器的折舊開支及伺服器機架費增加。
截至午間收盤,百度港股跌2.17%,報94.650港元/股,總市值2655億港元。美股表現方面,截至美東時間4月15日收盤,百度跌1.25%,報96.320美元/股,總市值337.36億美元。