當前位置: 華文天下 > 辟謠

2024世界人工智慧大會 | 「百模大戰」如何突圍?這兩家上海AI企業有自己的思考

2024-06-21辟謠

圖說:星環科技大廳展示的數據+AI基礎設施產品魔術方塊 新民晚報記者 陶磊 攝(下同)

7月初,2024世界人工智慧大會又將如約在上海拉開大幕。不用說,今年的關鍵詞一定是「大模型」。據介紹,目前全市已有34款大模型透過備案,產生了制造業、金融、具身智慧機器人等垂類領域套用。

20日,記者跟隨大會主辦方走進兩家人工智慧頭部企業,一探大模型的行業現狀。

把大模型訓練成「理科生」

星環科技致力於打造企業級大數據與人工智慧基礎軟體,圍繞數據的整合、儲存、治理、建模、分析、挖掘和流通等數據全生命周期提供基礎軟體產品,構建明日數據世界。「大模型相關技術已融入企業生產經營的方方面面。」星環科技創始人、CEO孫元浩指出,「大模型主要優勢是提供了自然語言理解能力,還有簡單的推理能力,並能在個人指導下調動工具。」

孫元浩說,目前來看,大模型落地過程中遇到了很多挑戰,今年以來大家開始理性看待大模型具體能帶來什麽,「在大模型落地過程中,逐漸顯現出一些難點,如技術執行、實施成本、相關技術人才的缺乏、生成式人工智慧的治理、數據可用性等等。」

圖說:工作人員演示星環科技大模型產品

立足於大數據基礎軟體優勢,星環科技是國內第一批推出自研大模型的軟體資訊公司。早在2023年5月,公司就推出了業界首創的金融大模型「無涯」,以及大數據分析大模型SoLar「求索」。在孫元浩看來,當下眾多AI大模型更像「文科生」,而星環科技的目標是將大模型訓練成「理科生」,能夠進行數學分析,懂得自然科學的各個學科,從而解決企業營運過程中的實際問題。

就在不久前,星環科技推出了「問知」AIPC版,它支持多格式、不限長度的檔資料入庫,還支持影、音、圖、文等多模態數據的「知識化」處理,以及「語意化」查詢和套用能力。值得關註的是,這是一款為個人使用者設計的大模型套用產品,可以在配備Intel新一代CPU的主流個人電腦上,基於整合顯卡和NPU流暢執行。

「模型的建構和人的發展有諸多相似之處。一個人很難熟知所有科學知識,這就需要不同領域的專家,專業模型亦是如此。」孫元浩告訴記者,「星環科技透過收窄模型的套用領域,訓練出不同垂類的專業模型,然後將這些專業模型組合成大模型。這在保證模型專業度的同時,大大降低了模型的訓練代價和推理代價。」

堅信Scaling Law 選擇「厚積薄發」

階躍星辰是一家通用大模型創業公司,自成立起在算力、系統、數據和演算法這四大要素上綜合布局,已對外釋出Step系列大模型;同時,透過自有產品和合作產品兩種方式探索C端套用,已推出的產品包括個人效率助手「躍問」和 AI 開放世界平台「冒泡鴨」。

圖說:階躍星辰展廳展示的文生廣告圖

「GPT-4有萬億參數,而人腦的神經元連線是200萬億。」階躍星辰系統負責人朱亦博博士打比方說,這家坐落於徐匯西岸智塔的初創公司信仰Scaling Law(規模法則),認為在肉眼可見的未來,至少還有十萬億和百萬億兩個數量級的大模型。面對喧囂的「百模大戰」,階躍星辰選擇了「厚積薄發」,朱亦博說,攀登Scaling Law的巔峰,畢竟是一個包含算力、系統、數據和演算法的「鐵人四項」超級工程。

低調了近一年,階躍星辰在今年三月「初露鋒芒」——釋出Step系列大模型,包含了Step-1千億參數語言大模型、Step-1V千億參數多模態大模型,以及Step-2萬億參數MoE(混合專家架構)語言大模型預覽版。「Step-1V一經釋出便登上了權威大模型評測平台‘司南’的多模態大模型3月榜榜首。」朱亦博介紹,「Step-1V的多模理解能力突出,可以精準描述和理解影像中的文字、數據、圖表等資訊,並根據影像資訊實作內容創作、邏輯推理、數據分析等多項任務。」

階躍星辰的研發團隊覺得,通用大模型未來還能走得更遠,「模型要大,多模態理解和生成的統一是通往AGI的必經之路。」作為一家初創公司,階躍星辰也很務實,會大方地承認「還在追趕GPT-4」。「OpenAI釋出的模型在不斷叠代,我們現在的模型也還在打磨。希望不久的將來,能有對標GPT-4的水平。」朱亦博坦言。

圖說:階躍星辰工作人員介紹AI智慧助手「躍問」

朱亦博告訴記者,如果大語言模型要上萬億參數,MoE架構可以說是最優解,「MoE是在效能、參數量、訓練成本、推理成本這些維度權衡下的最佳選擇。」

值得一提的是,階躍星辰Step系列通用大模型憑借其技術創新和廣泛的落地套用,已經成功入選2024世界人工智慧大會SAIL獎30強榜單。階躍星辰基於Step系列大模型推出了一款個人效率助手「躍問」,在本屆世界人工智慧大會上也會帶來最新的產品功能體驗。

新民晚報記者 郜陽