2024世界人工智慧大會｜「百模大戰」如何突圍？這兩家上海AI企業有自己的思考

2024-06-21辟謠

圖說：星環科技大廳展示的數據+AI基礎設施產品魔術方塊新民晚報記者陶磊攝（下同）

7月初，2024世界人工智慧大會又將如約在上海拉開大幕。不用說，今年的關鍵詞一定是「大模型」。據介紹，目前全市已有34款大模型透過備案，產生了制造業、金融、具身智慧機器人等垂類領域套用。

20日，記者跟隨大會主辦方走進兩家人工智慧頭部企業，一探大模型的行業現狀。

把大模型訓練成「理科生」

星環科技致力於打造企業級大數據與人工智慧基礎軟體，圍繞數據的整合、儲存、治理、建模、分析、挖掘和流通等數據全生命周期提供基礎軟體產品，構建明日數據世界。「大模型相關技術已融入企業生產經營的方方面面。」星環科技創始人、CEO孫元浩指出，「大模型主要優勢是提供了自然語言理解能力，還有簡單的推理能力，並能在個人指導下調動工具。」

孫元浩說，目前來看，大模型落地過程中遇到了很多挑戰，今年以來大家開始理性看待大模型具體能帶來什麽，「在大模型落地過程中，逐漸顯現出一些難點，如技術執行、實施成本、相關技術人才的缺乏、生成式人工智慧的治理、數據可用性等等。」

圖說：工作人員演示星環科技大模型產品

立足於大數據基礎軟體優勢，星環科技是國內第一批推出自研大模型的軟體資訊公司。早在2023年5月，公司就推出了業界首創的金融大模型「無涯」，以及大數據分析大模型SoLar「求索」。在孫元浩看來，當下眾多AI大模型更像「文科生」，而星環科技的目標是將大模型訓練成「理科生」，能夠進行數學分析，懂得自然科學的各個學科，從而解決企業營運過程中的實際問題。

就在不久前，星環科技推出了「問知」AIPC版，它支持多格式、不限長度的檔資料入庫，還支持影、音、圖、文等多模態數據的「知識化」處理，以及「語意化」查詢和套用能力。值得關註的是，這是一款為個人使用者設計的大模型套用產品，可以在配備Intel新一代CPU的主流個人電腦上，基於整合顯卡和NPU流暢執行。

「模型的建構和人的發展有諸多相似之處。一個人很難熟知所有科學知識，這就需要不同領域的專家，專業模型亦是如此。」孫元浩告訴記者，「星環科技透過收窄模型的套用領域，訓練出不同垂類的專業模型，然後將這些專業模型組合成大模型。這在保證模型專業度的同時，大大降低了模型的訓練代價和推理代價。」

堅信Scaling Law 選擇「厚積薄發」

階躍星辰是一家通用大模型創業公司，自成立起在算力、系統、數據和演算法這四大要素上綜合布局，已對外釋出Step系列大模型；同時，透過自有產品和合作產品兩種方式探索C端套用，已推出的產品包括個人效率助手「躍問」和 AI 開放世界平台「冒泡鴨」。

圖說：階躍星辰展廳展示的文生廣告圖

「GPT-4有萬億參數，而人腦的神經元連線是200萬億。」階躍星辰系統負責人朱亦博博士打比方說，這家坐落於徐匯西岸智塔的初創公司信仰Scaling Law（規模法則），認為在肉眼可見的未來，至少還有十萬億和百萬億兩個數量級的大模型。面對喧囂的「百模大戰」，階躍星辰選擇了「厚積薄發」，朱亦博說，攀登Scaling Law的巔峰，畢竟是一個包含算力、系統、數據和演算法的「鐵人四項」超級工程。

低調了近一年，階躍星辰在今年三月「初露鋒芒」——釋出Step系列大模型，包含了Step-1千億參數語言大模型、Step-1V千億參數多模態大模型，以及Step-2萬億參數MoE（混合專家架構）語言大模型預覽版。「Step-1V一經釋出便登上了權威大模型評測平台‘司南’的多模態大模型3月榜榜首。」朱亦博介紹，「Step-1V的多模理解能力突出，可以精準描述和理解影像中的文字、數據、圖表等資訊，並根據影像資訊實作內容創作、邏輯推理、數據分析等多項任務。」

階躍星辰的研發團隊覺得，通用大模型未來還能走得更遠，「模型要大，多模態理解和生成的統一是通往AGI的必經之路。」作為一家初創公司，階躍星辰也很務實，會大方地承認「還在追趕GPT-4」。「OpenAI釋出的模型在不斷叠代，我們現在的模型也還在打磨。希望不久的將來，能有對標GPT-4的水平。」朱亦博坦言。

圖說：階躍星辰工作人員介紹AI智慧助手「躍問」

朱亦博告訴記者，如果大語言模型要上萬億參數，MoE架構可以說是最優解，「MoE是在效能、參數量、訓練成本、推理成本這些維度權衡下的最佳選擇。」

值得一提的是，階躍星辰Step系列通用大模型憑借其技術創新和廣泛的落地套用，已經成功入選2024世界人工智慧大會SAIL獎30強榜單。階躍星辰基於Step系列大模型推出了一款個人效率助手「躍問」，在本屆世界人工智慧大會上也會帶來最新的產品功能體驗。

新民晚報記者郜陽

2024世界人工智慧大會 ｜ 「百模大戰」如何突圍？這兩家上海AI企業有自己的思考