想象一下,你寫下一個故事,然後「噗」地一聲,它就變成了一段視訊,就像魔術師從帽子裏拉出一只兔子。這不是某個科幻電影裏的橋段,而是已經成真的現實,隨著AIGC技術的躍遷式發展,大模型正從文字裏「變」出視訊。
2024年初,視訊大模型Sora橫空出世,它可以基於使用者輸入的描述文字,一鍵生成長達60秒的視訊,並深入理解和呈現使用者想象中的情緒以及光影。一如一年前出現的ChatGPT,Sora被認為是通往AGI的又一個裏程碑時刻,也是OpenAI繼ChatGPT之後放出的第二枚重磅炸彈,給AIGC的火熱又添了一把柴。
「後浪拍前浪,以前需要花費一年的進展,變成了幾個月就能實作,又變成了幾天、幾小時……」這是AI文生視訊創企Runway創始人看到Sora的驚艷效果後所發出的感嘆。360集團創始人周鴻祎更預言,「AGI實作將從10年縮短到1年」。
大模型經過2023一整年的狂奔,行業的躁動與資本的狂熱相交匯,既產生了投機者的渾水摸魚,也造就了信仰派的腳踏實地。
4月26日晚,AIGC創意軟體公司萬興科技(300624.SZ)釋出2023年年報,報告期內,該上市公司實作營收與凈利潤雙增長。其中,營收達14.81億元,同比增長25.49%,歸母凈利8620.57萬元,增長113.20%,扣非凈利同比大增817.45%至8968.31萬元。視訊創意業務貢獻了65%的營收,達到9.61億元,同比增長2.15億元。
從財報中不難看出,萬興科技透過AIGC技術上的創新,在業務上加速前進演化,正步入AI「價值螺旋」。
套用落地先鋒,爭搶AI套用王座
ChatGPT的出現重塑了傳統的內容生產和獲取方式,激發了數位經濟的活力和創造力,據Gartner研究預測,到2030年,90%的數位內容都將是AI生成。
AIGC的火熱,直接推動了大模型的爆發。
根據【北京市人工智慧行業大模型創新套用白皮書(2023年)】顯示,截至2023年10月,中國10億參數規模以上的大模型廠商及高校院所共計254家,研發的大模型數量排名全球第二。
當時媒體們用「百模競逐」來形容這一行業盛況。
但技術的發展從來不以技術本身為終點。舉例來說,1999年李彥宏帶著自己發明的超鏈分析演算法成立了百度,並推出百度搜尋引擎,成就了後來的中文互聯網巨頭。字節跳動龐大身軀的內核是它的獨門演算法推薦機制,但也是在今日頭條、抖音等套用中,才將演算法的價值最大化。
技術為套用而生,無套用不技術。當大模型引發業界的巨大關註後,各家廠商也註意到,市場上不缺大模型,也不缺技術,而是缺場景,缺少充分發揮大模型能力的載體。
萬興科技董事長吳太兵在去年的世界計算大會上直截了當地指出,如果說AI是電力,大模型是三峽水電站一樣的大型發電站,那麽落地的AI套用則是各種電器。大模型時代,套用為王,大模型則可能是「王後」。
因此,在行業都在專註於大模型,對標著ChatGPT的能力,在文本大模型、圖片大模型領域發力時,萬興科技卻紮根於自己的視訊創意主賽道,並未馬上開展大模型建設,而是率先將AI的能力註入到產品中,積極推動大模型等AI技術在套用中的落地。
在AI套用落地方面,有兩條可行路徑,一條以AI為出發點進行設計的「AI原生套用」,一條是「AI+套用」,即在現有產品套用的基礎上整合AI功能來重構套用。
從這次釋出的財報來看,萬興科技證明了這兩條路都能走通。一方面,萬興科技運用AI的能力,對旗下各套用產品進行了大量的創新,目前已經實作了主要產品AI化,旗下萬興喵影、萬興PDF、億圖圖示、墨刀等產品均已上線AIGC功能,雲端AI工具集Media.io完成了全面煥新。其中,核心的視訊創意軟體Wondershare Filmora在2023年上線AI文本成片、AI摳像等一大批AI功能,切中使用者需求痛點、癢點。
年報數據顯示,2023年,萬興科技核心業務線視訊創意營收達9.6億,占總收入比重增至65%,夯實了AI套用先鋒者地位。
另一方面,萬興科技還推出了萬興播爆、Wondershare TruMate、Wondershare Kwicut等多款AIGC新品。這些套用從一開始就以AI技術為核心進行開發,AI含量相對更高。
例如數位人行銷視訊創作軟體萬興播爆,就是一款從行業需求出發打造的全新AIGC套用。此前,做跨境業務的企業在開展業務時,經常會要拍攝具有當地特色的行銷視訊,經常遇到外籍演員選擇有限、國外取景拍攝溝通執行不便等問題,由此產生制作成本高、時效低的痛點。而萬興播爆產品中內建不同膚色和人種的超逼真數位人,支持大部份語音,使用者只需要幾分鐘時間就可以快速生成一條行銷視訊。
從行業來看,過去一年,已有不少企業開始轉變思路,致力於將大模型套用於具體場景。海外,OpenAI打造了類似Apple Store的GPT Store,試圖透過AI市集的形式讓大模型能惠及更多普通人,微軟在瀏覽器、辦公套件等產品中推出Coplilot。
國內,百度推出「文心千帆」向客戶提供企業級大語言模型服務,百度董事長李彥宏在「2023中關村論壇」上演講時表示,未來所有的套用都將基於大模型來開發,每一個行業都會擁有屬於自己的大模型,大模型會深度融合到實體經濟當中去。
垂直大模型先鋒,「天幕」開啟音視訊創意行業新篇
經過2023年一整年的發展,大模型正加速從實驗室邁向市場。市場預計,2024年將是大模型場景套用元年。
市場風向變換不斷,而萬興科技一個很大的特點是,不跟風。在大模型最火熱的時候,萬興並沒有急著入局,而是聚焦數位創意主業,專註AI技術對套用的改造和落地。當大模型由1.0圖文時代前進演化到以音視訊為載體的2.0時代,進入到萬興科技的專業領域時,公司反而躬身入局大模型領域,推出國內第一個音視訊多媒體大模型萬興「天幕」。
萬興科技推出「天幕」有著自己的考量。
從文本的角度來看,大模型的發展已經比較成熟了,但音視訊大模型在技術層面由於數據、算力等多方面原因,導致產品數量較少,效果也沒有大家期待的那麽完美。
OpenAI在釋出大模型之時就提出了多模態,但此前很長一段時間內,行業內的視訊生成效果都很難滿足業界的需求。即便是Pika labs這種火熱的產品,也存在明顯的拖影、模糊等問題,品質不理想。
有專業人士做過總結,視訊生成目前存在三大挑戰:
第一,數據集欠缺,視訊內容儲存和標註成本高昂,視訊相關的訓練數據集目前仍較欠缺;
第二,算力成本高昂,視訊訓練所需的算力遠高於圖片、文字等其它內容;
第三是生成效果不佳,目前仍缺乏效果可用性較好的模型作為標桿。
既然市面上沒有趁手的音視訊大模型可用,那就自己做吧。
「天幕」定位為音視訊多媒體創作垂類大模型,由視訊大模型、音訊大模型、圖片大模型、語言大模型組成,與基於視覺數據的底層通用模型Sora有著較大的差異。
Sora的核心能力為文生視訊,「天幕」則是基於15億使用者行為及100億本土化高品質音視訊數據沈澱,除文生視訊外,當前已叠代視訊生視訊、文生音樂、數位人播報等近百項音視訊原子能力,能夠在泛知識、泛行銷、泛娛樂等領域,助力創作者更好地進行創作表達。
客觀評述,「天幕」只是開啟了一扇窗,若要真正產出完美的AI視訊,還有諸多障礙需要跨越。
首先,視訊由很多能力和元素構成,包括動畫、字幕、音樂、特效、美化、貼紙、轉場、畫中畫,還有頂層資源、顆粒等,數據結構非常復雜。
其次,視訊制作的鏈路很長,技術門檻也比較高,在構思階段,可能需要GPT或者文心一言這樣的通用大模型,做內容源時需要本地拍攝,需要獲得資源方便加工,需要第三方工具進行效果生成,還需要算力、做編解碼。
最後,從大模型本土化要求算力、數據和套用都要本土化,特別是套用層面,需要算力的本土化,需要數據的本土化,才能研發出更本土化的套用。
解決技術難點的方法無非兩個方面,向內,透過增加研發投入來提升技術實力,向外,組建自己的生態「朋友圈」,實作強強聯合。
根據2023年年報,萬興科技在AIGC技術研發和產品升級上進行了大手筆投入,全年研發投入達到4.03億元,以支撐萬興「天幕」大模型研發、WES5.0開發、Wondershare Filmora V13桌面端及移動端開發、萬興播爆2.0等。
同時,萬興科技在行業合作上保持開放合作的姿態,合作夥伴囊括眾多海內外知名企業,一方面,引入OpenAI等外部大模型能力,另一方面,與微軟、華為、湘江實驗室等海內外企業及科研機構開展合作,此外,科大訊飛、英特爾,也都在萬興科技生態「朋友圈」中。
不難看出,萬興科技已經搭建起了一個以「天幕」為中心的多媒體大模型套用生態架構,聚合了一個兼顧了「快」與「遠」的生態,既能助力「天幕」的升級叠代,又為公司業務發展提供動力。
大模型價值先鋒,步至AI價值螺旋
知名調研機構Gartner曾在【2021年預測:人工智慧對人類和社會的影響】的研究中預測,2021年AIGC生成數據占全球數據的比例不足1%,2025年該比例有望增至10%。
這也意味著,在大模型與AIGC匯聚而成的時代浪潮下,萬興科技還有巨大的增長空間。
事實上,此前國金證券在【三次AI邏輯拐點驗證,誌在「中國Adobe」】的研報中也表達出,萬興科技在本輪AI浪潮中已經經歷了三次自身的AI邏輯拐點,「量價齊升」邏輯已得到業績層面確證。
上文提到的Filmora版本大更新,萬興提供了Filmora三端打通的會員模式,公司將Filmora 訂閱費用由49.9 美元提至69.9美元,由於AI能力整合,降低C端使用者對視訊創意軟體進入門檻的同時,提升了使用體驗,使用者好評不斷。
從財報來看,2023年萬興科技多條業務線增收顯著,其中核心業務線視訊創意營收達9.61億,占總收入比重增至65%,視訊創意產品因AI的加持,在進行業績兌現。
以上為萬興科技的第一波AI邏輯拐點。
第二波AI邏輯拐點,則在於大模型研發訓練成本的下降。
從行業的大趨勢來看,在芯片硬體廠商的推動下,GPU效能不斷提升將帶來大模型廠商訓練/推理成本的下降,大模型廠商對模型結構與演算法的持續改進,也將帶來訓練/推理成本的改善。
除此之外,雲端運算頭部廠商跑馬圈地階段的讓利定價,也將推動以OpenAI為代表的大模型廠商的模型呼叫成本降低。
最後,萬興科技的第三波AI邏輯拐點來自於大模型價值的逐步顯現。
根據萬興科技在不久前結束的「中國生成式AI大會」上公布的資訊顯示,目前「天幕」已涵蓋文生視訊、視訊生視訊等原子能力,相關能力已在萬興科技旗下產品規模化商用。其中文生視訊能力上,已實作不同風格、豐富場景及主題的連貫性,且一鍵生成時長支持60秒+。未來,「天幕」還有近百項音視訊原子能力將全面整合到公司矩陣產品中落地套用。
(萬興「天幕」文生視訊【男孩的探險之行】)
盡管目前行業成熟尚需時日,眾多新興技術仍處於研發和最佳化階段,未形成規模效應,但未來的時代必然是AI的大時代,作為未來10-20年最重要新質生產力之一,AI技術發展大勢已然明確。研究數據顯示,全球AIGC市場規模預計在2032年達到1.3萬億美元。
AI浪潮正以不可阻擋之勢奔湧向前,以萬興科技為代表的AIGC先鋒者,正在透過新業態、新模式、新產品,在AIGC時代的新一輪競爭中搶占先機,用更智慧高效的AI套用賦能全球創作者,打造一個更有創意的世界。