想象一下,你写下一个故事,然后「噗」地一声,它就变成了一段视频,就像魔术师从帽子里拉出一只兔子。这不是某个科幻电影里的桥段,而是已经成真的现实,随着AIGC技术的跃迁式发展,大模型正从文字里「变」出视频。
2024年初,视频大模型Sora横空出世,它可以基于用户输入的描述文字,一键生成长达60秒的视频,并深入理解和呈现用户想象中的情绪以及光影。一如一年前出现的ChatGPT,Sora被认为是通往AGI的又一个里程碑时刻,也是OpenAI继ChatGPT之后放出的第二枚重磅炸弹,给AIGC的火热又添了一把柴。
「后浪拍前浪,以前需要花费一年的进展,变成了几个月就能实现,又变成了几天、几小时……」这是AI文生视频创企Runway创始人看到Sora的惊艳效果后所发出的感叹。360集团创始人周鸿祎更预言,「AGI实现将从10年缩短到1年」。
大模型经过2023一整年的狂奔,行业的躁动与资本的狂热相交汇,既产生了投机者的浑水摸鱼,也造就了信仰派的脚踏实地。
4月26日晚,AIGC创意软件公司万兴科技(300624.SZ)发布2023年年报,报告期内,该上市公司实现营收与净利润双增长。其中,营收达14.81亿元,同比增长25.49%,归母净利8620.57万元,增长113.20%,扣非净利同比大增817.45%至8968.31万元。视频创意业务贡献了65%的营收,达到9.61亿元,同比增长2.15亿元。
从财报中不难看出,万兴科技通过AIGC技术上的创新,在业务上加速进化,正步入AI「价值螺旋」。
应用落地先锋,争抢AI应用王座
ChatGPT的出现重塑了传统的内容生产和获取方式,激发了数字经济的活力和创造力,据Gartner研究预测,到2030年,90%的数字内容都将是AI生成。
AIGC的火热,直接推动了大模型的爆发。
根据【北京市人工智能行业大模型创新应用白皮书(2023年)】显示,截至2023年10月,我国10亿参数规模以上的大模型厂商及高校院所共计254家,研发的大模型数量排名全球第二。
当时媒体们用「百模竞逐」来形容这一行业盛况。
但技术的发展从来不以技术本身为终点。举例来说,1999年李彦宏带着自己发明的超链分析算法成立了百度,并推出百度搜索引擎,成就了后来的中文互联网巨头。字节跳动庞大身躯的内核是它的独门算法推荐机制,但也是在今日头条、抖音等应用中,才将算法的价值最大化。
技术为应用而生,无应用不技术。当大模型引发业界的巨大关注后,各家厂商也注意到,市场上不缺大模型,也不缺技术,而是缺场景,缺少充分发挥大模型能力的载体。
万兴科技董事长吴太兵在去年的世界计算大会上直截了当地指出,如果说AI是电力,大模型是三峡水电站一样的大型发电站,那么落地的AI应用则是各种电器。大模型时代,应用为王,大模型则可能是「王后」。
因此,在行业都在专注于大模型,对标着ChatGPT的能力,在文本大模型、图片大模型领域发力时,万兴科技却扎根于自己的视频创意主赛道,并未马上开展大模型建设,而是率先将AI的能力注入到产品中,积极推动大模型等AI技术在应用中的落地。
在AI应用落地方面,有两条可行路径,一条以AI为出发点进行设计的「AI原生应用」,一条是「AI+应用」,即在现有产品应用的基础上集成AI功能来重构应用。
从这次发布的财报来看,万兴科技证明了这两条路都能走通。一方面,万兴科技运用AI的能力,对旗下各应用产品进行了大量的创新,目前已经实现了主要产品AI化,旗下万兴喵影、万兴PDF、亿图图示、墨刀等产品均已上线AIGC功能,云端AI工具集Media.io完成了全面焕新。其中,核心的视频创意软件Wondershare Filmora在2023年上线AI文本成片、AI抠像等一大批AI功能,切中用户需求痛点、痒点。
年报数据显示,2023年,万兴科技核心业务线视频创意营收达9.6亿,占总收入比重增至65%,夯实了AI应用先锋者地位。
另一方面,万兴科技还推出了万兴播爆、Wondershare TruMate、Wondershare Kwicut等多款AIGC新品。这些应用从一开始就以AI技术为核心进行开发,AI含量相对更高。
例如数字人营销视频创作软件万兴播爆,就是一款从行业需求出发打造的全新AIGC应用。此前,做跨境业务的企业在开展业务时,经常会要拍摄具有当地特色的营销视频,经常遇到外籍演员选择有限、国外取景拍摄沟通执行不便等问题,由此产生制作成本高、时效低的痛点。而万兴播爆产品中内置不同肤色和人种的超逼真数字人,支持大部分语音,用户只需要几分钟时间就可以快速生成一条营销视频。
从行业来看,过去一年,已有不少企业开始转变思路,致力于将大模型应用于具体场景。海外,OpenAI打造了类似Apple Store的GPT Store,试图通过AI应用商店的形式让大模型能惠及更多普通人,微软在浏览器、办公套件等产品中推出Coplilot。
国内,百度推出「文心千帆」向客户提供企业级大语言模型服务,百度董事长李彦宏在「2023中关村论坛」上演讲时表示,未来所有的应用都将基于大模型来开发,每一个行业都会拥有属于自己的大模型,大模型会深度融合到实体经济当中去。
垂直大模型先锋,「天幕」开启音视频创意行业新篇
经过2023年一整年的发展,大模型正加速从实验室迈向市场。市场预计,2024年将是大模型场景应用元年。
市场风向变换不断,而万兴科技一个很大的特点是,不跟风。在大模型最火热的时候,万兴并没有急着入局,而是聚焦数字创意主业,专注AI技术对应用的改造和落地。当大模型由1.0图文时代进化到以音视频为载体的2.0时代,进入到万兴科技的专业领域时,公司反而躬身入局大模型领域,推出国内首个音视频多媒体大模型万兴「天幕」。
万兴科技推出「天幕」有着自己的考量。
从文本的角度来看,大模型的发展已经比较成熟了,但音视频大模型在技术层面由于数据、算力等多方面原因,导致产品数量较少,效果也没有大家期待的那么完美。
OpenAI在发布大模型之时就提出了多模态,但此前很长一段时间内,行业内的视频生成效果都很难满足业界的需求。即便是Pika labs这种火热的产品,也存在明显的拖影、模糊等问题,质量不理想。
有专业人士做过总结,视频生成目前存在三大挑战:
第一,数据集欠缺,视频内容存储和标注成本高昂,视频相关的训练数据集目前仍较欠缺;
第二,算力成本高昂,视频训练所需的算力远高于图片、文字等其它内容;
第三是生成效果不佳,目前仍缺乏效果可用性较好的模型作为标杆。
既然市面上没有趁手的音视频大模型可用,那就自己做吧。
「天幕」定位为音视频多媒体创作垂类大模型,由视频大模型、音频大模型、图片大模型、语言大模型组成,与基于视觉数据的底层通用模型Sora有着较大的差异。
Sora的核心能力为文生视频,「天幕」则是基于15亿用户行为及100亿本土化高质量音视频数据沉淀,除文生视频外,当前已迭代视频生视频、文生音乐、数字人播报等近百项音视频原子能力,能够在泛知识、泛营销、泛娱乐等领域,助力创作者更好地进行创作表达。
客观评述,「天幕」只是打开了一扇窗,若要真正产出完美的AI视频,还有诸多障碍需要跨越。
首先,视频由很多能力和元素构成,包括动画、字幕、音乐、特效、美化、贴纸、转场、画中画,还有顶层资源、颗粒等,数据结构非常复杂。
其次,视频制作的链路很长,技术门槛也比较高,在构思阶段,可能需要GPT或者文心一言这样的通用大模型,做内容源时需要本地拍摄,需要获得资源方便加工,需要第三方工具进行效果生成,还需要算力、做编解码。
最后,从大模型本土化要求算力、数据和应用都要本土化,特别是应用层面,需要算力的本土化,需要数据的本土化,才能研发出更本土化的应用。
解决技术难点的方法无非两个方面,向内,通过增加研发投入来提升技术实力,向外,组建自己的生态「朋友圈」,实现强强联合。
根据2023年年报,万兴科技在AIGC技术研发和产品升级上进行了大手笔投入,全年研发投入达到4.03亿元,以支撑万兴「天幕」大模型研发、WES5.0开发、Wondershare Filmora V13桌面端及移动端开发、万兴播爆2.0等。
同时,万兴科技在行业合作上保持开放合作的姿态,合作伙伴囊括众多海内外知名企业,一方面,引入OpenAI等外部大模型能力,另一方面,与微软、华为、湘江实验室等海内外企业及科研机构开展合作,此外,科大讯飞、英特尔,也都在万兴科技生态「朋友圈」中。
不难看出,万兴科技已经搭建起了一个以「天幕」为中心的多媒体大模型应用生态架构,聚合了一个兼顾了「快」与「远」的生态,既能助力「天幕」的升级迭代,又为公司业务发展提供动力。
大模型价值先锋,步至AI价值螺旋
知名调研机构Gartner曾在【2021年预测:人工智能对人类和社会的影响】的研究中预测,2021年AIGC生成数据占全球数据的比例不足1%,2025年该比例有望增至10%。
这也意味着,在大模型与AIGC汇聚而成的时代浪潮下,万兴科技还有巨大的增长空间。
事实上,此前国金证券在【三次AI逻辑拐点验证,志在「中国Adobe」】的研报中也表达出,万兴科技在本轮AI浪潮中已经经历了三次自身的AI逻辑拐点,「量价齐升」逻辑已得到业绩层面确证。
上文提到的Filmora版本大更新,万兴提供了Filmora三端打通的会员模式,公司将Filmora 订阅费用由49.9 美元提至69.9美元,由于AI能力集成,降低C端用户对视频创意软件进入门槛的同时,提升了使用体验,用户好评不断。
从财报来看,2023年万兴科技多条业务线增收显著,其中核心业务线视频创意营收达9.61亿,占总收入比重增至65%,视频创意产品因AI的加持,在进行业绩兑现。
以上为万兴科技的第一波AI逻辑拐点。
第二波AI逻辑拐点,则在于大模型研发训练成本的下降。
从行业的大趋势来看,在芯片硬件厂商的推动下,GPU性能不断提升将带来大模型厂商训练/推理成本的下降,大模型厂商对模型结构与算法的持续改进,也将带来训练/推理成本的改善。
除此之外,云计算头部厂商跑马圈地阶段的让利定价,也将推动以OpenAI为代表的大模型厂商的模型调用成本降低。
最后,万兴科技的第三波AI逻辑拐点来自于大模型价值的逐步显现。
根据万兴科技在不久前结束的「中国生成式AI大会」上公布的信息显示,目前「天幕」已涵盖文生视频、视频生视频等原子能力,相关能力已在万兴科技旗下产品规模化商用。其中文生视频能力上,已实现不同风格、丰富场景及主题的连贯性,且一键生成时长支持60秒+。未来,「天幕」还有近百项音视频原子能力将全面集成到公司矩阵产品中落地应用。
(万兴「天幕」文生视频【男孩的探险之行】)
尽管目前行业成熟尚需时日,众多新兴技术仍处于研发和优化阶段,未形成规模效应,但未来的时代必然是AI的大时代,作为未来10-20年最重要新质生产力之一,AI技术发展大势已然明确。研究数据显示,全球AIGC市场规模预计在2032年达到1.3万亿美元。
AI浪潮正以不可阻挡之势奔涌向前,以万兴科技为代表的AIGC先锋者,正在通过新业态、新模式、新产品,在AIGC时代的新一轮竞争中抢占先机,用更智能高效的AI应用赋能全球创作者,打造一个更有创意的世界。