当前位置: 华文天下 > 辟谣

2024世界人工智能大会 | 「百模大战」如何突围?这两家上海AI企业有自己的思考

2024-06-21辟谣

图说:星环科技大厅展示的数据+AI基础设施产品魔方 新民晚报记者 陶磊 摄(下同)

7月初,2024世界人工智能大会又将如约在上海拉开大幕。不用说,今年的关键词一定是「大模型」。据介绍,目前全市已有34款大模型通过备案,产生了制造业、金融、具身智能机器人等垂类领域应用。

20日,记者跟随大会主办方走进两家人工智能头部企业,一探大模型的行业现状。

把大模型训练成「理科生」

星环科技致力于打造企业级大数据与人工智能基础软件,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件产品,构建明日数据世界。「大模型相关技术已融入企业生产经营的方方面面。」星环科技创始人、CEO孙元浩指出,「大模型主要优势是提供了自然语言理解能力,还有简单的推理能力,并能在个人指导下调动工具。」

孙元浩说,目前来看,大模型落地过程中遇到了很多挑战,今年以来大家开始理性看待大模型具体能带来什么,「在大模型落地过程中,逐渐显现出一些难点,如技术执行、实施成本、相关技术人才的缺乏、生成式人工智能的治理、数据可用性等等。」

图说:工作人员演示星环科技大模型产品

立足于大数据基础软件优势,星环科技是国内第一批推出自研大模型的软件信息公司。早在2023年5月,公司就推出了业界首创的金融大模型「无涯」,以及大数据分析大模型SoLar「求索」。在孙元浩看来,当下众多AI大模型更像「文科生」,而星环科技的目标是将大模型训练成「理科生」,能够进行数学分析,懂得自然科学的各个学科,从而解决企业运营过程中的实际问题。

就在不久前,星环科技推出了「问知」AIPC版,它支持多格式、不限长度的文件资料入库,还支持影、音、图、文等多模态数据的「知识化」处理,以及「语义化」查询和应用能力。值得关注的是,这是一款为个人用户设计的大模型应用产品,可以在配备Intel新一代CPU的主流个人电脑上,基于集成显卡和NPU流畅运行。

「模型的建构和人的发展有诸多相似之处。一个人很难熟知所有科学知识,这就需要不同领域的专家,专业模型亦是如此。」孙元浩告诉记者,「星环科技通过收窄模型的应用领域,训练出不同垂类的专业模型,然后将这些专业模型组合成大模型。这在保证模型专业度的同时,大大降低了模型的训练代价和推理代价。」

坚信Scaling Law 选择「厚积薄发」

阶跃星辰是一家通用大模型创业公司,自成立起在算力、系统、数据和算法这四大要素上综合布局,已对外发布Step系列大模型;同时,通过自有产品和合作产品两种方式探索C端应用,已推出的产品包括个人效率助手「跃问」和 AI 开放世界平台「冒泡鸭」。

图说:阶跃星辰展厅展示的文生广告图

「GPT-4有万亿参数,而人脑的神经元连接是200万亿。」阶跃星辰系统负责人朱亦博博士打比方说,这家坐落于徐汇西岸智塔的初创公司信仰Scaling Law(规模法则),认为在肉眼可见的未来,至少还有十万亿和百万亿两个数量级的大模型。面对喧嚣的「百模大战」,阶跃星辰选择了「厚积薄发」,朱亦博说,攀登Scaling Law的巅峰,毕竟是一个包含算力、系统、数据和算法的「铁人四项」超级工程。

低调了近一年,阶跃星辰在今年三月「初露锋芒」——发布Step系列大模型,包含了Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE(混合专家架构)语言大模型预览版。「Step-1V一经发布便登上了权威大模型评测平台‘司南’的多模态大模型3月榜榜首。」朱亦博介绍,「Step-1V的多模理解能力突出,可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。」

阶跃星辰的研发团队觉得,通用大模型未来还能走得更远,「模型要大,多模态理解和生成的统一是通往AGI的必经之路。」作为一家初创公司,阶跃星辰也很务实,会大方地承认「还在追赶GPT-4」。「OpenAI发布的模型在不断迭代,我们现在的模型也还在打磨。希望不久的将来,能有对标GPT-4的水平。」朱亦博坦言。

图说:阶跃星辰工作人员介绍AI智能助手「跃问」

朱亦博告诉记者,如果大语言模型要上万亿参数,MoE架构可以说是最优解,「MoE是在性能、参数量、训练成本、推理成本这些维度权衡下的最佳选择。」

值得一提的是,阶跃星辰Step系列通用大模型凭借其技术创新和广泛的落地应用,已经成功入选2024世界人工智能大会SAIL奖30强榜单。阶跃星辰基于Step系列大模型推出了一款个人效率助手「跃问」,在本届世界人工智能大会上也会带来最新的产品功能体验。

新民晚报记者 郜阳