2024世界人工智能大会｜「百模大战」如何突围？这两家上海AI企业有自己的思考

2024-06-21辟谣

图说：星环科技大厅展示的数据+AI基础设施产品魔方新民晚报记者陶磊摄（下同）

7月初，2024世界人工智能大会又将如约在上海拉开大幕。不用说，今年的关键词一定是「大模型」。据介绍，目前全市已有34款大模型通过备案，产生了制造业、金融、具身智能机器人等垂类领域应用。

20日，记者跟随大会主办方走进两家人工智能头部企业，一探大模型的行业现状。

把大模型训练成「理科生」

星环科技致力于打造企业级大数据与人工智能基础软件，围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件产品，构建明日数据世界。「大模型相关技术已融入企业生产经营的方方面面。」星环科技创始人、CEO孙元浩指出，「大模型主要优势是提供了自然语言理解能力，还有简单的推理能力，并能在个人指导下调动工具。」

孙元浩说，目前来看，大模型落地过程中遇到了很多挑战，今年以来大家开始理性看待大模型具体能带来什么，「在大模型落地过程中，逐渐显现出一些难点，如技术执行、实施成本、相关技术人才的缺乏、生成式人工智能的治理、数据可用性等等。」

图说：工作人员演示星环科技大模型产品

立足于大数据基础软件优势，星环科技是国内第一批推出自研大模型的软件信息公司。早在2023年5月，公司就推出了业界首创的金融大模型「无涯」，以及大数据分析大模型SoLar「求索」。在孙元浩看来，当下众多AI大模型更像「文科生」，而星环科技的目标是将大模型训练成「理科生」，能够进行数学分析，懂得自然科学的各个学科，从而解决企业运营过程中的实际问题。

就在不久前，星环科技推出了「问知」AIPC版，它支持多格式、不限长度的文件资料入库，还支持影、音、图、文等多模态数据的「知识化」处理，以及「语义化」查询和应用能力。值得关注的是，这是一款为个人用户设计的大模型应用产品，可以在配备Intel新一代CPU的主流个人电脑上，基于集成显卡和NPU流畅运行。

「模型的建构和人的发展有诸多相似之处。一个人很难熟知所有科学知识，这就需要不同领域的专家，专业模型亦是如此。」孙元浩告诉记者，「星环科技通过收窄模型的应用领域，训练出不同垂类的专业模型，然后将这些专业模型组合成大模型。这在保证模型专业度的同时，大大降低了模型的训练代价和推理代价。」

坚信Scaling Law 选择「厚积薄发」

阶跃星辰是一家通用大模型创业公司，自成立起在算力、系统、数据和算法这四大要素上综合布局，已对外发布Step系列大模型；同时，通过自有产品和合作产品两种方式探索C端应用，已推出的产品包括个人效率助手「跃问」和 AI 开放世界平台「冒泡鸭」。

图说：阶跃星辰展厅展示的文生广告图

「GPT-4有万亿参数，而人脑的神经元连接是200万亿。」阶跃星辰系统负责人朱亦博博士打比方说，这家坐落于徐汇西岸智塔的初创公司信仰Scaling Law（规模法则），认为在肉眼可见的未来，至少还有十万亿和百万亿两个数量级的大模型。面对喧嚣的「百模大战」，阶跃星辰选择了「厚积薄发」，朱亦博说，攀登Scaling Law的巅峰，毕竟是一个包含算力、系统、数据和算法的「铁人四项」超级工程。

低调了近一年，阶跃星辰在今年三月「初露锋芒」——发布Step系列大模型，包含了Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型，以及Step-2万亿参数MoE（混合专家架构）语言大模型预览版。「Step-1V一经发布便登上了权威大模型评测平台‘司南’的多模态大模型3月榜榜首。」朱亦博介绍，「Step-1V的多模理解能力突出，可以精准描述和理解图像中的文字、数据、图表等信息，并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。」

阶跃星辰的研发团队觉得，通用大模型未来还能走得更远，「模型要大，多模态理解和生成的统一是通往AGI的必经之路。」作为一家初创公司，阶跃星辰也很务实，会大方地承认「还在追赶GPT-4」。「OpenAI发布的模型在不断迭代，我们现在的模型也还在打磨。希望不久的将来，能有对标GPT-4的水平。」朱亦博坦言。

图说：阶跃星辰工作人员介绍AI智能助手「跃问」

朱亦博告诉记者，如果大语言模型要上万亿参数，MoE架构可以说是最优解，「MoE是在性能、参数量、训练成本、推理成本这些维度权衡下的最佳选择。」

值得一提的是，阶跃星辰Step系列通用大模型凭借其技术创新和广泛的落地应用，已经成功入选2024世界人工智能大会SAIL奖30强榜单。阶跃星辰基于Step系列大模型推出了一款个人效率助手「跃问」，在本届世界人工智能大会上也会带来最新的产品功能体验。

新民晚报记者郜阳

2024世界人工智能大会 ｜ 「百模大战」如何突围？这两家上海AI企业有自己的思考