【创新发展】大模型发展“下一站”:全场景生态构建
2025年09月16日 来源:科技日报 作者:记者 都 芃
2025上海世界移动通信大会上的大模型展台。视觉中国供图
随着人工智能技术迅猛迭代,大模型已成为驱动经济社会发展的关键引擎。在单一模型技术不断突破、参数纪录屡屡刷新的同时,各家大模型厂商不约而同将目光投向大模型服务链建设,着重构建全场景生态。
国务院不久前印发的《关于深入实施“人工智能+”行动的意见》提出,发展“模型即服务”“智能体即服务”等,打造人工智能应用服务链。面对千行百业智能化转型需求,全链条覆盖的服务能力、优秀的全场景生态构建能力,已成为大模型产业下一阶段发展的重点。
加强软硬件协同
对如今的大模型行业来说,“周周有发布,天天有更新”已成为常态。
9月9日,百度正式发布文心大模型X1.1。它采用迭代式混合强化学习训练框架,通过混合强化学习,协同提升通用任务和智能体任务的效果;同时,通过自蒸馏数据的迭代式生产及训练,不断提升模型整体效果。尤其在更复杂的长程任务场景中,模型表现突出。
同样在9月,阿里巴巴旗下通义千问也推出了其最新模型,在中英文理解、复杂指令遵循、工具调用等维度实现性能增强,同时显著减少了知识幻觉。
在追求性能指标不断提升的同时,大模型产业也正走向以配套工具开发、应用场景适配、产业落地为核心的全场景生态能力建设阶段。
大模型生态是一个涵盖底层技术研发、模型训练与优化,以及应用开发、产业落地、人才培养等多个环节的复杂系统。完善的大模型生态能促进技术快速迭代创新,加速人工智能在各个领域的普及应用。
中国工程院院士郑纬民此前曾谈到国产AI芯片的生态问题。他直言,当下国产AI芯片的适配生态不够好,如果生态足够好,哪怕只有60%的性能也会有更多用户使用。
同样的问题也出现在大模型领域。随着人工智能技术快速迭代,仅靠算力堆叠已无法实现模型性能的同步线性提升。模型算法与底层硬件、软件、开发框架间的协同效果显著影响其训推效率与性能表现,人工智能软硬件生态协同的重要性更加凸显。
中国信息通信研究院人工智能研究所软硬件与创新生态部主任李论认为,大模型的升级迭代需要在庞大的软硬件系统上进行实验,模型的原始创新和应用迭代落地已非常依赖先进的软硬件协同技术生态体系,框架、芯片、集群、网络等与算法间的协同愈发紧密。
从全球范围看,一些国内外头部企业正在纷纷加快推进更大规模集群的软硬件协同优化。例如,百度自2010年布局人工智能,先后发布我国第一个开源深度学习框架“飞桨”、人工智能芯片昆仑芯,以及文心大模型等一系列人工智能软硬件技术产品,构建起覆盖芯片、框架、模型、应用的完整技术生态。
“我们预计,在下个阶段,软硬件协同和生态体系的构建会是全球大模型创新和算力设施建设的竞争焦点。”李论说。
完善配套工具研发
大模型生态并非“为建而建”,有效降低技术门槛、推动大模型应用广泛落地是关键目标。
一个成熟的大模型产品落地,从训练调优到部署应用,背后是一系列工程环节的紧密协作。当前,阻碍AI应用开发落地的一大瓶颈是大模型训练、部署成本高。这很大程度是模型配套的上下游工具链不健全导致的。
百度AI技术生态总经理马艳军举例说,在大模型的大规模分布式训练中,静默数据损坏是一类一般由硬件设备引发的极具隐蔽性和破坏性的故障。它一旦出现,容易造成训练效果严重劣化甚至失效,难以追溯原因,往往需要停机进行长时间压测才能识别,检测成本极高。针对这类问题,团队自主研发的“飞桨”核心框架v3.2利用流水线并行训练中固有的“空泡期”,在硬件设备空闲间隙,在线、无损插入运行精度检测代码,无需停机即可精准定位故障硬件,从而在不影响训练的前提下,极大提升超大规模训练的长期稳定性与可靠性。
在部署端,大模型的高性能推理效率和成本是业界长期关注的问题。马艳军介绍,团队基于“飞桨”研发的大模型高效部署套件FastDeploy2.2版本,可以提供大模型高效部署及高性能推理全栈能力。这一套件不仅可以服务于文心大模型,还可以兼容多种协议、格式,高效运行文心系列及其他主流开源大模型。
不仅是百度,华为、阿里巴巴等企业也在不断完善大模型配套工具研发,降低大模型开发应用门槛。如华为面向昇腾AI开发者提供的全流程开发工具链MindStudio,可为开发者提供端到端的昇腾AI应用开发解决方案,使开发者高效完成训练开发、推理开发和算子开发。
扩大生态“朋友圈”
好用的工具带来的是应用百花齐放,而更多应用方的加入也会让大模型生态更加丰富多元。
中国中车集团有限公司科技质量与信息化部数字化创新处副处长陈鉴分享了人工智能技术在中国高铁气动外形设计上的应用案例。
传统的气动评估方法采用精细建模和高精度模型,计算周期长、使用门槛高、资源消耗大。中国中车集团有限公司以既有的仿真和实验数据为基础,构建高速动车组的气动载荷标准数据库,并基于文心大模型和“飞桨”的科学计算能力,构建起空气动力学仿真大模型。“一个外形设计想法,过去可能需要做大量实验,几个月才能有答案。现在借助人工智能仿真计算,最快几分钟就可以得到结果,并且准确率很高。”陈鉴说,这一技术应用大大加速了气动外形设计迭代,显著提高研发效率。
不仅如此,该公司还与百度飞桨联手打造出国内首个虚拟传感器模型。该模型可在不增加既有传感器的基础上,根据车辆已有的电流电压等现成数据,通过一系列计算,推算出与车辆安全运行相关的其他数据。这仿佛给车辆安装上多个虚拟传感器,可以更早发现故障隐患,对车辆进行更为精细的健康管理,使故障检测准确率在现有传感器检测的基础上再提升10%。
人才是支撑大模型生态建设的重要基础。目前,百度已联合湖北省12所高校共同成立百度飞桨(湖北)人工智能教育创新中心,湖北省22所高校基于飞桨与文心开设学分课程。同时,百度飞桨作为副理事长单位参与湖北人工智能学院建设。
多位受访专家认为,随着底层技术不断优化、配套工具日益丰富、应用场景加速落地,大模型产业将加快从“单点突破”式技术迭代走向“多点开花”式生态构建。