(CWW)ChatGPT一经推出得到广泛关 注,成为2023年度世界级热词,其影 响力甚至超过1997年的IBM沃森智力 竞赛和2016年的谷歌AlphaGo围棋 竞赛,成为人工智能发展史上的重要 节点。类ChatGPT大模型(以下简称 “大模型”)是指基于大模型底座的人 工智能驱动处理工具,不仅开启了知 识内容生产新时代,更打破了垂直类 业务模型的局限性,将成为面向公共 服务的新型基础设施。目前,全世界范 围内已掀起研制开发大模型的浪潮, 谷歌、微软、英伟达等龙头企业应时而 动,抓住科技机遇并抢占全球产业发 展先机。
(资料图片仅供参考)
相比传统AI模型,大模型 具有的优势
大模型相比基于垂直领域的AI模 型主要有以下两点优势。 一方面是大模型更具智慧性,将传 统数据的被动输入获得结果改变为主 动输出创新成果。一是自处理后闭环优 化。无论是ChatGPT还是其他大模型, 其基本技术思路都是先预训练大模型 再进行后期闭环优化微调。在预训练大 模型的基础上,使用数百亿条文本数据 对特定模型进行微调式训练,使其能够 自动进行语言理解、问答、翻译、决策 等多种任务处理,并且通过交互与反馈 不断进行闭环优化。二是自感知后创新学习。突破传统AI模仿式学习范式,大 模型能够主动感知理解语言、事物,围 绕庞大的数据特征,依托海量模型压缩 算法,实现多维度逻辑交互,形成概率 最大、最有可能发生的结果。三是自适 配后场景复用。传统模型通常需要依靠 确定性业务逻辑进行数据采集、模型训 练与调优,不仅消耗算力而且无法在更 多行业复用。而大模型不仅可以在不同 行业复用,而且能够通过积累的经验持 续迭代从而实现性能升级。 另一方面,推动AI应用扁平化,降 低人工智能部署门槛,构建应用新范 式。一是推动AI研发范式标准化。通过 “零样本”或小样本微调,大模型可以在多种任务上实现较好效果,具有很强 的泛化能力。大模型训练实现上下游分 工、流水线协同,形成“预训练+微调” 新范式,带来了新的标准化AI研发逻 辑,实现AI模型在更统一、更简单的方 式下规模化生产,增强了人工智能在不 同业务场景的性能。二是降低AI应用开 发门槛。大模型的通用性、泛化性和“预 训练+微调”等新开发范式,让AI场景 应用的模型定制流程更标准化,效果优 化更简单,有效降低了对数据标注、算 法调优的能力要求,使AI应用研发更便 捷。三是促进AI应用产业化。围绕大模 型基础共性平台,研发人员可以通过调 用API,高效地布局AI开发MaaS微服 务,加速人工智能产业化进程,极大降 低AI开发门槛,让更多企业或开发者能 够低成本、高效率地获得AI能力。
大模型对工业互联网的 推进作用
工业互联网围绕全产业链、全价值 链、全要素的全面链接,构建新一代信 息技术赋能制造业的新生态,强调海量 生产要素的互联互通、运行数据的价值 挖掘和工业知识的沉淀复用,这为大模 型的应用提供了“天然土壤”。
具有大算力、大算法和大数据特 征的大模型,可在3个方面进一步优化 工业互联网。一是优化全生产流程。数 以亿计的基础算法、高度的泛化能力和 合理的机器生成能力不仅可以提高消 费互联场景中消费者的体验,还可以通 过工业互联网渗透到研发设计、生产制 造、运营管理、产品服务、人员培训等 工业全过程,从而促进工业互联网向行 业渗透。例如在生产制造方面,大模型 能在生产制造流程中帮助工人精准设 定设备的工艺参数,提供有效的精细化 操作指引,在突发故障时提供快速诊断 能力和应急解决方案。
二是变革传统工业逻辑。大模型 可拓展应用于工业领域中语音转换、图 像识别、智能决策等环节,工业互联网 网络、平台、数据、标识、安全等体系的 构建,将改变传统的垂直业务系统,催 生植根在平台上的以大模型为基础、轻 量化的MaaS层服务,优化工业互联网 赋能方式,促进工业智能化变革。例如 大模型可直接对ERP、WMS、PLM、 CRM、SRM等业务系统的运营数据与 模型代码进行理解学习,可跨域平台层, 主动生成图表报告,指导图像识别处理 系统、故障诊断系统、时间序列分析系 统融合,优化运营管理与决策流程。
三是推动解决方案复用。大模型的 出现很大程度上解决了传统模型/服务 不能很好实现跨模态、跨领域应用的问 题。植根在工业互联网平台上的MaaS 层可在多种场景下直接为用户终端提 供高质量大模型服务,企业可以通过调 度相关的API,并基于特定解决方案的 业务场景对数据进行加工训练,从而降 低企业的开发和应用成本,实现企业个 性化应用业务的部署、优化和升级。大 模型可提升语言理解能力和图像生成 能力,在研发设计流程中调用模型微服 务,帮助研发人员精准挖掘并梳理有效 的基础知识,生成面向具体应用的基础 代码或者进行三维可视化设计,以及建 立智能工业知识库等。
我国工业互联网大模型 发展的下一步建议
目前,我国积极推动大模型产业发 展,华为、百度、腾讯等互联网巨头均推 出相关产品,商汤、科大讯飞等领先企 业也在持续深化布局。值得一提的是, 我国大模型产业仍然面临基础底座建 设难、智算中心水平低、数据采集能力 差和模型交互能力弱等多方面挑战,未 来应在以下4个方面开展相应工作。
一是加强顶层设计。制定推动大 模型产业创新发展的相关政策,规范新 型基础设施建设标准,出台相关产业的 税收优惠政策,鼓励大模型相关企业赋 能制造业,优化工业互联网现有体系架 构,强化MaaS层功能部署和应用,推 动先行先试,打造“工业互联网+大模 型”示范应用,推广大模型赋能工业互 联网优秀解决方案。
二是优化资源供给。依托国家财 政,建设国家级工业模型库,构建统一 调度管理的智算中心体系,筑牢基础大 模型底座;依托地方投资、投资基金等 渠道,打造工业机理模型资源池,培育 大模型技术创新企业。用好工业互联网 大数据中心、国家超级计算中心等公共 基础资源,鼓励企业的关键设备和核心 业务系统上云上平台、推进工业数据采 集和分级分类管理。
三是开展技术攻关。高性能、低成 本的算力是AI大模型技术创新和产业 化的关键资源。聚焦高端GPU芯片、仿 真软件等核心环节,重点突破集成电 路、工业软件等“卡脖子”问题,推广云 计算的大规模集群统一调度技术,推广 “一云多芯”的公共云服务,支持兼容 ARM、x86等实现混合部署,发挥大规 模集群算力优势与集约化成本优势。
四是构建产业生态。发挥市场主 体作用,鼓励行业龙头企业和技术领先 企业加强技术投入,研制新型大模型产 品,充分参与国际竞争;孵化基于大模 型创新的技术型企业,构建大模型开源 生态,推动“政产学研用金”协同合作, 引导更多企业应用大模型,享受大模型 带来的便利;建立多元化的人才培养体 系,培养大模型领域与制造业领域的复 合型领军人才。
关键词: