顾维玺：类ChatGPT推动中国新型工业化发展

近来，随着ChatGPT的横空出世，人工智能生成内容以超出人们预期的速度成为集群式和聚变式科技革命中的重大里程碑，迅速催生了全新科技革命的系统、格局和生态，成为变革人类知识生产模式，推动社会、经济发展演进的又一强大驱动力。

ChatGPT突破了AI效仿式学习的传统范式，成为了具有强创造力和理解力的生成式模型的代表。类ChatGPT特指和ChatGPT类似、在大模型基础上进行技术微调与闭环反馈的面向不同领域的生成式AI模型。例如谷歌 Bard、百度“文心一言”、DALLE2等。类ChatGPT的业务能力将不单单聚焦在机器问答，也可拓展到语言、图片、视频、语音、代码、决策等各业务领域。随着“5G+工业互联网”在工厂中的渗透，面向工业逻辑的类ChatGPT或将改变传统的垂直业务系统，催生出以大模型为基础，轻量化微调的MaaS（Model as a Service）化服务，优化传统工业互联网赋能方式，促进工业智能化变革。

不难想象，在不远的将来，基于垂直领域的AI模型将会被基于大模型底座的类ChatGPT逐步取代。高度的泛化能力和合理的机器生成能力不仅提高了人类生活的便捷度，也必将通过工业互联网等渗透到研发设计、生产制造、运营管理、产品服务、人员培训等工业全过程，推动我国新型工业化进程。

MaaS变革工业互联网服务模式

传统的人工智能模型通常需要依靠个性化的业务逻辑进行数据采集、模型训练与调优，极大消耗了计算、人力与数据资源，但完成后无法在多行业通用。例如，用在工业视觉的缺陷检测视觉模型无法用在自动驾驶中检测视觉障碍物、红绿灯和车道线，因为自动驾驶相比工业视觉检测在关注精度的同时也关注毫秒级计算时延需求。大模型的出现很好地解决了这个问题。大模型不仅可以在不同行业复用，而且能够通过积累的经验持续迭代从而实现性能升级，很大程度解决了传统模型或服务不能很好实现跨模态跨领域应用的问题。

MaaS在多种场景下直接为用户终端提供高质量大模型服务，为工业互联网发展提供了新思路。即预训练大模型将成为工业互联网PaaS不可或缺的基础性底座，为上层应用提供封装性更好的MaaS服务。基于大模型的MaaS具备高泛化能力和高通用性，企业可以通过直接调度相关的API，基于少量的业务场景数据进行加工训练，从而降低企业的开发和应用成本，实现更加轻量化的部署与在线化的优化升级，为企业提供源源不断的智能服务，加速工业4.0进程，推动我国新型工业化发展。

具体有如下应用：一是在研发设计方面，基于类ChatGPT强大的语言理解能力和图像生成能力，在研发设计流程调用模型微服务，可帮助研发人员精准挖掘并梳理有效的基础知识、生成面向具体应用的基础代码或者进行三维可视化设计，建立智能工业知识库。例如：汽车外形的研发设计可以直接通过类ChatGPT生成并给出对应的设计说明及优缺点，辅助设计师创新；二是在生产制造方面，类ChatGPT能在生产制造流程中帮助工人精准设定设备的工艺参数，提供有效的精细化操作指引，在突发故障时提供快速诊断和应急解决方案建议。例如：针对复杂的仪器设备和多流程的工艺环节，类ChatGPT可以根据工艺要求自动生成各环节工艺参数，并在数字孪生系统进行仿真给出输出报告供人类选择；三是在运营管理方面，类ChatGPT通过对ERP、WMS、PLM、CRM、SRM等系统的运营数据与模型代码的理解学习，可以进行语音问答，生成图表报告，同时也能与图像识别处理系统、故障诊断系统、时间序列分析系统融合，通过深层次、多维度的数据分析，优化运营管理与决策。例如：类ChatGPT可以直接生成Excel并进行数据分析，供管理人员了解整个工厂的运营情况、提供最终决策；四是在产品服务方面，类ChatGPT技术发展使得人力成本得以释放，提高响应效率并创新产品服务形式，既可以通过智能客服的形式协助人工进行会话、业务处理、操作讲解，也可实现社媒推广、智能面试等创新服务。例如：类ChatGPT可以充当社交媒体KOL（Key Opinion Leader)，为抖音、微博、微信公众号等各种平台创建内容并与关注者互动，以推广产品或服务，增强产品影响力；五是在人员培训方面，作为基于自然语言处理技术的人工智能模型，类ChatGPT可以被视为一个规模庞大、拥有专业知识体系的数据库，通过与员工的交互来输出知识，可以在工业领域的人员培训中发挥多种应用，实现智能培训。例如：类ChatGPT模拟如应急事件、安全事故等各种突发场景，让员工在模拟实践中学习应对突发情况的方法和技能。综上，基于MaaS的通用人工智能解决方案可以为工业应用的全链路流程提供层出不穷的解决方案。

基于MaaS的工业互联网面临挑战

一是大模型基础底座建设难。大模型集大算力、大算法、大数据为一体，在训练时依赖海量的数据、计算资源与云化储存，成本极为高昂。据了解，ChatGPT使用了约3万个英伟达A100显卡。而A100及其以上的高性能显卡目前美国已对我国全面禁售，没有与之匹配的国产芯片。考虑到高性能算力的存量差距，我国在短时间内难以建立起来性能与ChatGPT相仿的大模型基础底座。

二是工业大数据获取难。不同于自然语言处理，工业数据具有私密性高、有价值信息提取难、有效标注少等问题。例如，工业设备异常值检测是非常重要的应用，然而，异常情况极少发生，所以异常数据很难采集，但却要求模型对这种故障有着高度的敏感能力。在这种情况下，是否能够建立一个高效的跨多个工业场景的多模态语料知识库，实现数据（特别是异常数据）的不断优化、更新，模型的持续调优、训练，是大模型能否被迁移到工业场景的关键。

三是工业模型解释难(可解释性差）。不同于问答系统，工业过程交互环节多、业务复杂性高、容错率极低，对每一步大模型的阶段性结果要求具有可解释性。然而，现在主流的大模型通常存在着“大力出奇迹”的逻辑，用上千亿的参数黑盒模拟交互过程，导致其理论解释性往往比较差，与工业的准确严谨过程预测决策之间存在较大矛盾，更不用提基于大模型的二次微服务效果。

面向工业场景的大模型发展建议

一是做好顶层规划，建设国家级工业数据库与基础大模型底座。大模型的发展迫在眉睫，是中美两国在人工智能乃至工业智能化推进过程中的关键节点。若再次发展滞后，其后果可能不亚于集成电路、工业软件等“卡脖子”问题，导致大模型底层技术完全被美国控制。建议充分发挥举国体制，由国家发改委、科技部、工业和信息化部等国家主管部委牵头，由相关企事业单位展开联合攻关。在工业数据要素汇聚、人工智能基础软硬件、产业化应用方面做好充分的政策、资源、标准协同，同时在资金、税收等方面给予充分支持，分批分类的建设国家级工业数据库及实施基础大模型研发试点示范。

二是做好包容创新，利用工业互联网推动“大模型+”的市场化发展。在大模型研发初期，往往会存在着一些违背伦理、违反常识与事实的情况，我们应当允许在研发过程乃至使用过程中的创新性失误，给研发人员充分的理解和尊重，并建立错误反馈修改机制。充分发挥工业互联网的规模效应，率先在人工智能基因好的“双跨”工业互联网平台企业自研大模型并且部署MaaS化应用。基于我国广大的市场空间优势，引导AI模型研发供应商与制造类链主企业展开充分对接，利用链主企业在资金、数据以及供应链的优势，分批分类的针对重点工业开展“行业级大模型”的研发与应用推广。积极鼓励市场化资本积极在大模型应用领域进行布局，推动一批“专精特新”企业在各自领域打造“大模型+”的智能化创新性应用。

三是做好大模型开源生态，推动产学研用协同合作。利用工业互联网，面向重点行业研发开源平台，鼓励产学研用各界对模型进行迭代优化与使用，促进技术创新和成果转化，建立数据、训练、治理全套服务的大模型开源生态体系，使更多的企业可以受益于大模型的基础供给能力与个性化应用。促进学术界与工业界的交流，在模型原理、可解释性、参数优化等方面开展重点工作，确保模型的有效性，简化大模型的开发难度。同时，需要建立多元化的人才培养体系，培养大模型领域与制造业领域的复合型领军人才。

工业乃国之命脉。“大模型+”在工业领域的发展应用具有广阔前景和重要意义，在建设中国式现代化推进新型工业化的关键时期，既要打造自主可控的AI大模型底座，又要充分利用我国工业场景丰富的优势，在重点领域快速形成一批智能化的MaaS应用，与工业互联网相结合，共同推动我国新型工业化进程。

文/中国工业互联网研究院智能研究所副所长    顾维玺

文章原载于  中国信息界

阅读原文：https://mp.weixin.qq.com/s/rIsM2b45onhbQPFSMrXIkA

上一篇：区块链与数字化转型的关系下一篇：地方数据立法热良法善治促进数字经济蓬勃发展

精选推荐