欢迎访问科大卓越官网!

顾维玺:类ChatGPT推动中国新型工业化发展

近来,随着ChatGPT的横空出世,人工智能生成内容以超出人们预期的速度成为集群式和聚变式科技革命中的重大里程碑,迅速催生了全新科技革命的系统、格局和生态,成为变革人类知识生产模式,推动社会、经济发展演进的又一强大驱动力。


8503869a3e586ab6f9b46dfee396f64a.png

ChatGPT突破了AI效仿式学习的传统范式,成为了具有强创造力和理解力的生成式模型的代表。类ChatGPT特指和ChatGPT类似、在大模型基础上进行技术微调与闭环反馈的面向不同领域的生成式AI模型。例如谷歌 Bard、百度“文心一言”、DALLE2等。类ChatGPT的业务能力将不单单聚焦在机器问答,也可拓展到语言、图片、视频、语音、代码、决策等各业务领域。随着“5G+工业互联网”在工厂中的渗透,面向工业逻辑的类ChatGPT或将改变传统的垂直业务系统,催生出以大模型为基础,轻量化微调的MaaS(Model as a Service)化服务,优化传统工业互联网赋能方式,促进工业智能化变革。


不难想象,在不远的将来,基于垂直领域的AI模型将会被基于大模型底座的类ChatGPT逐步取代。高度的泛化能力和合理的机器生成能力不仅提高了人类生活的便捷度,也必将通过工业互联网等渗透到研发设计、生产制造、运营管理、产品服务、人员培训等工业全过程,推动我国新型工业化进程。


MaaS变革工业互联网服务模式


传统的人工智能模型通常需要依靠个性化的业务逻辑进行数据采集、模型训练与调优,极大消耗了计算、人力与数据资源,但完成后无法在多行业通用。例如,用在工业视觉的缺陷检测视觉模型无法用在自动驾驶中检测视觉障碍物、红绿灯和车道线,因为自动驾驶相比工业视觉检测在关注精度的同时也关注毫秒级计算时延需求。大模型的出现很好地解决了这个问题。大模型不仅可以在不同行业复用,而且能够通过积累的经验持续迭代从而实现性能升级,很大程度解决了传统模型或服务不能很好实现跨模态跨领域应用的问题。


MaaS在多种场景下直接为用户终端提供高质量大模型服务,为工业互联网发展提供了新思路。即预训练大模型将成为工业互联网PaaS不可或缺的基础性底座,为上层应用提供封装性更好的MaaS服务。基于大模型的MaaS具备高泛化能力和高通用性,企业可以通过直接调度相关的API,基于少量的业务场景数据进行加工训练,从而降低企业的开发和应用成本,实现更加轻量化的部署与在线化的优化升级,为企业提供源源不断的智能服务,加速工业4.0进程,推动我国新型工业化发展。


具体有如下应用:一是在研发设计方面,基于类ChatGPT强大的语言理解能力和图像生成能力,在研发设计流程调用模型微服务,可帮助研发人员精准挖掘并梳理有效的基础知识、生成面向具体应用的基础代码或者进行三维可视化设计,建立智能工业知识库。例如:汽车外形的研发设计可以直接通过类ChatGPT生成并给出对应的设计说明及优缺点,辅助设计师创新;二是在生产制造方面,类ChatGPT能在生产制造流程中帮助工人精准设定设备的工艺参数,提供有效的精细化操作指引,在突发故障时提供快速诊断和应急解决方案建议。例如:针对复杂的仪器设备和多流程的工艺环节,类ChatGPT可以根据工艺要求自动生成各环节工艺参数,并在数字孪生系统进行仿真给出输出报告供人类选择;三是在运营管理方面,类ChatGPT通过对ERP、WMS、PLM、CRM、SRM等系统的运营数据与模型代码的理解学习,可以进行语音问答,生成图表报告,同时也能与图像识别处理系统、故障诊断系统、时间序列分析系统融合,通过深层次、多维度的数据分析,优化运营管理与决策。例如:类ChatGPT可以直接生成Excel并进行数据分析,供管理人员了解整个工厂的运营情况、提供最终决策;四是在产品服务方面,类ChatGPT技术发展使得人力成本得以释放,提高响应效率并创新产品服务形式,既可以通过智能客服的形式协助人工进行会话、业务处理、操作讲解,也可实现社媒推广、智能面试等创新服务。例如:类ChatGPT可以充当社交媒体KOL(Key Opinion Leader),为抖音、微博、微信公众号等各种平台创建内容并与关注者互动,以推广产品或服务,增强产品影响力;五是在人员培训方面,作为基于自然语言处理技术的人工智能模型,类ChatGPT可以被视为一个规模庞大、拥有专业知识体系的数据库,通过与员工的交互来输出知识,可以在工业领域的人员培训中发挥多种应用,实现智能培训。例如:类ChatGPT模拟如应急事件、安全事故等各种突发场景,让员工在模拟实践中学习应对突发情况的方法和技能。综上,基于MaaS的通用人工智能解决方案可以为工业应用的全链路流程提供层出不穷的解决方案。


基于MaaS的工业互联网面临挑战


一是大模型基础底座建设难。大模型集大算力、大算法、大数据为一体,在训练时依赖海量的数据、计算资源与云化储存,成本极为高昂。据了解,ChatGPT使用了约3万个英伟达A100显卡。而A100及其以上的高性能显卡目前美国已对我国全面禁售,没有与之匹配的国产芯片。考虑到高性能算力的存量差距,我国在短时间内难以建立起来性能与ChatGPT相仿的大模型基础底座。


二是工业大数据获取难。不同于自然语言处理,工业数据具有私密性高、有价值信息提取难、有效标注少等问题。例如,工业设备异常值检测是非常重要的应用,然而,异常情况极