■ 马新淼
党的二十大报告指出,推动战略性新兴产业融合集群发展,构建人工智能等新一批的增长引擎,加快发展数字经济,促进数字经济和实体经济的深度融合,打造具有国际竞争力的数字产业集群。
人工智能是国家战略的重要组成部分,也是近期的热点话题,人工智能这个概念自20世纪50年代由西方提出以来,经历了不同的发展阶段,以ChatGPT大语言模型诞生为标志,加上短视频、up主、网络教学等自媒体铺天盖地的宣传,AI人工智能的概念才开始走进国内的普罗大众。以2024年为节点,AI技术和相关产业的发展在欧美等西方国家已经有了近80年的发展历程,而中国虽然在20世纪七八十年代已经提出了相关的概念,达成了一些研究成果,但发展过程比较艰难,研究成果真正布局应用于产业和商业化运作大概是在21世纪初开始的,满打满算差不多健康稳定发展了15年的时间。
讲到人工智能产业的发展,就离不开基础设施的建设,而讲到基础设施建设就要从人工智能技术的根本讲起,人工智能技术最基础的,还是所谓的人工智能黄金三角:算力、算法和数据。做一个简单的类比,算力就是人工智能的大脑,算法就是人工智能工作、学习、生产实践的方法论,而数据就是人工智能所具备的世界观。而且由于近期LLM技术(大语言模型)加持下通用多模态大模型的井喷式发展,有海量的数据,需要快速地储存、计算、处理、传输,所以数据中心和算力中心的建立将成为人工智能产业最基本的产业基建,至此也引发出目前国内AI产业发展的相关问题。
由于地缘政治和知识壁垒的原因,欧美国家在算法和芯片上有着天然的优势,所以他们能更有优势地解决算力中实际算力和名义算力之间的差距问题,也可以更好地迭代目前的算法和解决旧产品的散热问题,虽然国内也有相关的综合方案处理商,但处理成本却是非常的高昂,潜移默化地拉高了整体的产业耗能和维护成本,若是这个方面的问题无法解决或者缓解,大面积的数据中心和算力中心应用后,对国内的碳达峰将造成一定的影响。同时要保持乐观的是,中国因为几十年世界工厂的优势拥有了工业上大量的、干净的、全面的产业数据,在这样干净数据的加持下所训练出来的人工智能将会有更好的对工业生产方面的认知,也就是说国内通过良好训练出来的人工智能模型更适合于生产,而且只要通用多模态大模型训练得优秀,那么在其他垂直赛道,例如医疗、金融或其他方面的行业或者产业大模型也将有十分优秀的表现。
综上所述,结合现状我们可以引出目前国内人工智能发展面临的问题和下一步发展的展望。首先在算法方面,无论是从ChatGPT3.0,还是从目前的LLM通用大语言模型开始,都是由欧美方提供相关技术并开放相关源码之后,国内的模型才开始井喷式发展,这方面有点像特斯拉公开电车方面技术之后国内的电车技术获得了长足进步的现象,所以研发稍差,生产应用才是国内人工智能发展的巨大优势;其次在算力和数据方面,无论是在国企、民企还是境内的外企只要有条件都在建立自己的数据中心和算力中心,大面积的开始铺设基建其实造成了很多的数据冗余和算力冗余,也重复浪费了重要的电力资源,所以数据的隐私保护,数据库的共享,算力的并网都是要解决的问题。最后在盈利与商业模式上,境内和海外市场存在着明显的差异,无论是tob还是toc端,用户的付费意愿不强,大部分企业和个人开发者几乎是在用爱充电,真正能为这些人工智能企业输血续命的除了母公司外就是一些产业基金。
所以对国内人工智能产业的发展提出了如下的建议:
第一,审慎地审批数据中心和算力中心的建设,在保证数据安全和隐私完整的状况下,尽可能共享算力和共享数据储存。
第二,由政府或者是权威的非营利机构、协会,完成对所有行业生产数据的备案,由此来帮助通用多模态基础大模型的训练和完善,经过辨伪,除关键信息以外,开放给数据共享参与者。
第三,建立娱乐适用、专业付费的商业模式。将相关应用免费开放给初级的使用者,例如学生、爱好者,对应用使用强度较低,对专业性要求较低的人群免费。针对专业的使用者类似于企业经营者、采购人员、财务人员、机构管理者、院校学者、行业研究人员等对专业性要求极高,对准确性要求极强的使用者实行付费机制。
第四,加快相关行业生产端人才和消费端人才的培育,目前国内人工智能行业生产端和消费端的人群是不匹配的,有着开发人员不知道需求者需求,需求人员不知道如何使用的显著问题,大部分还是跟着海外的头部应用随大流,所以急需实现供需匹配,是数字应用适配产业发展,是国内人工智能后续发展的基石。
(作者单位:中国工商银行杭州分行)