中新社北京9月27日电 题:中国逐鹿人工智能,哪些关键技术被国外垄断着?怎么破?
——专访中国工程院院士、清华大学计算机科学与技术系教授郑纬民
中新社记者 张旭
当前,新一轮科技革命深入演进,数字时代扑面而来,全球主要国家在数字经济领域展开激烈角逐。关键数字技术创新,中国已经取得了哪些优势?在当前国际环境下,面临哪些难题要“啃”?
作为引领未来的战略性技术——人工智能是中国提高经济与科技水平、提升国际竞争力的重要算力基础设施,目前各地掀起了人工智能计算中心的建设热潮。人工智能计算中心如何才能发挥出最大价值?中国人工智能计算中心技术自主可控水平如何?哪些关键技术被国外垄断着?近日,中国工程院院士、清华大学计算机科学与技术系教授郑纬民接受中新社“中国焦点面对面”专访,进行权威解读。
访谈实录摘编如下:
给三句话,它就能写50集连续剧
中新社记者:近期,中国“人工智能计算中心订单爆单”的话题引发不少关注。武汉市5月底建成的第一个人工智能计算中心,刚开张就天天客满,满负荷运行,目前预约已经排到半年以后。人工智能(AI)计算中心是算什么的?为何市场需求这么强?
郑纬民:人工智能有多种多样的应用场景,需求很旺。根据场景可以分为三大类应用:
一、图像检测、视频检索类。可以用在安防、医疗诊断、自动驾驶。核心是卷积网络,这一类应用落地做得很好,已经起到了很好的作用。
二、决策类。比如交通规划等,这个类型也已经起到了很好的效果,核心是强化学习。
三、自然语言处理类。比如搜索与推荐,智能人机接口,核心是Transformer。在应用方面,语言翻译,把中文翻译成英文,英文翻译成日文等,问什么问题都能回答,这样的机器需要非常大才行。又比如生成文本摘要,你给它三句话,能给你写成50集电视连续剧。
这三类应用的需求很多,所以才会(出现订单)排队排到半年后这样一个情况。
中新社记者:目前流行的人工智能计算中心与传统数据中心有何不同?日前,工信部印发《新型数据中心发展三年行动计划(2021-2023年)》,《行动计划》中定义的新型数据中心和人工智能计算中心是一回事吗?
郑纬民:传统数据中心主要由通用CPU架构的服务器集群构成。近年来,随着人工智能的发展,数据中心也逐渐包括了很多具有高性能人工智能算力(GPU或人工智能加速器)的机器。
而人工智能计算中心是什么呢?主要由具有高性能人工智能算力(GPU或人工智能加速器)的机器组成。因此可以说,数据中心概念的覆盖面会更大一些,包含了人工智能算力。
中国技术自主可控吗?
中新社记者:人工智能和大数据中心都属于“新基建”,当前全球主要国家都在大规模建设人工智能、大数据基础设施,有人说未来人工智能算力将会像水和电一样,成为一种公共基础资源,对此您怎么看?中国建设人工智能基础设施有哪些核心优势?中国人工智能计算中心的技术自主可控水平如何?哪些关键技术被国外垄断着?
郑纬民:从全球公有云市场的快速发展可以看出,通用算力和人工智能算力都是公共基础设施,是一种重要的趋势,过去通用的算力是基础设施,现在把人工智能算力也作为基础设施,正在被越来越多的用户认可。
但是我们也要注意到,算力作为基础设施,需要相关的数据作为基础,把机器包括普通的机器,包括人工智能的机器都放在云上,不少行业的数据隐私性和保密性,对其上云仍然有很大的限制,怎么把数据放在云上是一个值得考虑的问题。
中国在建设人工智能基础设施上的主要优势,是政府主导的投入较多。但在市场化建设和运营,整体人工智能算力基础软硬件的技术水平和自主可控程度上,还与美国有一定的差距,如,编程框架目前以TensorFlow和Pytorch为主。智能计算芯片方面,华为昇腾和寒武纪在人工智能算力体系结构上取得了很好的进展,但受制于先进芯片制程,或在软件生态环境上仍然与Nvidia产品有明显差距,仍然需要尽快发展。
中新社记者:“人工智能计算中心订单爆单”话题之外,近期鹏城实验室大科学装置“鹏城云脑II”接连斩获多项国际奖项,也受到业界关注。作为“新基建”,它们可以为科研创新项目提供哪些强大支持?在赋能行业应用等方面有哪些价值?
郑纬民:在科研创新方面,目前一个非常重要的趋势是HPC(高性能计算)+AI(人工智能),就是把传统基于模拟方法的高性能计算应用与AI模型结合起来。解决过去解决不了的问题,或是把过去耗时很长的问题加速成千上万倍。
这方面,AlphaFold(DeepMind人工智能系统)给出了非常好的例子,用人工智能方法来协助进行蛋白质结构预测,解决了过去使用纯科学计算模拟方法由于计算量过大无法解决的问题。HPC和AI结合是我们创新的一个非常明显的优势。
在赋能行业方面,鹏城实验室可以为智慧城市提供强大的人工智能算力,承载智慧城市应用中的智能交通、智能公共卫生等功能,鹏城云脑II也在开展“一带一路”语言的自动翻译,为“一带一路”(倡议)提供重要支持。
大模型方面,目前主要在自然语言处理效果方面取得了比较大的进展,但具体应用领域还在探索之中。
中新社记者:各界都认为依靠人工智能实现智能转型是必修课,但目前中国产业主体存在着发展着力点分散等问题,从这个角度来看,政府统筹建设大规模的人工智能基础设施是否是一个比较好的解决企业转型的路径?大规模、集约型基础设施有哪些独特优势?
郑纬民:目前,各地政府在建设人工智能基础设施上有很大的积极性,对本地产业的人工智能赋能,应该说能够起到很好的推动作用。但也要注意,要因地制宜地分析本地产业人工智能化的路径和节奏。
大规模、集约型基础设施,主要是在完成超大规模模型的训练方面起到关键作用。目前看大模型确实是重要的发展趋势,但人工智能算法的规模大小是否有局限性仍是一个开放的问题。
各地为何掀人工智能计算中心建设潮?
中新社记者:当前国内掀起了人工智能计算中心建设热潮,有20多个城市在规划建设人工智能计算中心,目前中国人工智能计算中心运营和落地情况如何?
郑纬民:从武汉和鹏城云脑的经验看,目前的人工智能计算中心运行情况还是很好的,需要机时的用户很多,需要排很长时间的队才能用到机器,这也体现出国内用户对于人工智能算力的强劲需求。
所以我觉得,建设一个人工智能计算中心为当地的企业、研究单位、高等院校等进行创新赋能,都是会起到很大作用。
中新社记者:作为各方资源极度聚合的庞大基础设施,人工智能计算中心建设之后的运营同样是一大命题,在这点上您有什么建议?如何科学运营才能让各地人工智能计算中心发挥出最大价值?人工智能计算中心有哪些运营评估维度?
郑纬民:我觉得特别要注重数据治理。算力提供了,数据该怎么提供?
随着《个人信息保护法》的出台,对数据的使用增加了很多合规性要求,作为地方政府主导建设的人工智能计算中心,除了算力以外,是否能够提供重要价值的相关的数据。如何在既遵守《个人信息保护法》,又能够让智能算法获得所需要的数据是人工智能计算中心运营中的一大课题。
再有就是运营要注意财务上的可持续性,一定要收费运行。避免用户无偿大量使用资源,这样看起来利用率很高,但很可能算的东西没有价值。对特殊的需要赋能支持的用户,可以采用发放机时券的方式来支持。这方面,过去不少超算中心,比如广州超算、无锡超算已经有很成熟的体系,可以借用。
人工智能计算中心的运营评估可以包括利用率、投资回报率、功耗以及应用效果等。其中,利用率我想多说一点,并不是100%的利用率是最好的,因为利用率越高,意味着作业排队时间越长,因此一般来说60%-70%左右的利用率就是个很好的平衡了,不必追求接近100%的利用率。
中新社记者:结合数字经济和产业发展趋势,您认为未来人工智能计算中心的发展方向如何,会不会在一段时期的建设爆发后又迅速转入冷淡期?
郑纬民:人工智能与产业的结合刚刚开始,我对人工智能在各行各业的应用扩展还是充满信心的,我认为人工智能计算中心还是有很大的发展空间。对我们科研的创新,对企业的赋能,对人民生活的改善都会有很大的好处。
中国有能力“从头先进”
中新社记者:中国“十四五”规划和2035年远景目标纲要提出,加强关键数字技术创新应用,加快推进基础理论、基础算法等研发突破与迭代应用。关键数字技术创新,中国已经取得了哪些优势?在当前国际环境下,面临哪些难题要“啃”?哪些与人工智能计算中心密切相关?预计未来发展趋势如何?
郑纬民:中国在基础理论和算法上还很难谈优势,但是基本上可以跟随第一梯队,就是美国人提出来的算法和理论,我们很快能够跟上并加以改进应用。
整个数字技术中,除了硬件的芯片制造产业链,我想特别强调,中国在基础软件方向还是有很多的课要补。我们现在大量的软件,包括操作系统、数据库、编译器、人工智能编程框架等,不是自己从头构建的,而是在开源基础上修改的。
应该说,能够在开源软件基础上进行大量修改,已经证明我们取得了很大的进步,对我国数字技术的自主化具有重大意义。但是我们如果对自己提出更高的要求,就必须拥有自主从头构建先进的基础软件的能力。
这里的“先进”是指,我们构建的新软件要比现有的软件在性能和功能方面有代差的优势。这方面产业界,华为的鸿蒙操作系统、人工智能编程框架MindSpore等给出了很好的范例。我们学术界,清华大学的时序数据库、图计算系统、储存系统也取得了一定的进展,我们期待国内的产业界和高校能够更加重视从头构建先进的基础软件,为中国和世界的数字产业界提供更多革命性的基础系统软件。因此,我特别强调“从头先进”这四个字,“从头”就是我们从头做,“先进”就是比现有的软件好10倍20倍,我们有这个能力,希望通过这个办法,来改善我们国家IT行业的现状。(完)
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。