——访新华三集团技术战略部专家徐心平
如今,信息技术已经渗透到各个学科领域。高校在努力建设“双一流”大学的同时,也在加快科研信息化工作的步伐。近日,新华三集团推出“公共科学计算平台解决方案”。该公司技术战略部专家徐心平在接受采访时表示,公共科学计算平台就是为了支持具有复杂数学运算和高速并行计算的科研和应用,提供一个共享的高性能基础设施资源池,并支持多租户灵活实用的开发和运行高性能软件应用的PaaS平台。在高校领域,可以驱动实现科研信息化服务。
《中国教育网络》:公共科学计算平台的核心价值和关键技术问题是什么?
徐心平:公共科学计算平台针对的应用有关键的两个特征:一是需要复杂的数学运算;二是需要高速并行计算技术。目前涉及具有这两个关键特征的技术和应用领域就是HPC和AI。这两个关键特征在底层的芯片/服务器/存储/网络层面有专业的技术实现,有共享统一的基础,但是在平台层的runtime和programming model层面,以及解决具体问题的应用层面却各不相同。高性能的IT资源由于业务开发和应用的需要,一般来说规模较大、投资也大,孤岛式建设和利用模式造成很大的资源浪费,很多高性能的IT资源在单一业务开发和应用的空闲时间无法及时给另外的项目组使用。这需要一个私有的专业PaaS平台,公共科学计算就是要解决这个需求,对于高性能业务研发和应用,要能够实现多租户资源共享,各业务科研组同时共同使用一个支撑平台,让科研人员更关注业务科研而不是复杂的IT环境搭建,这是公共科学计算平台的核心价值。
需要强调的是,针对高性能业务研发和应用的公共科学计算平台,必须首先保证IT资源在科研和应用的时候保持高性能,高可靠,高容错。而以虚拟机技术为基础的openstack架构更适合通用IT计算应用的云化,更适合公有云模式,其提供的HPC/AI服务更多是针对普通的开发学习者,没有规模化物理集群计算的必要,可以省略一些高性能技术的匹配。但针对规模化、专业化的高速网络,大规模物理集群的自动化部署,高可用高i/O的分布式存储,不同业务的runtime和programming容器化封装,底层各高性能硬件的驱动支持等,实际是难以实现的,这些是针对专业开发和应用必须的。
《中国教育网络》:如何在高性能业务的研发和应用的领域实现这种专业私有云的平台?新华三的公共科学计算平台是如何做的?
徐心平:新华三把公共科学计算作为重点研究和开发的技术领域,研究相关融合技术,打造公共科学计算生态,提供公共科学计算整体解决方案,为客户建设公共科学计算平台,为客户的人工智能高性能业务的研发和应用赋能。
新华三在提供针对专业HPC/AI开发者的公共科学计算平台方案的同时,也研究开发针对普通HPC/AI开发者的云平台方案。在提供通用IT资源云服务时,提供小规模需求的HPC/AI云服务,并基于统一的云服务portal可以VDC的服务模式使得支持大规模需求的公共科学计算平台和高校云平台对接,从而实现一个统一的高校云服务,实现高校管理、教学和科研信息化的融合。
《中国教育网络》:高校公共科学计算平台的诉求有哪些?面临哪些问题?
徐心平:高校很多涉及基于HPC/AI技术搞自己行业领域科研的院系,以往对于高性能的IT基础设施大多都是课题组自购自用,独享资源。不同业务科研的IT环境所需要的runtime和programming model部署和参数配置太复杂,无法灵活安装和卸载,从而造成高性能的IT资源无法共享,没有资源隔离的手段,没有统一的服务目录入口,也无法快速的给学生提供自动化的一站式服务的高性能IT环境进行实践。从全校的角度来看,大量高性能的IT资源设备的采购成本很高,而又难以共享,院系之间,课题组之间的研究数据和成果也无法灵活的流转和分享,这是实现科研信息化的最大问题和障碍。所以,高校科研信息化的一个核心诉求就是能否建设一个高性能基础设施资源池,并提供一个PaaS平台,为各院系各课题组,以及学生提供支持多种涉及复杂数学运算的高性能业务,如基于HPC、AI技术的科研和教学实践,并且平台支持各业务组的研究和计算数据,在平台中方便的保存和流转,实现科研成果的分享。因此,建设公共科学计算平台项目可以驱动实现科研信息化。(责编:杨洁)
本文刊载于《中国教育网络》2018年4月刊
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。