随着计算机科学技术突飞猛进的发展,计算物理已经成为物理学研究过程中与理论物理,实验物理同等重要的研究方向。计算物理经常需要对海量的数据进行复杂的计算,其对处理器的浮点运算能力、I/O性能、内存容量以及带宽都要求较高。与此同时,呈数量级增长的数据对计算机硬件也提出了更大的挑战。无论是单台计算机还是超级计算机,因构架扩展的局限性或高额的经济成本,已无法满足科学计算的需求。计算机集群因其高速的运算性能、良好的兼容性及可扩展性,逐渐被科学计算领域所认同。
中科院近代物理研究所一直以重离子核物理基础研究和相关领域的交叉研究为主要学科方向,相应发展加速器物理及核技术。目前,中科院近物所超算中心已具有深腾7000G超级计算集群一套,胖节点集群一套,专用工作站集群一套以及终端集群一套。其中深腾7000G超级计算集群是CPU/GPU混合集群,其余均是自建。
自建集群搭建
硬件搭建
中科院近代物理研究所超级计算中心自主搭建的CPU集群,共有22个节点及一个24口千兆交换机。22个节点中一个作为管理节点,其余均为计算节点。每个计算节点配置如下:Intel Q6600CPU处理器一个、2GB内存、160GB硬盘。管理节点装有两块网卡,一块连接对外以太网,一块连接集群节点间组成的局域网。连接方式如图1所示。
图1 CPU集群连接方式
软件安装
集群所有节点(含管理节点)均安装RHEL5.6操作系统,采用PXE+KickSTart的无人值守批量安装方式,这样除一个服务器节点外,其余节点无需光驱或者软驱。之后,大量的计算机采用网络安装Linux操作系统,不仅提高效率,而且节点相同的配置也利于以后集群系统的维护。
PXE+KickSTart的安装需要DHCP和T F T P 服务,将其配置于管理节点,KickSTart所生成的ks.cfg配置文件,存放在系统安装文件服务器Server上,安装节点主机需PXE支持的网卡。服务器依次配置IP地址、DHCP服务、TFIT服务及NFS服务,之后配置ks.cfg文件。ks.cfg文件是待安装机器所有的配置文件,每台机器在安装Linux系统后都会自动生成ks.cfg,并记录系统安装时所做的每一步操作。然后配置共享的文件夹及PXE启动方式。保存后重启,安装自动完成。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。