发展到现在,HPC已经走上了平民化的道路。一般HPC 都是做超大规模的繁重计算,像大型工程、桥梁飞机制造以及气象预报等方面的计算及应用,对浮点运算的要求比较高。AMD 皓龙处理器做浮点运算一直相当出色,64位、直连架构等特性都对HPC 最终走向平民化起到了推动作用,像现在TOP500中Cray的超级计算系统采用的就是AM D 的皓龙处理器。
目前,功耗和性能是困扰HPC的两大难题。AMD 8/12 核的皓龙处理器可以为HPC 降低能耗,它可以根据不同的应用关掉无用的核心,当机房不够大供电能力不够强的时候可以对芯片进行功耗上限设置,或者通过降频等技术来完成能耗的节省。
按照摩尔定律,CPU 一般的更新换代时间是18个月,也就是说它能够在18个月后性能就可以翻一番。而GPU 的更新速度是CPU 的1.5 倍,也就是说通常12 个月的时间GPU 的性能就翻了一番。大概五年前,CPU 和GPU 的晶体管数量是差不多的,而现在GPU 的顶端产品大概可以拥有超过20 亿个晶体管,远超过了CPU集成的晶体管数量。CPU里主要是做分支运算、预测等工作的,而在大规模并行尤其是数据并行计算领域,目前高端的GPU 已经拥有了无与伦比的处理能力。
而且CPU里面大约有超过40%是运算单元,只有5%是逻辑单元,发展到现在,最快的CPU和GPU产品比较,在单精度32 位计算上GPU的运算速度是CPU的50倍,64位运算上是10倍,快很多。此外在能耗上,一台超级计算机一天就要消耗2万元的电,如果用GPU 整个规模就可以降低。同样的计算能力,GPU可以把能耗降到1/5或不到一半的规模。
传统的GPU由于缺少通用的高级编程语言的支持,很难做编程,所以一般很少人用。但随着通用计算设备上的统一、开放标准OpenCL的推出和不断发展完善,用户利用GPU做通用计算从实现的角度来说变得越来越容易了。而且如前文所述GPU的每瓦性能又确实很高,所以,越来越多的研究人员和商业组织开始利用GPU来完成大规模的计算,并开创了一个新的研究领域:基于GPU 的通用并行计算。
目前已成功应用于气象模拟、基因工程、石油勘探、运动规划、代数运算、优化计算、偏微分方程、数值求解、流体模拟、数据库应用、频谱分析等领域,也包括图形图像处理、金融统计预测、智能信息处理系统、数据挖掘工具等商业化应用。同时,也产生了一些针对G PU 开发的通用计算工具包,能够基于GPU 平台对FFT、BLAS、排序及线性方程组求解等科学计算进行优化实现,与单纯依靠CPU实现的算法相比,平均性能提高了近20倍。
AMD于2006年成功整合了ATI,所以利用GPU做通用计算的技术有着得天独厚的优势。目前高端GPU 虽然有很强的计算能力,但很多时候由于受PCIE 总线带宽的限制,CPU 和GPU 之间大规模的数据交互就成了很多高性能计算任务的瓶颈。
为此,AMD 推出融合了CPU 和具有通用计算能力GPU的产品—Fusion APU。目前开发的产品主要用于笔记本、台式机和平板电脑等,相信未来也可以将类似技术迁移到服务器平台。全新的APU 架构完美解决了原有平台架构中CPU 和GPU之间大规模的数据交互耗时问题,为用户灵活利用CPU 和GPU 编程克服了一个最主要的障碍,并进一步显著提升了每瓦特电量的计算能力,由此可以看出,G P U + C P U 的融合是未来通用计算的必然趋势。(刘文卓:AMD中国区技术总监)
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。