每隔一段时间,数据存储经理人的人生会迎来片刻的宁静,没有什么被打破,也没有什么问题需要扑救。因为这样的时间很少,所以片刻的安宁应当加以利用而不是去享受。这样你就有机会编写存储网络的操作手册,以消除下一个即将发生的突发情况,或者是在发生突发情况的时候做好充分的准备工作。我们通过与来自存储网络厂商(博科公司、思科公司、Emulex公司以及Virtual Instruments公司)的专家对话,探讨存储经理人应当为存储网络的未来作何准备,以及如何最大限度地发挥他们的投资。
下面列出的秘诀中,写在前面的更多是在做一些准备工作,而不是真正要对存储区域网络(SAN)进行调整,但所有的专家都认同如果没有充分的准备就试图对一个SAN网络进行调优,就像在没有车头灯的情况下行驶在漆黑的高速公路上。当你挽起袖子开始干之前,一定要做一些准备。剩下的秘诀更加细致的描述了改善SAN网络性能、效率和弹性的具体步骤(往往是不需要花钱的)。
秘籍一:认识你拥有的一切
存储网络调优第一推荐,就是要首先知晓你所拥有的环境情况。如果出现问题,需要原厂商的技术专家介入,他们想要的第一件事情就是你网络环境的设备清单。如果你之前准备好了这个设备清单,你可能会支付更少的专业服务费用,甚至可以帮你避免从一开始就聘用他们。
记录环境中每块主机总线适配器(HBA)、每条线缆和每台交换机以及它们之间的连接情况是非常重要的。你还应该记录它们实际设置的连接速度,还有运行的软件或驱动程序的版本。尽管这好像很痛苦,但是,一份包含存储网络组成和配置的设备清单,是那种在IT日常紧急情况下可以快速得出优先列表的文档。花费时间去设置并了解环境中的状况,以及它们发生了怎样的变化,是非常重要的。
记录这些信息甚至可以准确指出某些适合调优的区域。我们已经看到了这样的案例,在用户升级到4Gb光纤通道(FC)的过程中,因为某些原因,其内部交换链路(ISL)仍然设置在1Gb的速度。简单改变交换机的配置就能有效地倍增其性能。如果他们没有花时间去做这样一个设备清单,那这个明显的错误或许永远都不会被发现。
这是一条无需成本的秘籍,因为信息可以获取或者存储在电子表格里。尽管手工记录这些信息的轨迹是可行的,但在今天快速变化的情况下,动态数据中心还是缺少一种更加实用的方法。存储环境变化飞快,而IT员工通常比较匮乏,所以手工维护一个基础架构是不现实的。许多厂商,包括同我们对话的,可以提供自动捕获这些信息的软硬件工具。
当然,那些工具不是免费的,也不像电子表格那样廉价。但如果您与手工获取数据的成本,或遗漏网络环境重要变化的成本进行权衡比较,这或许是一笔很好的投资。自动化存储资源管理(SRM)工具在其捕获的数据和层级上也有所不同。许多只是简单的检查设备并记录状态数据,而有些会深入到物理层并分析网络架构。
秘籍二:知道是怎么回事
完成了存储网络基础架构组成部件的绘制后,下一步是全面的了解那些设备在某一特定的时间在做什么。许多交换机和HBA卡厂商在其产品中内嵌了这些能力。但并不是要看每个设备的流量状况,最好是找到一个能够对网络中数据传送提供实时反馈的工具。软件解决方案和物理层访问工具都可以报告网络架构中的流量状况。因为这些可以监控网络设备的工具非常的重要,因此我们所有的专家都指出了这点,某些情况下,操作系统和应用软件报告的信息不准确,此时可以与设备自身的报告作对比。
某些情况下,这些工具可以用于趋势分析,它们可以模拟一个即将发生的数据存储基础架构的问题。例如,如果内部交换链路(ISL)的流量稳步增加(参阅秘籍六),流量增长的趋势会帮助确定应用程序多久就会重新平衡或者是需要增加ISL的带宽了。还有的工具会报告端口的CRC或者包错误,这表明SFP故障马上就要发生了。
秘籍三:知道你想要做什么
随着设备清单的完成,你会对你的SAN有个清楚的了解,下一步是要弄明白,如何改变网络,才能给你的组织带来最大的好处。你可能已经发现了SAN的某些功能需要启用,或许你有新的应用程序,或者需要对现有举措加速部署进行规划。了解对其余环境构成影响的活动,以及在哪那些任务中,存储基础架构所扮演的角色是至关重要的。一般来说,后面的任务就是提升可靠性或者性能了,但也可能是减少成本。
秘籍四:减少影响
当你感觉正处于准备对环境做些改变的阶段的时候,下一步就是要通过把SAN拆分成虚拟SAN(VSAN)的方式尽可能的减少影响的范围。通过拆分在最坏的情况下对环境的改变所产生的不可预期的结果(就像要阻止服务器访问存储,却导致服务器掉电),减少了对整个基础架构的影响。减少影响的范围是自身重要的调优步骤,这有助于建立一个更加有弹性以适应未来变化的环境,并且能够帮助包容问题。例如,某一应用程序突然需要大量的存储资源,拆分的SAN有助于遏制这种情况,并且保证其余的基础架构不会极度缺乏存储资源。这方面的调优不需要任何新增的采购,因为这只是设置和配置的过程。
秘籍五:学会测试
尽管好像有些奢侈,但调优的关键之一还是要有个固定的测试实验室,用来试验计划对环境的改变,或者用来模拟失败的状况。实验室测试允许你探索不同的方案,找出解决办法,却不会对生产网络造成影响。在与我们的专家的对话中,同时根据我们自身的经验,大多数SAN网络的紧急事件,都由磁盘阵列或者SAN环境中新功能的部署造成的。如果你缺少建立试验环境的资源,一种替代方法是和你的基础架构供应商合作,因为他们有很多设备可以用来再现问题或用于测试新功能的实施。
存储的I/O性能在十大调优列表中出现的次数通常很高,尽管没有进入我们的前五大秘籍,但它会一直出现在剩余的列表中。在性能问题解决之前,环境情况的记载、理解以及尽可能保持弹性是很重要的。虽然由于缺少性能调优是导致响应时间慢的一个问题,但盲目追求零响应时间就更糟糕了。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。