数据中心的挑战:大象的烦恼
数据中心对google、腾讯这样的巨大的互联网公司来说无疑更是一个生命线。
腾讯公司的业务迅猛发展,需要更多的计算资源提供支撑。另外超大集中资源带来的规模效应,也可有效减低经济成本,提供具有成本效益的高效计算环境。这些诉求驱动腾讯数据中心服务器规模开始由五千台服务器往超大规模的两万台服务器规模构建。
但是,庞大的数据中心往往存在几个方面的挑战与问题。首先,是高成本运作,网络利用率非常低。在这种庞大的数据中心里,为了保证网络的低故障率,业界在搭建网络时习惯性地不让网络满负荷运作,并且在负荷达到50%的时候便考虑扩容。同时为了保障网络在故障时能够迅速恢复,会对线路预留1:1冗余保护,即多预备一条线路,使得网络故障时能够切换到健康的线路上。
也正是因此,网络利用率只有30%。可以看到,资源并没有达到最优配置。而且,网络的故障率不可能是1:1,预留1:1的冗余肯定会浪费。
第二,网络服务质量QoS不能得到有效分配与灵活变通。现在定义业务的优先的优先级只能通过QoS级别,高质量需求的业务制定高QoS级别,不够灵活。
基于这两方面的问题,腾讯非常重视SDN。因为对于大型互联网服务商,SDN可以实现超大规模的流量工程、广域网优化,最大限度地提升用户体验。
首先,SDN对于数据中心成本的降低有非常好的效果。SDN架构下,可以洞察业务变化,并为每个业务定义一条网络。这样对于腾讯的话,可以针对业务预留保护,其实只有一小部分业务需要1:1冗余。而且应用了SDN,腾讯可以清晰预计流量变化,可以在网络负荷达到80%的时候再进行扩容。这将为腾讯节省大量网络成本。
其次, SDN对腾讯的QoS有非常大的改观。如果用SDN给每一个业务定义网络,显然就不需要QoS的硬性规定了。
主动出击:构建SRP协议优化网络
SDN的应用涉及到数据中心内部网络的优化。为优化数据中心内部网络,腾讯通过构建新的SRP协议(Sequoia Routing Protocol,腾讯自研的路由协议)。SRP协议根据数据中心网络固定简单的CLOS架构组网和基于运营的预先规划的子网特点,通过预设好的静态路由以及根据邻居状态信息动态解析相结合的方式生成实际可用的路由转发表项。
SRP协议的主要优势体现在:非计算的路由协议,
可构建超大规模的网络;规划到运营的闭环,避免学习未规划的IP子网带来的安全隐患;在SRP控制平面上操作静态路由,可快速实现和方便移植到不同交换机平台。
关注SDN生态:加强人才培养与企业合作
除了内部研发,腾讯对SDN的人才培养以及产业合作都非常重视。在整个对SDN的了解与关注下,腾讯意识到国内的SDN人才非常缺乏。因此,腾讯在此方面展开了积极的合作。2011年,腾讯与上海交通大学创办联合实验室,签订协议中明确指出:这是一个SDN和OpenFlow的研究项目,该项目由上海交通大学计算机科学与技术系教授过敏意指导。"我们会做一些前瞻性模拟研究,并基于腾讯现有的网络给出一些拓扑结构。"腾讯相关人士表示。正是因为它意识到未来SDN将会对整个产业产生不可忽视的巨大影响,腾讯对SDN的人才非常关注。
而在企业合作方面,腾讯与多家企业合作,比较大的动作是腾讯联合华为创办了腾讯-华为联合创新中心,两家公司将在Openflow、SDN乃至整个网络领域展开全面合作。面对即使到来的SDN时代,腾讯正在逐渐拿出看得见的成果。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。