重复数据删除技术(复删技术)现在已经从实验室走向产品化,并逐渐成为主流,从市场上不断增长的供应商数量可以得到印证,这些技术方案供应商已经有标准的重复数据删除产品,或在其备份产品中整合了这部分功能。
有数据显示,至少有30%的IT部门在部分数据上使用了重复数据删除技术,厂商也推出了换代产品,专门为简化和无破坏性部署做了优化,但这并不意味着每个解决方案都是一样的,大多数重复数据删除厂商都经过了一个学习曲线,无论是在经验,参考文档还是在技术支持方面都已经有了很大的积累。
文件级别复删技术消耗少
如果到现在你还不知道重复数据删除的作用,看来你在火星旅程已经经历了2,3个年头。
一般来说,重复数据删除技术是在子文件级发现冗余数据的一种方法,它用一个指针代替重复的数据,这项技术可以有效减少磁盘存储空间需求,并降低数据传输的网络带宽需求。
基于所采用的不同技术,数据是否重复可以有不同的检测方式,基于文件级的重复数据删除方法是最简单的。举例来讲,文件级的重复数据删除(亦称为实例存储,SIS)可以识别完全一样的文件,将其仅保存一次,并将后续完全一致的拷贝替代为指向该文件的一个指针。
文件级别的重复数据删除技术的劣势在于精细度不够,这意味着一个文件中即便有很小的一处改动也会被认为是一个全新的文件而另外储存。文件级别的重复数据删除一般用于邮件环境,这其中同样的附件会被同时发送给诸多参与者。
我们市场上可以看到的基于文件级别的重复数据删除技术有Novell公司的GroupWise和Microsoft公司的Exchange邮件系统 (虽然在Exchange 2010中并不支持SIS)。EMC公司同样在其存储阵列上提供文件级别的重复数据删除,包括Clariion、Celerra和其最新的VNX系列。
不过,文件级别的重复数据删除并不适用于结构化数据环境中,这种环境下诸如数据库等会持续变化,重复数据删除的效果就会大大折扣。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。