加入收藏 | 设为首页 | 会员中心 | 我要投稿 三明站长网 (https://www.0598zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 移动互联 > 通讯 > 正文

构建存储梯田

发布时间:2016-10-30 05:22:54 所属栏目:通讯 来源:IT168存储频道
导读:副标题#e# 一种技术或者概念,只有符合而且能够满足用户迫切的需求,才会赢得更多用户,才会获得广泛应用。分级存储就是这么一种技术。 那么,分级存储到底能够满足用户什么样的需求?它的具体含义是什么?对于应用来说,用户最关心哪些问题?希望读者能够
副标题[/!--empirenews.page--]     一种技术或者概念,只有符合而且能够满足用户迫切的需求,才会赢得更多用户,才会获得广泛应用。分级存储就是这么一种技术。

    那么,分级存储到底能够满足用户什么样的需求?它的具体含义是什么?对于应用来说,用户最关心哪些问题?希望读者能够从本专题中获得些许答案。

    梯田,沿着山坡开辟的一级级农田,凝聚了多少人的智慧,提高了光、热、水、土资源的利用率,减少水土流失,增加固水能力,并提高农业生产力。在高山陡坡上充分利用每一寸土地资源,以获得最大面积的生产空间。

    在有些干旱地区,由于每块梯田的阳光、水土的资源都不尽相同,所以真正高产的梯田在山坡的不同位置种植的农作物会有一定差别,有的位置种玉米,有的种大豆,还有的种马铃薯。

    分级存储,将用户拥有的所有存储资源统一管理,提高了每种存储设备的利用率,节约了成本。

    存储的分级是十分明显的,仅从设备上说,就有磁带机、磁带库、NAS、中低端盘阵、高端存储系统等等,如何根据用户数据的不同价值合理利用好每种存储资源是一个不小的挑战。

    

    需求篇 数据价值与存储投资的矛盾

  “今天企业的数据中心非常复杂,数据保护是其关键。但是,并非所有的数据都具有同样的价值;并非所有的企业都具有同样的需求。” ――John McArthur,IDC存储研究部副总裁

    企业拥有海量的数据,但往往只有有限的预算用于数据保护。因此,很有必要基于精心定义的风险规避政策来为精选的数据分配适当的保护资源。

    IT企业总是要面对增长起来无休无止的数据量。各种应用都在创建越来越大的文件。用户也很少删除数据和存档,这就导致要访问旧一些的文件已经变得非常困难。因此,目前的潮流是购买更多的软件。然而,这种解决方案产生了非常复杂和笨拙的存储环境,不仅需要更多的维护和管理,而且需要更多的金钱来维持。

构建存储梯田

    系统中60%至80%的数据经常在一个月,甚至一年中都不会被访问。(如上图所示)

    而在经常访问的数据中,重要性差别也十分突出,有的数据与用户的业务联系紧密,可靠性、可用性及性能要求都很高,有的尽管经常使用但是与业务联系不是特别紧密。

    一般来说,重用数据的概率自数据创建3天之后就会下降50%,当数据创建30天后,重用的概率通常会降至很低,而高达90%的数据超过90天后就不会或很少被读取。

    为了提供良好的数据保护,IT部门通常都保留巨大的空余空间,用以防止出现容量不足的现象。分析专家曾报告说,Unix和Windows的存储利用率只有20%至50%。这也就是说,许多企业支付巨资购买的大量存储空间都被浪费掉了。这种浪费是体系结构造成的,使用者要支付系统资源费用,系统需要管理员的维护,备份的成本也增加了,而且恢复数据的时间也更长。

    只要解决了这种效率低下的问题,企业就能避免为这些未使用的存储空间进行灾难恢复操作,并且能够通过合并硬件来减少日常运营开支。但怎样才能实现这一目标呢?解决办法看起来应该是对比较陈旧或未使用的数据进行删除或存档。这样做可以释放大量的空间,但这种办法远不够理想。删除是一项手工作业,要冒数据丢失风险,甚至会导致法律纠纷。存档虽然是一个自动的过程,但却要迫使企业对用户进行存档应用的培训和支持,而且经常需要专用的存储设备。

    还有一个很重要的问题是,在一个大型用户那里,拥有从高端存储系统到低端带机、带库全系列的存储设备。高端存储系统中存放的数据不一定都为价值最大的数据,相反,在低端带机、带库中也会有价值很高的关键数据。这样的坏处是,增加了数据保护工作的风险也降低了整体存储资源的利用率,一定程度上造成了投资的浪费。因此,合理利用存储资源并且尽量降低数据保护的风险是一个巨大的挑战。

    

    管理篇 分级存储重在管理

存储实现分级以后,在线、近线与离线存储存放的数据价值不同,在同一级别存储内部(比如在线和离线存储),存放的数据也应该不同,实现每一级别内的“分级存储”。如何将各个级别存储中数据统一管理起来便成了最为关键的问题。

    分级存储管理

    分级存储管理(Hierarchical Storage Management,HSM) 起源于1978年,首先使用于大型机系统。近10年来,HSM被广泛应用于开放系统的Unix和Windows平台。

    分级存储管理是一种将离线存储与在线存储融合的技术。它将高速、高容量的非在线存储设备作为磁盘设备的下一级设备,然后将磁盘中常用的数据按指定的策略自动迁移到磁带库等二级大容量存储设备上。当需要使用这些数据时,分级存储系统会自动将这些数据从下一级存储设备调回到上一级磁盘上。对于用户来说,上述数据迁移操作完全是透明的,只是在访问磁盘的速度上略有怠慢,而在逻辑磁盘的容量上明显感觉大大提高了。通俗地讲,数据迁移是一种可以把大量不经常访问的数据存放在带库、盘库等离线介质上,只在盘阵上保存少量访问频率高的数据的技术。当那些磁带等介质上数据被访问时,系统自动地把这些数据回迁到盘阵中;同样,盘阵中很久未访问的数据被自动迁移到磁带介质上,从而大大降低投入和管理成本。

    HSM应用也具备监测磁盘容量并在关键容量情况下作出反应的能力。这种软件经过配置后可以为某个卷设定一个最小的剩余空间,如20%。

(编辑:三明站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读