加入收藏 | 设为首页 | 会员中心 | 我要投稿 焦作站长网 (https://www.0391zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 云计算 > 正文

云存储基础组织剖析

发布时间:2021-09-24 20:05:51 所属栏目:云计算 来源:互联网
导读:云存储(或数据存储即服务)是对接口后的存储的抽象,可在该接口内按需管理存储。此外,接口抽象化存储的位置,这样一来,不管存储是在本地还是远程(或混合)都

有一些有趣而新颖的方案可用于解决可用性,比如信息传播。一家提供私有云存储的公司 Cleversafe(稍后介绍)使用 Information Dispersal Algorithm (IDA) 来在发生物理故障和网络中断的情况下实现更高的可用性。IDA 是由 Michael Rabin 最初为电信系统而创建的一种算法,它支持使用 Reed-Solomon 代码对数据进行切片处理,以便在数据丢失的情况下实现数据重建。此外,IDA 允许您配置数据切片的数量,这样一来,可以为一个可接纳故障将数据对象分割成 4 个切片,对 8 个可接纳故障分割成 20 个切片。与 RAID 类似,IDA 支持通过原始数据的子集重建数据,含有一定数量的代码错误开销(依赖于可接纳故障的数量)。这如 图 5 所示。

 

图 5. Cleversafe 用于最大化数据可用性的方法

 

有了为数据切片的能力以及 cauchy Reed-Solomon 纠错码,就可以将切片分发到地理上分散的站点进行存储。对于大量切片(p)和大量可接纳故障(m),最终开销是 p/(p-m)。因此在 图 5 中,p = 4 且 m = 1 的存储系统的开销是is 33%。

 

IDA 的缺点在于,它是处理密集型的,无硬件加速。复制是另一个有用的技术,且由各个云存储提供商实现。尽管复制技术引入了大量开销(100%),但可以简单而高效地提供它。

 

控制

 

一名客户控制和管理其数据存储方式及其相关成本的能力很重要。许多云存储提供商实施控制,使用户对其成本有更大的控制权。

 

Amazon 实现 Reduced Redundancy Storage (RRS),为用户提供最小化总存储成本的一种方式。数据是在 Amazon S3 基础架构内复制的,但使用 RRS,数据复制次数较少,且存在丢失数据的可能性。这适用于可重新创建的或在其他地方有副本的数据。Nirvanix 还提供基于策略的复制来对如何以及在何处存储数据提供更细粒度的控制。

 

效率

 

存储效率是云存储基础架构的一个重要特征,特别是将重点放在总成本上。下一部分专门介绍成本,但是该特征更多地是关于对可用资源的高效使用,而非成本。

 

要使一个存储系统更高效,必须存储更多数据。一个常见的解决方案就是数据简缩,即通过减少源数据来降低物理空间需求。实现这一点的两种方法包括压缩 — 通过使用不同的表示编码数据来缩减数据 — 和重复数据删除 — 移除可能存在的相同的数据副本。虽然两种方法都有用,但压缩方法涉及到处理(重新编码数据进出基础架构),而重复数据删除方法涉及到计算数据签名以搜索副本。

 

成本

 

云存储最显著的特征之一是通过使用降低成本的能力。这包括购置存储的成本、驱动存储的成本、修复存储的成本(当驱动器出现故障时)以及管理存储的成本。在从这个角度(包括 SLAs 和增加存储效率)看待云存储时,云存储在某些使用模型中会很有用。

 

云存储解决方案内的一个有趣的使用高峰由一个名为 Backblaze 的公司提供(参见 参考资料 了解详情)。Backblaze 着手于为云存储产品构建廉价存储。一个 Backblaze POD(存储架)在一个 4U 机箱中具有 67TB 的数据包,价格不到 8,000 美元。这个数据包含有一个 4U 机箱、一个主板、4GB 的 DRAM、4 个 SATA 控制器、45 个 1.5TB SATA 硬盘和两个电源。在主板上,Backblaze 运行 Linux?(以 JFS 作为文件系统)且以 GbE NICs 作为前端,使用 HTTPS 和 Apache Tomcat。Backblaze 的软件包括重复数据删除、加密功能和用于数据保护的 RAID6。Backblaze 对其 POD 的描述(详细介绍如何构建您自己的 POD)向您展示公司可以将存储成本降低多大幅度,使云存储成为一个可行且经济高效的选择。

 

云存储模型

 

到目前为止,我主要谈讨了云存储提供商,但是还有云存储模型可支持用户控制其数据。云存储演化为三个类别,其中一个支持合并两个类别,以提供一个经济高效而安全的选择。

 

本文大部分讨论了公共云存储提供商,它们将云存储基础架构作为可出租商品予以提供(从长期或短期存储和基础架构内使用的网络带宽角度来讲)。私有云使用公共云存储的概念,但是以可安全嵌入到用户防火墙内的形式。最后,混合云存储支持合并这两个模型,通过策略定义哪些数据必须私下维护,哪些可在公共云内得到安全维护(参见 图 6)。

 

图 6. 云存储模型

 

云存储模型如图 6 所示。典型的公共云存储供应商包括 Amazon 和 Nirvanix(将存储作为服务提供)。典型的私有云存储提供商包括 IBM、Parascale 和 Cleversafe(为内部云构建软件和/或硬件)。最后,混合云提供商包括 Nirvanix 和 Egnyte 等。

 

前景展望

 

云存储是云存储模型中的一个有趣进化,它重新定义我们在企业内构建、访问和管理存储的方式。尽管云存储目前主要是一种消费技术,它在迅速向企业质量方向演化。混合云存储模型将使企业能够在一个本地数据中心内维护其机密数据,同时委托更少的机密数据到云中,以实现成本节约和地域保护。查看 参考资料 获取有关云存储提供商和独特技术的信息的链接。
 

(编辑:焦作站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读