云存储技术规范0810.docx

上传人:b****8 文档编号:10654664 上传时间:2023-02-22 格式:DOCX 页数:14 大小:148.16KB
下载 相关 举报
云存储技术规范0810.docx_第1页
第1页 / 共14页
云存储技术规范0810.docx_第2页
第2页 / 共14页
云存储技术规范0810.docx_第3页
第3页 / 共14页
云存储技术规范0810.docx_第4页
第4页 / 共14页
云存储技术规范0810.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

云存储技术规范0810.docx

《云存储技术规范0810.docx》由会员分享,可在线阅读,更多相关《云存储技术规范0810.docx(14页珍藏版)》请在冰豆网上搜索。

云存储技术规范0810.docx

云存储技术规范0810

 

云存储技术规范

 

2017年7月

 

1、总则

1.1编写目的

为了更好的推进云虚拟化项目和工程规范实施,特此编写此技术规范,对系统的各个特性和性能要求提出具体要求,起到规范统一的作用。

1.2建设背景和目标

随着互联网的急速发展和非结构化数据的爆炸性增长,公众对高效,快速,分布式存储提出了更高的要求。

亿达集团云存储方案基于这个需求被提出来。

1.3适用范围

亿达集团云存储项目

1.4起草单位

亿达信息技术有限公司-系统集成部

1.5解释权

亿达信息技术有限公司-系统集成部

1.6术语解释

1.6.1何谓云存储虚拟化

存储领域国际权威机构SNIA(存储网络工业协会)给出了云存储虚拟化(StorageVirtualization)的定义:

“通过将存储系统/子系统的内部功能从应用程序、计算服务器、网络资源中进行抽象、隐藏或隔离,实现独立于应用程序、网络的存储与数据管理”。

云存储虚拟化技术将底层存储设备进行抽象化统一管理,向服务器层屏蔽存储设备硬件的特殊性,而只保留其统一的逻辑特性,从而实现了存储系统的集中、统一、方便的管理。

  与传统存储相比,云虚拟化存储的优点主要体现在:

磁盘利用率高,传统存储技术的磁盘利用率一般只有30-70%,而采用虚拟化技术后的磁盘利用率高达70-90%;存储灵活,可以适应不同厂商、不同类别的异构存储平台,为存储资源管理提供了更好的灵活性;管理方便,提供了一个大容量存储系统集中管理的手段,避免了由于存储设备扩充所带来的管理方面的麻烦;性能更好,虚拟化存储系统可以很好地进行负载均衡,把每一次数据访问所需的带宽合理地分配到各个存储模块上,提高了系统的整体访问带宽。

  云虚拟化存储有多种分类方法,从大的方面可以分为:

根据在I/O路径中实现虚拟化的位置不同进行分类;根据控制路径和数据路径的不同进行分类。

根据在I/O路径中实现虚拟化的位置不同,虚拟化存储可以分为主机的虚拟存储、网络的虚拟存储、存储设备的虚拟存储。

根据控制路径和数据路径的不同,虚拟化存储分为对称虚拟化与不对称虚拟化。

1.6.2虚拟化存储的系统构成

  云存储中的一种典型存储方式为分布式存储。

在这种方式中,一般采用带外虚拟化的方式管理存储设备,元数据管理和数据传输都是通过IP网络来完成。

这种虚拟化存储系统主要有四类不同的存储设备。

  客户端:

客户端向外为客户提供各种应用服务,如万维网服务、数据库、文件服务、科学计算等。

客户端上运行存储代理软件,提供网络虚拟设备供应用程序读写访问。

  配置管理服务器:

配置管理服务器用来进行系统的配置和管理。

通过Internet、Telnet或其它接口登陆云存储平台,以远程的方式配置和管理整个存储系统。

  元数据服务器:

云存储系统的元数据服务器(MDS)管理着整个系统的元数据和对象数据的布局信息,负责系统的资源分配和网络虚拟磁盘的地址映射。

在MDS上部署的全局虚拟化存储管理软件和集群管理软件可管理整个存储系统的配置和运行。

另外,MDS通过冗余管理软件来实现普通存储节点之间的数据冗余关系。

  对象存储节点:

每个存储节点都是独立的存储设备,负责对象数据的存储、备份、迁移和恢复,并负责监控其他存储设备的运行状况和资源情况。

同时,存储节点上运行着虚拟化存储管理软件,并存储了应用程序所需的数据。

1.6.3虚拟化存储的三层模型

  根据云存储系统的构成和特点,可将虚拟化存储的模型分为三层:

物理设备虚拟化层、存储节点虚拟化层、存储区域网络虚拟化层。

三层虚拟化存储模型大大降低了存储管理的复杂度,有效地封装了底层存储设备的复杂性和多样性,使系统具备了更好的扩展性和灵活性。

用户只需将存储设备添加到存储池中并进行简单配置,就可以创建虚拟卷,而不必关注系统中单个设备的物理存储容量和存储介质的属性,从而实现统一的存储管理。

  物理设备虚拟化层:

主要用来进行数据块级别的资源分配和管理,利用底层物理设备创建一个连续的逻辑地址空间,即存储池。

根据物理设备的属性和用户的需求,存储池可以有多个不同的数据属性,例如读写特征、性能权重和可靠性等级。

按需分配的存储设备作为一个逻辑卷管理器,可以从存储池中分配逻辑卷,动态地分配存储资源,并管理数据块的映射和转发。

  存储节点虚拟化层:

可实现存储节点内部多个存储池之间的资源分配和管理,将一个或者多个按需分配的存储池整合为在存储节点范围内的统一的虚拟存储池。

这个虚拟化层由存储节点虚拟模块在存储节点内部实现,对下管理按需分配的存储设备,对上支持存储区域网络虚拟化层。

  存储区域网络虚拟化层:

可实现存储节点之间的资源分配和管理,集中地管理所有存储设备上的存储池,以组成一个统一的虚拟存储池。

这个虚拟化层由虚拟存储管理模块在虚拟存储管理服务器上实现,以带外虚拟化方式管理虚拟存储系统的资源分配,为虚拟磁盘管理提供地址映射、查询等服务。

1.6.4广泛的应用

  云虚拟化技术已经在存储领域得到广泛的应用。

  各个存储设备厂商纷纷推出了自己的云虚拟化存储产品。

令人瞩目的是,华为提供了企业级虚拟化存储服务,推出了针对云计算的虚拟机和网络存储服务器的虚拟机,以及VTL虚拟带库和VIS产品。

同时,华为在云存储系统中也大量应用了虚拟化技术,实现了元数据服务器的虚拟化VMDS,对象存储服务器的虚拟化VOSN,以及数据容器的虚拟化,等等。

  虚拟化存储在各种行业中已经开始了大规模应用。

这些应用包括:

  数据中心:

应用虚拟化技术提供计算和存储服务中心、网络管理中心、灾难恢复中心、IT资源租赁中心等服务。

  电信行业:

随着产业的发展,电信行业面临两方面的挑战,一方面降低IT架构的成本,另一方面提高IT架构的可用性。

虚拟化技术正是解决这一问题有效办法。

  银行证券保险行业:

利用虚拟化进行容灾,采取“两地三中心”方案,即生产中心、同城灾备中心、异地灾备中心。

同城灾备中心负责一般性灾难的防范,异地灾备中心用来防范大范围的灾难。

利用虚拟化技术,可以在统一的虚拟化基础架构中,实现跨数据中心的虚拟化管理。

  政府信息系统:

政府数据存储系统的建设正受到前所未有的重视。

系统利用先进的存储虚拟化技术,建立统一、标准、共享的数据资源存储平台,能够有效地管理庞大、繁多、复杂的数据及相关的设备,提高资源利用率,并建立起全面的数据安全保障体系。

1.7参考文献

1.8设计要求及使用条件

1.3.1总体设计要求

要求系统部署合理,提供完善的网络硬盘服务,提供完善的开发接口,提供及时有效的售后服务。

1.3.2使用条件

满足一般条件下的使用条件。

2、技术要求及规范

2.1平台架构

按照解耦和,多模块的观点,要求系统各个模块结构清晰,功能相对独立,便于维护和升级。

架构图可以参考如下的模型(图3-1):

(图3-1)

图详解:

 存储业务作为磁盘空间,为亿达集团内部自有业务提供存储支撑;

 存储业务为公众用户(主要是亿达业主)提供丰富的个人存储产品和服务;

 云存储系统必须提供丰富的业务接口,以支持开发丰富的上层应用。

2.2组网结构

按照分布式的组网需求,并充分使用中国电信CN2骨干网络,要求全国云存储采取分点组网,快速连接。

整个组网结构,请参考如下图(图3-2):

(图3-2)

2.3功能性要求

2.3.1基础存储服务

云存储管理平台提供基础的存储资源池,将多个物理设备上的存储资源虚拟为统一的存储资源池,供上层使用。

2.3.2存储管理

设备管理:

通过查询域内所有设备的磁盘、CPU、内存、电源、风扇、网口等信息。

让用户实时了解域内设备运行信息,运行状态,从而可以操控设备;同时及时了解运行有误的设备,有必要可以采取适当措施保证其正常运行。

资源管理:

用户可以方便的了解云存储系统的各个节点的服务情况,包括MDS的主备、MDS\OSN的容量和性能(读IOPS、写IOPS、读流量、写流量)等信息,让用户实时了解域内资源信息,运行状态,从而可以操控这些资源;同时及时了解资源的异常,有必要可以采取适当措施保证其正常运行。

2.3.3策略管理

云存储平台提供灵活的存储策略,包括文件的副本数量、异地存储、加密存储、压缩存储、同步或异步存储。

可以对用户不同目录设置不同的存储策略。

2.3.4多租户管理

云存储平台要求能支持对多租户的管理,可以为每个租户设定存储空间、存储带宽、存储策略、用户数。

租户可以设置管理子租户和孙租户,形成目录树结构。

2.3.5统计报表

云存储管理平台提供统计报表接口,能够完成用户存储容量、存储数据访问量等数据的统计

2.3.6多线程支持

云存储管理平台提供的接口支持多线程及断点续传上传下载文件。

2.3.7跨数据中心部署

云存储管理平台要求支持跨数据中心的部署和管理,并支持跨数据中心的用户访问调度、数据迁移、数据异地存储备份等功能。

支持集中管理,云存储管理平台部署在全国中心机房,存储节点可以部署在全国各机房中,管理平台对分点机房的存储设备可以统一管理调度。

2.3.8数据写多份

云存储平台要求能够针对不同应用或用户的可靠性和性能需求,灵活设置文件存储的副本数。

在满足数据可靠性要求(要求支持同时坏任意两块磁盘数据不丢失)和读写性能要求的前提下,尽量提高存储空间利用效率,降低存储成本。

2.3.9分级安全服务

✧传输安全

云存储系统采用HTTPS(SecureHypertextTransferProtocol)安全超文本传输协议,是以安全为目标的HTTP通道,简单讲是HTTP的安全版。

Https:

URL表明它使用了HTTP,但HTTPS存在不同于HTTP的默认端口及一个加密/身份验证层(在HTTP与TCP之间)。

这个系统提供了身份验证与加密通讯方法,目前广泛用于万维网上安全敏感的通讯,例如交易支付方面。

云存储提供的业务接口及管理接口都基于Https,从而保证数据的在传输层的安全。

✧存储安全

云存储系统在数据存储时,根据条带策略,将用户数据根据侧录进行分条,根据条带策略决定每个分条的大小,数据分条的存储物理位置等。

数据的所有分条及布局信息是元数据的一部分内容,由元数据节点统一管理。

即使任何一个磁盘、一个云存储节点被盗或被入侵。

都无法得知具体的数据内容。

入侵者无法将零散的数据恢复成完整的数据内容。

从而保证数据在存储过程中的安全。

保证数据在存储过程中不被窃取。

支持用户指定的目录和文件加密存储。

✧用户和权限控制

云存储系统对每份数据都提供丰富的访问控制策略策略,对数据的所有操作都会进行权限检查。

访问控制策略包括:

用户和权限。

2.3.10内容搜索

支持按关键字搜索文件名和文件内容。

2.3.11离线下载

关机后也可以雇佣服务器下载,支持HTTP多线程下载。

2.3.12维护管理

设备管理、系统监控、日志、节点管理、域管理、异地灾备、负载均衡等等基础存储服务

2.3.13应用接入接口

云存储管理平台提供基于HTTP(SOAP/REST)的应用接入接口,包括对用户所有资源的操作接口、用户容器、用户数据的操作、数据访问控制和权限的接口。

云存储管理平台提供资源分配、空间使用、空间回收等管理接口。

2.3.14资源统计接口

云存储管理平台提供基于用户的存储资源使用情况相关接口,满足计费要求。

具体包括:

用户使用空间的统计、用户上传下载的数据流量统计、用户上传下载的次数统计等。

2.4扩展性要求

考虑到后期扩容的需求,对系统扩展性的要求十分重要。

主要体现在以下几个方面:

(1)可以实时对容量进行扩充和升级;

(2)支持磁盘的热插拔,新增的资源可以立即被平台辨识,管理和分配;

(3)最低要求可以同时更换两块坏磁盘,更换上的新磁盘自动进行数据填充修复,以保持数据完整性、一致性;

(4)新增磁盘空间要对磁盘的总体负载要起到良好的均衡作用;

(5)支持新增空间的主动和被动的数据备份作用。

2.5容量要求

为了提供优秀的读取速度,稳定的数据存储性能,对云存储系统的整体容量和最小容量提出要求,具体如下:

(1)整体支持PB级的存储能力,具有快速部署一个PB的能力;

(2)最小磁盘支持 1TB(7200rmp);

(3)整个云存储平台最大存储能力要求达到30PB以上;

2.6性能要求

(1)云存储平台的吞吐能力要求能够随着存储能力的增长而线性增长;

(2)要求能够通过调整云存储平台的硬件配置,灵活调整吞吐能力与存储能力的比率,以适应业务变化对平台能力的要求;

(3)要求支持客户端多线程并发上传下载文件,提供访问速度;

(4)要求支持大文件分片存储在多个存储节点,各存储节点能够完成对各分片的并发读写能力,提高大文件的访问速度;

2.7可靠性要求

云存储一旦投入运作,是全年不断电无休系统,需要确保高度的可靠性。

具体要求以下几点:

(1)全年不下电,不停机,不闪断;

(2)出现故障及时进行告警(声音、灯闪),告警分等级,界面可见,具有详细说明和修复手段提示;

(3)要求有raid保护机制,在用户数据写单份的情况下,要求数据访问的可靠性达到99.999%,即对单个存储节点要求:

可访问时长/全年时长>=99.999%

(4)要求用户数据可靠性可灵活配置,支持设置用户数据的副本数、是否异地存放,向用户提供不同级别的可靠性保护;

(5)要求任意两块磁盘或单个存储节点损坏,不会导致用户数据丢失;

(6)要求任意磁盘或存储节点故障,不影响云存储平台其他设备的正常使用和用户访问。

2.8安全性要求

2.3.1硬件安全性

硬件安全性是指硬件在安装、调试、维护、更新等环节,对人员和环境是安全的,具体体现在以下几点:

(1)产品电位接地,防止触电事故;

(2)尺寸、规格、形状合理,以免倾斜倒伏,碰撞;

(3)产品材质耐温,散热;

(4)明确警示触电、有毒害、或其它危险发生的可能;

2.3.2系统安全性

系统安全性主要体现在:

(1)强有力的加密手段和管理策略,确保管理员账户的安全性;

(2)采取设置防火墙等手段,防止来自公网的破坏;

(3)对于大规模访问量,异常访问等情况进行监控;

(4)强大的系统管理能力,提供简洁,高效,互动良好的GUI界面进行系统配置,这些配置项应该包括(但不局限于)以下一些属性:

◆管理,监视,控制硬件资源;

◆管理网络资源(IP分配和服务);

◆管理每个结点(node)上运行的软件;

◆配置每个结点服务均衡;

◆控制整体行为;

◆设置异常或故障的告警;

◆释放结点或系统的资源。

2.3.3数据安全性

数据安全性,指用户存放的数据不可被非法访问、复制、修改等,具体如下:

(1)提供加密接口,对用户数据进行加密;

(2)基于角色的数据保护策略:

角色

级别

职责

备注

安全管理员

1

系统初始安装,创建账户,分配/删除系统管理员账户

系统新建时默认的管理员,对“系统管理员”进行授权

系统管理员

2

管理整个云存储系统:

网段,存储群和节点;更换坏盘和硬件;

对“租户管理员”进行授权

租户管理员

3

在给定的空间内进行策略配置,UserID分配等工作;

对“子租户管理员”进行授权

子租户管理员

4

在给定的空间内创建用户,重构策略;

(3)策略化数据管理,管理员通过可视化界面,进行策略配置,从而实现诸如:

◆创建不同的策略等级(金牌,银牌,铜牌……);

◆配置不同的用户对应不同的服务等级,或者同一用户的不同数据对象拥有不同的服务等级;

◆同步副本和异步副本数目策略配置,副本压缩,选择存储地的权限

(4)采取冗余手段和版本管理,实现数据恢复和灾难备份:

副本种类

定义

属性

备注

同步副本

数据对象的一个完全拷贝

每个数据对象都有至少一个同步副本

同步副本数量,副本间距离,网络连接情况等都影响响应速度

异步副本

基于某种策略的数据备份

“尽最大努力”进行数据恢复

系统自动进行异步副本的更新,以保持数据一致

2.9磁盘利用率

磁盘利用率指磁盘在提供数据冗余备份功能的前提下,能提供的实际裸存储空间占总空间的比例,该指标反应系统的有效利用率,对投入产出比具有重要的参考意义。

参考目前主流的技术指标,要求云存储提供≥65%的磁盘利用率。

A:

可以被系统管理的空间

B:

系统自行耗用的空间(数据恢复,系统文件等)

要求:

A/(A+B)≥65%

要求支持重复数据删除技术,通过删除重复数据,进一步提高存储空间利用效率。

2.10维护与升级保障

随着未来硬件技术和服务质量的提升,考虑到产品有较长的生命周期,故在此单独提出对维护和升级保障方面的要求:

(1)单个磁盘损坏或故障时需使用新磁盘替换,系统需在4小时之内恢复数据到新替换的磁盘;

(2)单个存储节点损坏或故障,需在24小时内解决并恢复用户访问

(3)当存储空间使用率达到一定额度时,需对存储扩容,存储扩容工作从提出到完成上线,需在2个月之内完成。

(4)工程实施的质量、安全,效率有保障;

(5)主动发现运行中出现的隐形问题和风险,及时提出整改方案;

(6)完善的资料,包括维护手册,版本升级指导书,方案建议书等。

2.11环保功耗

考虑到低功耗,高节能,以获得最大的投入产出比,需要对环保功耗做出一定规格要求,详细如下:

(1)产品硬件通过专业环保测试认证,标准化制作工艺,材质环保无害,使用的耗材环保无害;

(2)参考主流的耗电标准,要求每PB物理存储最大功率不超过30KW;

(3)随着产品生命周期的推进和未来技术发展,对功耗进行持续改进和优化,在未来功耗数据上动态体现该趋势;

(4)每月给出产品功耗统计表,以便观察。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 法律资料

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1