分布式存储与传统存储对比分析

分布式存储与传统存储对⽐分析
分布式存储的定义
分布式存储系统,是将数据分散存储在多台独⽴的X86服务器上,通过通⽤的存储协议对外提供FC、ISCSI、RBD、NAS、S3等存储接⼝,每个存储服务器节点既能够进⾏数据存放和性能加速,也同时提供数据控制和存储接⼝对接,没有单点故障,每个节点都可以对外提供数据吞吐,性能随着存储节点的增多会线性上升,分布式存储系统采⽤可扩展的系统结构,利⽤多台存储服务器分担存储负荷,它不但提⾼了系统的可靠性、可⽤性和存取效率,并且易于扩展。存档文件
拓扑架构:
镁钙砖
集中式存储的定义
集中式存储系统指由⼀台或多台主控制器组成中⼼节点,各数据设备级联部署,数据集中存储于这个中⼼节点中,并且整个系统的所有业务单元都集中部署在这个中⼼节点上,系统所有的功能均由其集中处理,中⼼节点统⼀对外提供FC、ISCSI、NAS存储接⼝。也就是说,集中式系统中,每个终端或客户端及其仅仅负责数据的录⼊和输出,⽽数据的存储与控制处理完全交由主机来完成。集中式系统最⼤的特点就是部署结构简单。
拓扑架构:
集中式存储与分布式存储的对⽐
传统集中式存储架构的局限性主要体现在以下⼏个⽅⾯:
1.横向扩展性较差
受限于前端控制器的对外服务能⼒,纵向扩展磁盘数量⽆法有效提升存储设备对外提供服务的能⼒。同时,前端控制器横向扩展能⼒⾮常有限,业界最多仅能实现⼏个控制器的横向。因此,前端控制器成为整个存储性能的瓶颈。
2.不同⼚家传统存储之间的差异性带来的管理问题
不同⼚商设备的管理和使⽤⽅式各有不同,由于软硬件紧耦合、管理接⼝不统⼀等限制因素⽆法做到资源的统⼀管理和弹性调度,也会带来存储利⽤率较低的现象。因此,不同存储的存在影响了存储使⽤的便利性和利⽤率。
3.数据安全
传统存储采⽤RAID安全技术,RAID安全技术已经⽆法满⾜现有数据安全需求,且不能保障跨盘柜的数据安全。⽽且⼀旦硬盘或机柜损坏,等待维修时间较长,有些专⽤存储设备必须等⼚家⼈员维修,不仅耗时⽽且成本较⾼。
4.信息孤岛
传统存储针对各个应⽤系统提供分散的存储解决⽅案,它们相互之间相互独⽴,毫⽆关联,不能实现数据的共享和互通。
5.存储扩容和数据迁移
传统存储多采⽤集中式专⽤存储设备,初次购买的机头就限制了存储的性能和容量,如果需要扩容,必须重新购买。⼀旦寿命将近,还⾯临⼤规模数据迁移⼯作,耗费管理⼈员⼤量精⼒,还有数据丢失的风险。
6.管理问题
分散的存储系统,同样给系统管理⼈员带来更⼤的管理难度和更多的⼯作量。
7.传统存储设备升级、维护成本⾼昂
空气中取水EMC、NETAPP、IBM、华为等在传统存储时代是⾮常成功的产品,当然也有着不菲的价格,后期的升级、维护、配件更换的成本也⼀直被⼈诟病,客户也⼀直有⼀种被的感觉,完全没有给予到消费者应有的⾃由选择权利。⽽且,传统存储的扩容受限于机头性能,⽆法实现线性的⽆限扩容,⽆法满⾜现有存储每年激增的需求。
分布式存储优势:
分布式存储往往采⽤分布式的系统结构,利⽤多台存储服务器分担存储负荷,利⽤元数据定位存储信
息。它不但提⾼了系统的可靠性、可⽤性和存取效率,还易于扩展,将通⽤硬件引⼊的不稳定因素降到最低。优点如下:
1.⾼可靠性
分布式存储整个系统⽆任何的单点故障,数据安全和业务连续性得到保障。每个节点设备之间有专门的数据保护策略,可实现系统的设备级冗余,并且可在线更换损坏的硬盘或者节点设备。
采⽤副本模式对数据形成保护,数据在写⼊后会按需⽣成多份副本,并根据设置将数据主从副本存储在不同的硬盘、服务器、机柜、 机房中,以此保证在硬盘损坏、服务器损坏、机柜损坏、机房故障情况下,数据的安全性以及业务的连续性,⽀持⽤户数据按照设定的1到6副本进⾏冗余存储。布式存储系统可按需设置存储池的保护策略(数据副本数量)以及硬盘离线超时时间,最⼤可⽀持 6 副本。与传统存储 RAID 机制⽐较,数据副本策略可屏蔽由于硬盘损坏⽽造成的数据恢复缓慢、恢复过程中存储卷不可⽤、多块硬盘同时损坏的数据丢失风险,单点故障系统不会丢失数据,带来更⾼的数据安全。通过强⼀致性复制协议来保证数据多个副本的⼀致性。正常情况下保证每个副本上的数据都是完全⼀致的,从任意副本读到的数据都是相同的。如果系统中的某个硬盘出现短暂故障,存储系统会暂时不写这个硬盘上的数据,通过⽇志记录的⽅式,记录此硬盘上数据的变化,等硬盘恢复后通过⽇志信息恢复该硬盘上的数据,如果硬盘长时间或者永久故障,存储系统会将硬盘从存储系统中移除掉,并统计出此硬盘上所有数据的副本位置,将这些丢失数据恢复到其它服务器的硬盘中。
副本技术优势如下:
⽂件多副本同时写⼊物理硬盘后返回前端数据写⼊完成,可增强数据整 体安全性,避免由于机房断电造成的数据丢失。可⾃由设置硬盘离线超时时间,避免硬盘更换后的⼤量数据迁移,保证 业务系统的优先性。数据恢复效率⾼,可⼀⼩时内完成 4TB 硬盘的恢复。对于容量需求较⼤的应⽤我们采取纠删码的磁盘保护技术,EC(Erasure Coding,纠删码)技术是将⼀份数据切分成 N 块原始数据, 基于 N 块原始数据计算获得 M 块冗余数据,并将 N+M 块数据分别存放在存储 系统中的不同存储节点上,当其中任意M块数据(N+M 块数据中任意的M块数据)丢失时,存储系统
可通过数据恢复算法将丢失的 M 块数据恢复,实现冗余和容错的⽬的。分布式存储系统⽀持 N+M 格式的纠删码,⽤户可根据需求⾃定义 N 和M 的数量,N 代表原始数据块数量,M 代表在不发⽣数据丢失的前提下,存储系统所允许发⽣的同时故障的数据块数量,即同时故障的节点数量。
脉动测速中心技术优势如下:
纠删码的存储空间利⽤率⾼,最⾼可达到 90%以上纠删码数据保护机制不对 N+M 做任何限制(服务器数量满⾜的情况下),可确保更⾼的存储得盘率和灵活度。
2.⾼性能95215248
⾼性能,相⽐传统存储⽽⾔提供⾼出数倍的聚合IOPS和吞吐量,另外可以随着存储节点的扩容⽽线性的增长,每个存储节点都可以对外提供业务吞吐,专⽤的元数据模块可以提供⾮常快速精准的数据检索和定位,满⾜前端业务快速响应的需求;提供⾼性能的缓存技术,缓存管理基于SSD Cache ⽽⾮Cache Tier模式,可灵活定义每个HDD与SSD的缓存关系,精确到具体某⼀个SSD磁盘和对应的容量。提供KVM及XEN虚拟化平台的专⽤RBD⾼速存储接⼝,其中RBD能提供更为优异的低延迟、⾼IOPS带宽,确保虚拟化平台的⾼性能,对虚拟化架构的RBD接⼝进⾏优化设计,性能更⾼。
3.⾼可⽤
从控制层⾯、数据层⾯和访问层⾯提供⾼可⽤保障,确保没有单点故障,为iSCSI、FC传统企业接⼝设计了MPIO功能,为ISCSI提供VIP功能,提升数据链路可⽤性,当其中⼀条路径发⽣故障时,数据⾃动切换到另⼀条路径上,链路恢复时⾃动切换回来,切换过程中业务不感知存储的但路径故障。集硬件异常时,或者进⾏硬件更换维护时,分布式存储进⼊recovery 状态,分布式存储能对Recovery IO进⾏控制,并制定策略,根据⽤户需求保证业务IO或Recovery IO正常进⾏。
4.⾼可扩展
得益于合理的分布式架构,分布式存储可预估并且弹性扩展计算、存储容量和性能。分布式存储的⽔平扩展有以下⼏个特性:
1) 节点扩展后,旧数据会⾃动迁移到新节点,实现负载均衡,避免单点过热的情况出现;
2) ⽔平扩展只需要将新节点和原有集连接到同⼀⽹络,整个过程不会对业务造成影响;
钢管切割3) 当节点被添加到集,集系统的整体容量和性能也随之线性扩展,此后新节点的资源就会被管理平台接管,被⽤于分配或者回收。
5.易扩展
系统可以⽀持在线⽆缝动态横向扩展,在采⽤冗余策略的情况下任何⼀个存储节点的上线和下线对前端的业务没有任何的影响,完全是透明的,并且系统在扩充新的存储节点后可以选择⾃动负载均衡,所有数据的压⼒均匀分配在各存储节点上。
可以⽀持在线扩容,不仅可以垂直纵向扩容,更换⾼性能磁盘或者⼤容量,来纵向提升性能和容量;还可以不断增加节点,线性提升集性能和容量。分布式存储架构具有良好的可扩展性,⽀持超⼤容量的存储:扩容存储节点后不需要做⼤量的数据搬迁,系统可以快速达到负载均衡状态。灵活的扩容⽅式,可以独⽴扩容计算节点、硬盘、存储节点,或者同时进⾏扩容。机头、存储带宽和Cache都均匀分布到各个节点上,系统IOPS、吞吐量和Cache随着节点的扩容⽽线性增加。系统⾃动将每个卷的数据块打散存储在不同服务器的不同硬盘上,冷热不均的数据会均匀分布在不同的服务器上,不会出
现集中的热点。扩容节点或者故障减容节点时,数据恢复重建算法保证了重建后系统中各节点负载的均衡性。
1.开放兼容
遵循软硬件解耦的基本原则,服务器可以采⽤任意品牌,兼容各种服务器品牌,采⽤硬件⽆关设计,对SSD、NVMe等硬盘全兼容,兼容主流RAID、HBA卡。底层⽀持主流Linux系统,RHEL、CentOS、中标麒麟等。⽀持VMware、Xen和Hyper等主流虚拟化技术,并⽀持OpenStack、CloudStack等云平台技术。
2.多应⽤接⼝
分布式存储可提供统⼀存储架构,在⼀套存储系统中实现按需提供块、⽂件和对象融合存储服务能⼒。块存储:提供RBD、SCSI、iSCSI以及FC 标准接⼝,⽀持⼴泛的虚拟化平台和数据库应⽤,提供⾼性能、⾼扩展能⼒,满⾜基础设施、数据库以及开发测试等场景对SAN的需求;⾮结构化存储:提供CIFS、NFS、FTP、S3标准接⼝,以⾼性能、⼤规模横向扩展能为⽤户提供⾮结构化数据共享存储资源,应⽤于海量视频存储、备份归档等场景。
3.存储系统标准化
随着分布式存储的发展,存储⾏业的标准化进程也不断推进,分布式存储针对私有云虚拟化架构可采⽤⾏业标准接⼝(RBD Cinder)进⾏存储接⼊。在平台层⾯,通过将异构存储资源进⾏抽象化,将传统的存储设备级的操作封装成⾯向存储资源的操作,从⽽简化异构存储基础架构的操作,以实现存储资源的集中管理,并能够⾃动执⾏创建、变更、回收等整个存储⽣命周期流程。

本文发布于:2024-09-24 00:23:07,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/131411.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   节点   硬盘   系统
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议