曙光ParaStor300S并行分布式云存储系统产品技术白皮书V1.6

曙光ParaStor300S并⾏分布式云存储系统产品技术⽩⽪书V1.6
信息技术的发展带来数据的爆炸性增长,⽏庸置疑,我们已经全⾯跨⼊⼤数据时代,PB 规模的⾮结构化数据越来越常见,如何有效地管理这些数据,并进⼀步发掘数据价值,已成为IT 管理者所必须重视的问题。同时⼤数据4V 特性也对存储系统的⼤容量、⾼性能、易扩展、易⽤性等提出了更⾼要求。传统的SAN 和NAS 存储架构已经难以满⾜海量数据的密集型I/O 并发访问需求。 ParaStor300S 并⾏分布式云存储系统,是在曙光公司近10年来海量数据存储与处理的基础之上,针对⼤数据时代的特点,全新设计并全⾯优化的⾼端存储系统。产品定位集⽂件/对象统⼀存储基于曙光完全⾃主研发的并⾏分布式软件ParaStor 构建的集存储系统,对外统⼀提供多种存储协议:提供⽂件存储服务,包括Linux POSIX 、NFS 、SMB 、FTP 等,满⾜Windows 、Linux 、Unix 等异构平台的不同访问需求;提供对象存储服务,兼容Amazon S3接⼝,满⾜云⽣态的应⽤需求。特别地,同⼀集可以同时提供⽂件/对象接⼝,访问⽅式更为灵活。 Scale-Out 横向扩展的并⾏架构基于服务器构建的并⾏分布式存储系统,对外提供单⼀的命名空间。⽀持3~4096节点的弹性⽆缝扩展,单⼀存储空间容量可扩展⾄EB 级。具备超强的横向扩展能⼒,只需简单地增加存储节点,即可获得更⼤的存储容量和更多的数据通道,从⽽获得更⾼的系统聚合带宽和I/O 性能。⾯向海量⾮结构化数据存储场景 ParaStor300S 并⾏分布式云存储系统适⽤于存在数据共享需求的多种应⽤领域,如⾼性能计算、⽣物信息、⽓象预报、环境监测分析、地震监测、能源勘探、卫星遥感、视频监控、媒资管理、视频编辑处理等,可以⼴泛应⽤于政府、教育、科研、医疗、⽯油、⼴电、企业等⾏业。 ParaStor300S 并⾏分布式云存储系统
新⼀代⾃主研发的海量⾮结构化数据存储 EB 级共享空间
3~4096节点
单⼀命名空间
按需分配,在线扩容
多种访问协议 ? Linux POSIX
NFS/CIFS/FTP
S3
多款硬件平台
2U12、4U24、4U36
SATA/SAS/SSD 混插
智能存储策略
SSD 读缓存加速
细粒度配额管理
多重数据保护
2~4副本
N+M:b 纠删码
快照
全冗余设计,⽆单点故障
简易运维管理
多套集统⼀管理
资源、状态实时监控
邮件、短信、SNMP 告警
系统架构 ParaStor300S 并⾏分布式云存储系统(下⽂简称为ParaStor300S )的整体逻辑架构如图 1所⽰:
NFS CIFS FTP 硬件节点层数据处理层应⽤协议层
dcns
KAMEWA
存储节点池Node Node …...Node Node Node …...Node 存储节点池
Node Node …...Node Node Node …...Node
POSIX S3
UNIX/LINUX Windows 图 1 系统架构
ParaStor300S 基于服务器构建,多个节点构成硬件资源池;数据处理层将硬件资源池统⼀管理,对外提供单⼀的命名空间;通过POSIX 、集NAS (NFS 、CIFS 、FTP )、S3等协议供上层应⽤访问。
ParaStor 分布式⽂件系统是数据处理层的核⼼软件,⾃下⽽上包含多个⼦模块,分别包括:
磁盘管理:全新设计的本地对象管理系统,负责管理物理介质并通过抽象简化向上层调⽤者提供通⽤的访问
接⼝;
数据管理:有效管理元数据、数据,整合存储资源,对外提供统⼀的存储空间; ?
马瑞兴
数据保护:对数据提供跨磁盘、跨节点、不同级别、不同维度的冗余保护,保障系统的⾼可⽤性; ?
存储策略:SSD 读缓存加速、配额管理等; ?
协议管理:并⾏处理所有客户端的数据访问请求; ? WebUI 管理:提供统⼀的控制管理界⾯,⽤以管理整个存储系统。
ParaStor300S 默认采⽤全对称架构,存储节点⾓⾊相同,最⼩3个节点起配,最⼤⽀持4096个节点。多个存储节点构成节点池,同⼀节点池中的OStor 配置相同。
(ParaStor300S 也可以部署成⾮对称架构,元数据节点和数据节点相互分离)
技术特点
单⼀命名空间,多协议并发访问
全局单⼀命名空间可以为⽤户构建EB 级容量的虚拟存储池,所有客户端可以在同⼀个命名空间下共享访问所有的数据,可以简化海量数据管理的复杂性。
ParaStor300S 架构中,存储节点构成节点池,同⼀节点池划分为多个存储池,将物理资源进⾏统⼀管理和池化,
在存储池的基础上再次划分为不同存储卷(⽂件系统),实现多层级细粒度的资源管理⽅式。
ParaStor300S对外⽀持多种存储访问协议:
POSIX:提供符合标准POSIX语义的⽂件系统接⼝,是ParaStor300S提供的内核态的Linux私有客户端访问协议,⼀般适⽤于⾼速⽹络的⾼性能计算应⽤领域。
集NAS:通⽤的⽹络⽂件系统接⼝,⽀持NFS、CIFS/SMB、FTP;业务客户端⽆需安装任何代理程序,按照标准协议挂载后,即可访问;使⽤简单便捷,适⽤于绝⼤多数的⾮结构化数据共享的场景。
S3:兼容Amazon S3访问接⼝,适⽤于对象接⼝应⽤场景。
同⼀集可以同时提供POSIX、集NAS、S3对象接⼝,满⾜前端不同的业务应⽤。
性能卓越,线性增长
ParaStor300S是⼀款基于对象的分布式集系统,数据切⽚成固定⼤⼩的对象,条带化地分布到多个
存储节点的多个磁盘上,提供并发的传输通道实现并⾏的I/O访问,有效地提⾼了存储系统的读写带宽和IOPS。同时系统聚合性能随着节点规模的增加⽽线性增长,消除传统的Scale-up纵向扩展存储架构的性能局限性。
除此之外,ParaStor300S通过多项技术进⼀步提升性能:
内部⾼速互联:集内部⽹络采⽤⾼速⽹络,基于⾼速传输协议,获得更⾼的带宽、更低的延迟。
内核态POSIX协议:在⾼性能应⽤领域中,可以采⽤内核态的私有客户端协议,并发访问能⼒更强。
SSD Cache:存储节点配置⼀定数量的SSD,作为本地节点的⼆级读缓存,提升数据随机访问性能。
全冗余架构,稳定可靠
可靠性是存储系统的基本要求,尤其对于中⼤规模的分布式系统,稳健性更是重中之重。ParaStor300S采⽤冗余架构设计,从部件、⽹络、节点、数据冗余等各个层⾯保证数据的安全性及系统的稳健性。
部件可靠性
光纤陀螺
ParaStor300S基于曙光服务器构建,选⽤的是曙光当前阶段最为成熟、稳定且市占率很⾼的硬件产品,主要部件均是冗余配置,单个部件的故障不会影响整个节点的正常运⾏。同时ParaStor300S系统的WebUI管理界⾯集成了部件的监控功能,部件发⽣故障,将给出准确的告警信息,便于⽤户及时定位维护。
系统可靠性
⽀持4096个节点⼤规模部署,4个机柜故障情况下不影响存储系统正常运⾏且数据不丢失。
⽹络可靠性
存储系统采⽤冗余⽹络拓扑,任⼀链路发⽣故障,均不影响系统的正常服务。
节点可靠性
所有节点并⾏提供服务,在冗余规则之内发⽣节点故障,不影响存储服务。
数据冗余
陆正方
ParaStor300S⽀持多副本、EC纠删码两种数据冗余⽅式,可以针对节点池设置不同的冗余策略,保
障数据⼀致性。上传对象时⽀持MD5/SHA256⼀致性校验,下盘后的数据⽀持静默数据扫描。具体⽀持的EC纠删码模式为N+M:b,其中M表⽰存储系统允许任意故障的磁盘数,b代表存储系统允许任意故障的节点数。如6个存储节点,可以配置8+2:1数据冗余⽅式,空间利⽤率可达80%。
快照管理
ParaStor300S⽀持基于⽂件/⽬录的快照技术,针对同⼀⽂件或⽬录创建多个时间点的⽂件映像,实现对快照⽬录/⽂件的内容保留。通过快照回滚,恢复特定时间点的数据。
单⼀集内⽂件快照数量最多⽀持20000个;⽀持对于⽬录的嵌套快照,并具有丰富的快照管理策略,⽀持按照每天、每周、每⽉、每年的粒度设置定期策略;
快照作为⼀种备份容灾技术,可以进⼀步保证⽤户的数据安全。
信息产业部手机查询
SSD Cache
SSD相较于机械硬盘,带宽及响应时间有着明显的优势,并且容量远⼤于普通内存。将SSD作为缓存资源,可以显著降低存储系统的响应时间,有效提⾼数据的访问频率。
ParaStor300S系统中,存储节点配置⼀定数量的SSD,组成介于HDD与内存之间的⼆级本地缓存池。
当SSD作为读缓存时,利⽤SSD盘对随机⼩⽂件读取速度快的特点,通过智能算法将访问频度⾼的随机⼩⽂件热点数据存放到SSD上,应⽤程序再次访问该数据时,可以直接从SSD上获取。由于SSD盘的数据读取速度远远⾼于机械硬盘,因此可以显著缩短热点数据的响应时间,从⽽提升系统的性能。
统⼀管理,简易运维
提供基于Web的图形化监控管理界⾯,提供系统配置管理、监控告警等功能,直观易懂的图形化界⾯⽅便⽤户实时监控系统的状态,简化了安装和维护过程,提⾼了管理效率。
同⼀Web界⾯可以管理多套ParaStor300S,便于多集的统⼀运维。
技术规格

本文发布于:2024-09-24 13:18:39,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/333164.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   节点   管理   提供   存储系统   访问   系统
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议