LOADING...
LOADING...
LOADING...
当前位置: 玩币族首页 > 行情分析 > 全面解读DDS分布式存储白皮书之中心化存储的行业痛点和分布式存储的优势

全面解读DDS分布式存储白皮书之中心化存储的行业痛点和分布式存储的优势

2020-03-05 DDS分布式存储生态 来源:火星财经

IDC和EMC联合发布的“2020年的数字宇宙”报告预测,随着5G传输商用普及,数字数据量的大幅增长,电子产品如智能手机、智能家居、智能笔记本和平板电脑使用的激增以及物联网市场的增长、云计算的普及将驱动全球数据存储市场增长,全球物联网连接数将增长至270亿个,蜂窝连接个数达到220亿个。2020年,全球数字将会膨胀到40ZB,均摊到每个人身上市5200GB以上。全球的存储市场规模达到6万亿美金以上,而80%市场被中国占有。

中心化存储行业痛点

中心化存储行业发展的历史已达二十年之久,为互联网的发展做出底层贡献,但随着5G时代来临,数据的海量爆发和存储需求,人们对传输速度、安全隐私性的需求,中心化存储弊端更加显现。而数据已经形成财团垄断,数据制造者本身并没有拥有数据的所有权和处理权,亦不曾从制造数据上获得相应的知识产权和收益。

1、储存需求难以满足

随着全球信息化产业的高速发展,数据爆发式增长,个人和企业都迫切需要数据中心提高存储容量,同时也需要保证整个业务应用的连续性。这就要求存储资源具有良好的弹性扩展能力,以消除单节点存储能力的瓶颈,保持节点的可扩展性。

2、数据安全存在隐患

目前,异构存储资源的整合还存在着一些发展瓶颈。当前的数据中心大量来自不同厂家的异构存储设备,这些设备的存储空间大多呈现孤立状态,不能形成统一存储资源池,即无法进行统一管理,因此,在一定程度上造成了资源的浪费,提高了运营管理的复杂性。集中化的设备存放也存在相当多的隐患,一旦发生战争、自然灾害,集中化存放设备的管理被损害,数据将永远无法复原,巨大损失不可避免。尤其对于技术研发型的企业,一旦科研数据丢失,意味企业倒闭。

3、存储费用高

由于传统的集中式数据存储方式需要占地、修缮建筑、电力、人力、运营维护成本高昂,导致存储服务费用居高不下,从而增加了需要存储服务的企业和个人的使用成本。若继续使用过去的存储方式,必然需要更多的投入来支持,而存储定价权也只在被垄断的大财团手中。

4、个性化服务不灵活

智能化资源管理的需求不断增长,数据中心需要满足各类应用以及服务快速开发和部署,这就要求数据中心的存储资源能够快速灵活的分配,根据需求进行自动调整,实现存储资源的智能化管理。尤其是5G等新兴科技的发展,个人数据存储需求具有多样化特征,例如社交、下载、多应用同屏等,需要多元化的解决方案。

5、传统的服务机构

对于传统集中存储服务的提供商而言,行业也存在诸多痛点:如数据中心维护工作量大、数据中心运维人员素质要求高、数据中心规划设计专业和复杂性高、常规呈现方式不直观、数据中心建设要求高、交付风险高等。

去中心化的分布式存储优势

分布式存储采用分布式的系统结构,将数据以切片式或粉碎式分散在多台独立存储服务器。它不但提高了系统的可靠性、可用性和存取效率,还易于扩展,将通用硬件引入的不稳定因素降到最低。优点如下:

1、高性能

一个具有高性能的分布式存户通常能够高效地管理读缓存和写缓存,并且支持自动的分级存储。分布式存储通过将热点区域内数据映射到高速存储中,来提高系统响应速度。一旦这些区域不再是热点,那么存储系统会将它们移出高速存储。而写缓存技术则可使配合高速存储来明显改变整体存储的性能,按照一定的策略,先将数据写入高速存储,再在适当的时间进行同步落盘。

2、 支持分级存储

由于通过网络进行松耦合链接,分布式存储允许高速存储和低速存储分开部署,或者任意比例混布。在不可预测的业务环境或者敏捷应用情况下,分层存储的优势可以发挥到最佳。解决了目前缓存分层存储最大的问题是当性能池读不命中后,从冷池提取数据的粒度太大,导致延迟高,从而给造成整体的性能的抖动的问题。

3、多副本的一致性

与传统的存储架构使用RAID模式来保证数据的可靠性不同,分布式存储采用了多副本备份机制。在存储数据之前,分布式存储对数据进行了分片,分片后的数据按照一定的规则保存在集群节点上。为了保证多个数据副本之间的一致性,分布式存储通常采用的是一个副本写入,多个副本读取的强一致性技术,使用镜像、条带、分布式校验等方式满足租户对于可靠性不同的需求。在读取数据失败的时候,系统可以通过从其他副本读取数据,重新写入该副本进行恢复,从而保证副本的总数固定。当数据长时间处于不一致状态时,系统会自动数据重建恢复,同时租户可设定数据恢复的带宽规则,最小化对业务的影响。

4、 容灾与备份

在分布式存储的容灾中,一个重要的手段就是多时间点快照技术,使得用户生产系统能够实现一定时间间隔下的各版本数据的保存。特别值得一提的是,多时间点快照技术支持同时提取多个时间点样本同时恢复,这对于很多逻辑错误的灾难定位十分有用,如果用户有多台服务器或虚拟机可以用作系统恢复,通过比照和分析,可以快速找到哪个时间点才是需要回复的时间点,降低了故障定位的难度,缩短了定位时间。这个功能还非常有利于进行故障重现,从而进行分析和研究,避免灾难在未来再次发生。多副本技术,数据条带化放置,多时间点快照和周期增量复制等技术为分布式存储的高可靠性提供了保障。

5、弹性扩展

得益于合理的分布式架构,分布式存储可预估并且弹性扩展计算、存储容量和性能。分布式存储的水平扩展有以下几个特性:

1) 节点扩展后,旧数据会自动迁移到新节点,实现负载均衡,避免单点过热的情况出现;

2) 水平扩展只需要将新节点和原有集群连接到同一网络,整个过程不会对业务造成影响;

3) 当节点被添加到集群,集群系统的整体容量和性能也随之线性扩展,此后新节点的资源就会被管理平台接管,被用于分配或者回收。

6、 存储系统标准化

随着分布式存储的发展,存储行业的标准化进程也不断推进,分布式存储优先采用行业标准接口进行存储接入。在平台层面,通过将异构存储资源进行抽象化,将传统的存储设备级的操作封装成面向存储资源的操作,从而简化异构存储基础架构的操作,以实现存储资源的集中管理,并能够自动执行创建、变更、回收等整个存储生命周期流程,从而降低了存储采购和管理成本。

原创文章,转载/内容合作请联系DDS分布式存储生态社区客服:pgyzny13;未经许可,禁止转载!

本文来源:DDS分布式存储生态社区
原文标题:全面解读DDS分布式存储白皮书之中心化存储的行业痛点和分布式存储的优势

—-

编译者/作者:DDS分布式存储生态

玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。

LOADING...
LOADING...