LOADING...
LOADING...
LOADING...
当前位置: 玩币族首页 > 币圈百科 > 元宇宙数据存储基建:Memo分散式存储

元宇宙数据存储基建:Memo分散式存储

2021-07-14 分布式点赞 来源:区块链网络

无论展现在我们眼前的宇宙有多复杂,一切却都是由最基础的粒子组成。我们可以想象这个宇宙,上帝就是一个想象力丰富的孩子,基础粒子犹如他手里的乐高积木,这些积木是无限供应的,所以他想要的任意物体都能组合出来。元宇宙也有着同样的相似性,二进制的数字世界里0、1就如同宇宙的基础粒子,这些粒子同样是无限供应的,可以堆砌出我们想要的任意虚拟物体。新的组合不断在产生,积累越来越多,元宇宙里将住满千奇百怪的事物。而与此同时,现实世界里的数据也在持续增长,因为元宇宙的扩展最终都会表现成现实世界里的数据。如果我们将元宇宙的扩展看成无限的,数据的产生就是无限的,与之对应的存储空间的增长也是无限的。

数据相当于元宇宙的肉身,因此与之有关的存储基建便十分重要,并且站在商业角度看,这是一个无限增长的市场。虽然关于元宇宙的话题持续火热,但对元宇宙的数据存储及存储基建讨论目前却还未看到,本文想就此问题进行讨论。

元宇宙的存储是去中心化的

元宇宙的特点就是几乎从感官无法察觉出它的不真实性,想到这里你是否有梦如人生人生如梦的感慨?

元宇宙的到来意味着一个人将拥有两种人生,一种人生由现实中的角色扮演,一种由虚拟的元宇宙里的角色扮演。很难说这两种角色哪个更重要,对有些人来说,元宇宙里的角色甚至更重要,因为那里有现实中没有的一切。

在元宇宙里无论是怎样的物体,现实世界中都以数据的形式存在。因为元宇宙对人的重要性并不亚于现实世界,所以数据的安全性将异常重要。可以想到,如果一段数据记录的是一个人的角色信息,那么如果这段数据丢失,是否和在现实中杀死一个人差不多?

元宇宙的数据安全,当前中心化的存储方式绝对不是一个好的选择。在当前,我们的数据都存储在某个网络服务商的服务器上,服务商对我们的数据拥有绝对的权力。中心化的存储是建立在对存储服务商的信任上,但服务商的一切行为都是出于商业目的,只要不符合他们的商业利益,便有可能对你的数据删除或者篡改。例如曾经的网易博客,随着博客商业价值的降低,网易公司最终关闭了博客服务器,用户从此无法找回他们留在博客上的曾经美好记忆。例如曾经的百度卖吧事件,吧主多年经营起来的血友吧等有商业价值的贴吧,遭到百度公司强行接管。

上面两个事例中我们看到,将数据交由中心化的网络服务商根本无法做到真正的安全,在元宇宙里,这无异于将自己的生命和财富装在别人口袋中。因此,元宇宙的存储必然是去中心化的,数据被保管在一个没有中心节点的存储系统中,这样才能真正保证我们财产与数字生命的安全。

去中心化存储

和中心化的存储相比,去中心化存储的优势不仅体现在数据安全性上,也表现在存储成本、传输速度等方面。因此,基于区块链的去中心化存储正逐渐兴起。

不过就目前已有的去中心化存储项目,如Filecoin、Swarm等并不容乐观,上线后遭到大量质疑。拿Filecoin来说,因为产品设计上的缺陷,导致其几乎不能存储,这是因为Filecoin存在严重的数据丢失风险,并且存储效率低下,一个完整的存储过程需要数小时,因此实际是一个不可用的存储系统。但是,Filecoin的代币激励又是和数据存储相关联的,所以矿工会将一些随机数据存储在上面,以此来产生代币奖励,以存储为名的Filecoin最终存了一堆废数据,沦为一个不产生实际价值的挖矿项目。

对已有的大多数去中心化存储进行了分析,我们认为Memo分散式存储是更好的去中心化存储系统,是更好的元宇宙存储基建,这主要从实验数据和产品设计两方面得出结论。

Memo分散式存储

分散式存储分布式存储和分散式存储是两个看似很接近的名字,两者主要不同便是存储设备的分散程度。分布式存储,所使用的都是集中的数据中心,而分散式存储,所利用的不只有数据中心,也可以同时利用我们日常中的手机、电脑等多余的存储空间。而Memo是目前唯一可以利用边缘存储空间、分散式的存储系统。

在技术上,分布式存储和分散式存储存在一定的传承关系,我们可以认为分散式存储是分布式存储的升级版,因为两者最主要的区别是设备的分散程度。从数量上来说,分布式存储可能利用了100台设备,分散式存储所利用的设备可能是这一数量的N次方。

亚马逊云、阿里云、微软云,这些中心化的云存储系统,其都是分布式存储。其实最早的存储形式是集中式的,所有的数据集中在一个机房。之所以后来发展成分布式的,是因为这样可以让数据更安全。很好理解,数据被存在一个设备上,一旦数据丢失就再也没法找回来,要是同样的数据保存在多个设备上,那么一旦数据在一个设备上丢失,我们还能在其他设备上找回。

上面说,存储由集中式转为分布式最大的益处是数据更安全了,同样的,到了MEMO分散式存储时代,存储设备数量进一步增加,数据的安全性当然更上了一个层次。同时,传统的分布式存储要依靠于中心化的数据中心,数据中心建设周期漫长,且伴有运维成本,而MEMO分散式存储调度使用边缘存储空间,砍掉了这两个大的成本环节,因此MEMO会有更低的存储成本。

Memo分散式存储相关实验

目前,最准确的数据是关于RAFI的。RAFI是MEMO分散式存储在技术领域的创造,由MEMO团队核心成员之一Alex fang提出,相关论文于2018年发表在国际高级计算机系统组织USENIX学术会议上,RAFI被首先用于MEMO。

RAFI由RAFI、ACI、DRPR三项技术共同组成(它们分别是Risk-Aware Failure Identification、Adaptive Check Intervals、Degraded Read with Parallel Recontruction的简称)。

针对RAFI的实验,结果表明,在3副本系统中,相对于传统的数据失效确认策略,在最好的情况下,RAFI可以提高4倍的可靠性,同时引起的额外的修复流量不会超过全部修复流量的1%。对于纠删码系统,高的修复惩罚会导致修复流量的成倍增长,从而极大影响系统的其他服务,因此,在纠删码系统中更多关注的修复流量的问题。实验结果表明,在一个1000节点的RS(6,3)编码的存储集群中,相对于传统的数据失效确认策略,在最好的情况下,RAFI 能够在提升11倍可靠性并降低45%的不可用时间的同时,减少28%的修复网络流量。

针对ACI的实验,结果表明,在一个1000个节点的三副本系统中,在最好的情况下,ACI在RAFI的基础上可以进一步提高3.2倍的可靠性,同时带来的管理节点的检测所消耗的CPU时间增加了18%。

针对DRPR的原型实验,结果表明,大多数情况下,DRPR 的降级读的延迟可以比现有最好的方案低10%以上。

以上是RAFI的实验数据,在产品设计上,MEMO还有两个主要创新点,一是创新数据分层机制,二是创新数据验证机制。从逻辑层面分析,这两点创新同样会使产品的性能相对于原有结构的系统提升。

Memo,更好的元宇宙数据存储基建

单从安全方面考虑,理想的元宇宙必定是去中心化的存储方案。通过对已有的去中心化存储项目进行比较,Memo分散式存储不仅在安全性上,也在其他关键性能,如存储成本、数据传输速度上都体现出明显的优势,因此Memo分散式存储可以作为更好的元宇宙存储基建。而元宇宙的无限扩展性,带来的是数据的无限生长,这便也赋予了Memo分散式存储巨大想象空间。

—-

编译者/作者:分布式点赞

玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。

LOADING...
LOADING...