1.分布式存储
分布式存储是将数据分散的存储在多台独立的节点上,当有数据请求的时候,通过某种协议进行操作组合。分布式存储,可以拆分为分存储服务、分布式计算两个方面。
(1)分布式计算方案可以分为两类,基于协议的客户端分布式系统、基于协议的服务端分布式系统。客户端分布式算法是比较简单的,也比较好实现。
哈希算法是典型的客户端分布式算法。除了普通的哈希算法,还有一致性哈希算法。一致性哈希算法有多种具体的实现,包括Chord算法,KAD算法等。除了客户端分布式算法,还有服务端分布式算法。PaxosPW与Raft都是服务端分布式算法。
(2)存储服务可以使用内存作为存储介质,也可以使用磁盘作为存储介质。存储服务的经典数据模型有跳跃表、哈希表、B Tree、LSM Tree等。

2.分布式存储与传统存储的区别
以下将对比分布式存储与传统SAN、NAS存储的优缺点:
(1)优点
①性能
在分布式存储达到一定规模是,性能会超过传统的SAN、NAS。大量磁盘和节点,结合适当的数据分布策略,可以达到非常高的聚合带宽。传统的SAN、NAS都会有性能瓶颈,一旦达到最大扩展能力,性能不会改变甚至降低。
②可持续性
传统的SAN、NAS扩展能力受限,一个机头最多可以带几百个磁盘。如果想要个PB以上的共享存储,分布式存储只最好的选择。不用担心扩展能力问题。
③价格
传统的SAN、NAS,价格比较高。特别是SAN网络设备,光纤网络成本比较高。而且,以后扩展还需要增加扩展柜。成本太高。分布式存储只需要IP网络,几台X86服务器加内置硬盘就可以组建起来,初期成本比较低。扩展也非常方便,加服务器就行。
缺点:
①数据一致性问题。对于ORACLE
RAC这一类对数据一致性要求比较高的应用场景,分布式存储的性能可能就稍弱了,因为分布式的结构,数据同步是一个大问题,虽然现在技术一致在进步,但是也不如传统存储设备数据存储方式可靠。
②稳定性问题,分布式存储非常依赖网络环境和带宽,如果网络发生抖动或者故障,都可能会影响分布式存储系统运行。例如,一旦发生IP冲突,那么整体分布式存储可能都无法访问。传统存储一般使用专用SAN或IP网络,稳定性方面,更可靠一些。
③需要比较强的技术能力和运维能力,甚至有开发能力的用户。传统存储开箱即用,硬件由厂家提供,也有完善的文档和服务。而分布式很多是开源或者是有公司基于开源系统提供支持服务,版本迭代比较快,出问题后有可能需要自己解决。
3.分布式存储与集中式存储的区别
(1)视频流上传不同
集中存储:视频流上传到中心。
分布存储:视频流就近上传,对骨干网带宽没有什么要求;可采用多套低端的小容量的存储设备分布部署,设备价格和维护成本较低;小容量设备分布部署,对机房环境要求低。
(2)对机房有要求不同
集中存储:对机房环境要求高,要求机房空间大,承重、空调等都是需要考虑的问题。
分布存储:对骨干网带宽没有什么要求,可采用多套低端的小容量的存储设备分布部署,设备价格和维护成本较低;。小容量设备分布部署,对机房环境要求低。
(3)物理介质分布不同
集中存储:物理介质集中布放。
分布存储:物理介质分布到不同的地理位置。
以上梳理了分布式存储的定义及其与传统存储、集中式存储的区别,希望对你有所帮助,如果你想了解更多相关内容,敬请关注三个皮匠报告的行业知识栏目。
推荐阅读:
百易存储:2022分布式存储市场调研报告(30页).pdf
分布式存储产业方阵:分布式存储发展白皮书(2022年)(60页).pdf
分布式存储概念是什么?有哪几种类型?关键技术介绍