1、 百易存储研究院 中国计算机学会信息存储专委会中国计算机行业协会信息存储与安全专委会 DOIT 传媒 2022 年 4 月 14 日2022分布式存储市场调研报告一、分布式存储的定义与分类 1. 定义 2. 分类二、分布式存储与其他相关技术的关系 1. 与集中式存储的关系 2. 分布式存储、软件定义存储和云存储的关系 3. 超融合市场现状 4. 超融合一体机还是存算分离 ? 5. 从超融合到混合云 ? 6. 纯软件还是软硬一体机 ? 7. x86 还是专用设备 ? 8. 分布式存储是否适用于“关键业务”应用 ? 9. IPFS 分布式存储与去中心化 10. 对象存储的话题三、分布式存储市场状况
2、 1. 分布式存储市场规模 2. 分布式存储市场英雄榜四、分布式存储行业典型的应用场景 1. 电信 2. 汽车制造 3. 医疗 4. 基因测序 5. 高性能计算 6. 卫星遥感 7. 高校 8. 金融 10. 交通 11. 证券 12. 智慧城市 13. 基金五、总结P1P3P12P14P28目录2022 分布式存储市场调研报告 1一 . 分布式存储的定义与分类1. 定义分布式存储发展至今,市场上并没有一个能够被广泛接受并引用的定义。对于分布式存储,百度百科给出的定义是:为了简化用户端的使用,提供了一个分布式缓存系统来提供对此分布式存储系统的访问接口以及本地数据缓冲以降低网络压力。分布式存储系
3、统是将数据分散存储在多台独立的设备上。传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。这个定义或者解释,还非常拗口和难以理解。有几个地方需要说明和解释。首先:分布式存储系统是将数据分散存储在多台独立的设备上,这里的“多台独立的设备”,不要理解成为磁盘或者SSD, 可以理解为x86通用服务器、 Power服务器等, 也可以理解为专门设计和优化的专用存储设
4、备。其中,以 x86 通用服务器最为普遍。为了帮助用户理解分布式存储,百易存储研究院建议用“存储节点”来代替“多台独立的设备”,这里的存储节点,可以是 x86 服务器(或者称为存储服务器、服务器存储)、Power服务器,也可以是专用存储设备,甚至使用传统阵列,其中,最为普遍的还是 x86 通用服务器,其市场较为成熟,非常容易获得,产品性价比非常具有竞争力。其次,“传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈”的表述中,网络存储系统的表述多用于与直连存储(DAS)的区分,主要突出其能够通过网络被多个应用系统共享,网络存储系统又可以划分为:存储区域网络(SAN)
5、和网络连接存储(NAS),是 SAN、NAS 两种存储系统的统称。 这里所说的“存储服务器”主要指的是阵列控制器(也称为机头)+ 盘阵的设计方式,以往多采用专用集成电路芯片(ASIC)设计控制器,经历了双控到多控的变化,控制器与控制器之间采用专用网络连接,控制器与磁盘之间通过专用后端网络连接,从而实现了连接的全冗余架构设计,具有非常高的可靠性和稳定性。也因为如此,系统成本居高不下。2022 分布式存储市场调研报告 2在系统的扩展性上,可以通过盘阵中盘的数量进行调节,系统具有一定的弹性,所谓 Scale Up,也就是纵向扩展,但受制于机头的性能,整个系统仍然存在性能天花板,用户只能够借助入门级存
6、储、中端存储、高端存储的升级来解决问题。根据以上的判断和理解,百易存储研究院认为用传统存储、传统阵列或者传统磁盘阵列的表述更为便于理解。最后,“分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展”的表述中,分布式网络存储系统就是我们要说的分布式存储;可扩展的系统架构更多是指可以通过增加或者删减存储节点所带来的横向扩展(Scale Out)的架构,存储系统的性能可以随着节点的增加或者减少呈现动态变化的特征。这里提到的“位置服务器更好地理解应该是分布式存储中的全局统一命名空间的元数据管理的部分。