1、基于 DPU 的高性能存储网络技术报告编号 ODCC-2024-03001基于基于 DPUDPU 的高性能存储的高性能存储网络技术网络技术报告报告技术白皮书技术白皮书2024.09 发布开放数据中心标准推进委员会基于 DPU 的高性能存储网络技术报告I版权声明ODCC(开放数据中心委员会)发布的各项成果,受著作权法保护,编制单位共同享有著作权。转载、摘编或利用其它方式使用 ODCC 成果中的文字或者观点的,应注明来源:“开放数据中心委员会 ODCC”。对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC 及有关单位将追究其法律责任,感谢各单位的配合与
2、支持。基于 DPU 的高性能存储网络技术报告II编写组项目经理:项目经理:许豪豪中国移动通信集团公司工作组长:工作组长:何泽坤腾讯科技(深圳)有限公司贡献专家:贡献专家:程宇中国移动通信集团公司肖爱元中国移动通信集团公司房梽斅中国移动通信集团公司储琴琴中国移动通信集团公司董少杰中国移动通信集团公司覃小娜中国移动通信集团公司裴照华中国移动通信集团公司张耀华中国移动通信集团公司高坚中国移动通信集团公司许豪豪中国移动通信集团公司刘子轶中国移动通信集团公司曹辉中国移动通信集团公司王少鹏中国信息通信研究院孙聪中国信息通信研究院基于 DPU 的高性能存储网络技术报告III目录版权声明.I编写组.II一、存
3、算分离数据中心架构.1(一)NVMe-oF 网络存储协议.2(二)存算分离数据中心面临的存储问题.3二、基于 DPU 的高性能存储架构及关键技术.4(一)RDMA 网络.61 RoCE 技术.72 RDMA 技术.8(二)NVMe over Fabric.10(三)DPU 核心技术.11(四)DPU 实现 NVMeoF 虚拟存储卸载.12三、基于 DPU 的高性能存储架构应用场景.14(一)裸金属场景.15(二)虚拟化场景.16四、挑战与展望.18基于 DPU 的高性能存储网络技术报告1一、一、存算分离数据中心架构存算分离数据中心架构数据中心是提供算力的重要基础设施,提供数据存储、传输、计算等
4、多种服务。以存算融合的整机作为数据中心的服务节点,一旦发生计算和存储不一致需求时,存在资源扩展不灵活、利用率低下等问题1。存算分离是一种新型数据中心架构,其架构如图 1 所示,通过将计算和存储资源拆分为独立的资源,协同整合以提高系统的可扩展性和灵活性。在这种架构下,计算集群和存储集群分别承担计算和存储的任务,彼此独立运作。存储集群通过存储系统对存储资源进行管理和分配,计算集群通过网络访问存储节点,进行数据读写和计算操作。数据中心的存算分离架构可以提高存储资源的利用率、可靠性和灵活性,降低存储成本和维护难度。图 1 数据中心存算分离架构在数据中心存算分离架构中,计算和存储节点之间的网络连接和数据
5、传输速度至关重要,需要使用高性能、低延迟的网络技术和协议。基于 DPU 的高性能存储网络技术报告2存算分离式数据中心常用的网络协议为 TCP(Transmission ControlProtocol,传输控制协议)和 RDMA(Remote Direct Memory Access,远程直接内存访问)协议。TCP 协议作为计算节点和存储节点之间的通信通道,用于数据读写和控制命令传输,保证可靠性传输,提供灵活性和易用性;RDMA 则连接存储服务器,包括块服务器和块存储服务器,支持大规模存储服务,允许数据直接从存储设备的内存中传输到计算机内存中,可旁路 CPU 控制。为支持更高性能的高速存储设备,
6、网络存储协议 NVMe-oF(NVMe over Fabrics,基于网络的非易失存储介质接口)被广泛采用,旨在解决传统网络存储协议在高速存储设备上的性能瓶颈。(一)(一)NVMe-oF 网络存储协议网络存储协议NVMe 是面向基于 PCIe 的 SSD 设计存储接口协议,使用多队列机制来管理和优化数据传输和处理,可以极大地提高存储系统的性能和效率。NVMe-oF 协议基于 NVMe 协议设计的高性能、低延迟的网络存储接口协议,支持数据中心和企业级存储系统进行高效数据访问。NVMe-oF 架构包括包括 NVMe 网络存储、传输层绑定、NVMe 传输层以及网络层。基于 DPU 的高性能存储网络技