《13.翼华自研RISC-V Core在DPU上的运用.pdf》由会员分享,可在线阅读,更多相关《13.翼华自研RISC-V Core在DPU上的运用.pdf(10页珍藏版)》请在三个皮匠报告上搜索。
1、翼华自研RISC-VCore在DPU上的运用演讲者:胡昭明翼华科技(北京)有限公司通算场景(CPU+NPU)RISC-V-生态分析GCC/Glibc/LLVMJVM/PHP/GoDPDK/GFS/SPDKMySql/OFFICE/MogoDBVmware/DockerToolchainStorage&NetworkOperatingSystemVirtualizationLanguage&LibraryApplicationsLinux/Ubuntu/FreeBSD生态成熟生态待建随着生态建设逐步完善,翼华科技现有技术能力及产品可支持云边端全场景落地智算场景(SmartNIC/SuperNIC
2、)SmartNIC产品-国内首款RISC-V智能网卡成功商用落地SuperNIC/DPU产品-预计2026年出货市场-技术-产品-循环驱动SmartNIC产品化SuperNIC/DPU工程实施中生态E-RDMA已产品化E-P4已产品化E-RISCV在工程实施中在运营的智算集群部署首款RVCore的智能网卡技术RDMA高性能RISC-V产品SmartNICSuperNIC市场智算集群建建 设设培培 育育反反 哺哺访存/卸载性能的优化主要通过指令集扩展、微架构设计和软硬件协同来应对高带宽、低延迟和能效比的需求。RISC-VbasedDPU软件栈优化向量化库函数使用RVV优化的memcpy/mems
3、et,加速数据初始化。零拷贝网络栈通过DPDK/SPDK,数据包DMA到用户空间VectorExtension批量加载/存储:单条指令完成多数据搬运,减少指令开销。掩码访存:仅处理有效数据(如稀疏矩阵运算),避免无效内存访问。跨步/索引访存:支持非连续数据模式(如vlse32.v跨步加载图像数据)。CustomizedInstructionsExtensions加解密指令计算加速指令指令集扩展软硬件协同RISC-V+Networking软件生态现状(2024)-成熟期In-networkComputingVirtualizationCongestionControlAlgoSoftware-d
4、efinedSecuritySoftware-definedStorageSoftware-definedNetworkingAccelerationEngines(Mem2Mem,Gemm)SuperNIC翼华DPDK开发内容l内存拷贝优化使用V扩展指令优化rte_memcpy()/rte_move()函数,提升内存拷贝性能。lCRC计算优化使用V扩展指令优化CRC16/CRC32函数,提升CRC计算性能。DPDK with RISC-V based DPUDPDK生态现状l支持RV64I,M,A,F,D,C扩展指令l支持内存屏障l支持获取TSC频率l未支持V扩展指令SPDKwithRISC
5、-VbasedDPUSPDKwith翼华DPUlDPDK库支持翼华RVV扩展指令,提供高效的内存拷贝、CRC计算等操作l利用RISC-V的A扩展指令集,减少NVMe/RDMA发送队列(SQ)和完成队列(CQ)的指针更新的延迟(避免锁)l利用RISC-VV扩展指令批量处理完成队列(如一次性处理多个CQE),减少循环开销l通过RISC-V中断特性减少SPDK中的NVMeCQ的轮询开销l利用RISC-V的自定义中断控制器(如PLIC+CLINT),在低负载时将轮询切换为中断模式,通过wfi指令降低功耗l将中断从M-mode委托到S-Mode,减少中断处流延迟技术创新亮点自研SoC芯片支持自定义加速E
6、ngine,用于加解密计算和网络卸载支持cluster内部RISC-VCores的coherence互联支持cluster之间的coherence互联支持Cores的non-coherence互联支持多芯片互联支持SockettoSocket双路互联技术建设主要内容RISC-VCPU的微架构设计RISC-V扩展指令集定义和设计Coherent片内/片间互联总线设计CPUDie集成CPUDie中后端实现自研CPUcore设计符合RVA23指令集合,支持RISC-VI,M,A,F