当前位置:首页 > 报告详情

14.针对RISC-V异构计算平台的Triton编译优化.pdf

上传人: B**** 编号:963998 2025-11-02 13页 777.87KB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据《Data》标记中的内容,全文主要内容概括如下: 1. **Triton DSL**:一种开源的GPU编程语言,用于神经网络,由OpenAI设计,性能与CUDA相当,是一种块级编程语言。 2. **RISC-V优化策略**:识别可映射到NPU的粗粒度操作,融合和分解操作,将不支持的操作回退到RISC-V,生成异步DMA数据获取,生成结构化内存访问,自动调整块大小,平衡内存带宽和计算功率。 3. **SGEMM内核性能**:在RISC-V和NPU平台上,Triton内核在SGEMM测试中表现出与C内核相当的性能。 4. **关键优化**:自动调整块大小以最大化NPU利用率,用户负责tiling,关键优化针对ML工作负载。 核心数据: - SGEMM 1024x1024 (RISC-V): 6.03秒 - SGEMM 1024x1024 (NPU): 0.02秒 - SGEMM 2048x2048 (RISC-V): 48.15秒 - SGEMM 2048x2048 (NPU): 0.11秒
神经网络编程新利器?" Triton如何提升NPU性能?" Triton与RISC-V谁更胜一筹?"
客服
商务合作
小程序
服务号
折叠