当前位置:首页 > 报告详情

KAPLA:可扩展的 NN 加速器数据流设计空间构建和快速探索.pdf

上传人: 芦苇 编号:651804 2025-05-01 17页 1.51MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文提出了一种名为KAPLA的通用、优化且快速的神经网络数据流调度器。KAPLA通过使用 tensor-centric 指令来探索设计空间,并实现了与传统方法相似的调度质量,但速度更快。文章指出,不同层次之间的紧密耦合是设计探索中的主要困难。KAPLA 的关键思想包括:1)将层间调度与层内调度分离;2)有效验证和估算效率;3)层内堆叠和缓存。实验表明,KAPLA在调度速度和质量上都有显著优势,平均质量损失仅为2.2%,并且能够实现518倍的搜索速度提升。
"KAPLA如何提高神经网络加速器的设计效率?" "如何利用tensor-centric directives快速确定数据流的validity和efficiency?" "KAPLA数据流求解器在神经网络设计探索中的优势是什么?"
客服
商务合作
小程序
服务号
折叠