当前位置:首页 > 报告详情

Onyx:稀疏张量代数的可编程加速器.pdf

上传人: c** 编号:465010 2025-01-12 91页 3.40MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了一种名为Onyx的SoC,它旨在灵活高效地加速稀疏和密集数据应用。Onyx通过稀疏加速硬件组合原语来支持任意稀疏张量代数,包括多维张量和多输入复杂表达式。此外,Onyx通过优化计算密度和内存控制器来加速密集应用。文章还介绍了一个端到端的编译器,它将应用程序映射到Onyx上。Onyx与CPU相比,在稀疏库上的能效延迟产品提高了564.6倍,与最先进的CGRAs相比,在密集应用上的能效延迟产品降低了85%。
如何利用Onyx加速稀疏张量代数? Onyx如何优化内存控制器和计算密度? Onyx如何实现对快速演变的应用领域的加速?
客服
商务合作
小程序
服务号
折叠