当前位置:首页 > 报告详情

一种数据驱动的图神经网络推理数据流感知在线调度方法.pdf

上传人: 芦苇 编号:651821 2025-05-01 41页 13.66MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文提出了一种基于数据驱动的方法,用于评估图神经网络(GNN)工作负载在多数据流GNN加速器上的延迟。该方法使用梯度提升树进行预测,并通过实验验证了其在在线调度场景中的有效性。关键数据包括:1)在单加速器设置中,预测的数据流配置导致执行时间比最优配置低15%以内;2)在多加速器系统上,所提出的基于预测的调度算法相比于最先进的算法,执行时间减少了83.88%,周转时间减少了99.95%。此外,该方法在预测延迟时具有较低的 overhead,并且能够适应不同大小的图神经网络请求。未来的工作将关注更复杂的在线调度算法,并针对特定硬件系统进行优化。
"GNN加速器如何实现实时推理优化?" "数据驱动方法如何改进GNN的数据流性能?" "如何利用机器学习模型实现GNN在线调度?"
客服
商务合作
小程序
服务号
折叠