1、 之江朱雀图科学计算平台之江朱雀图科学计算平台陈红阳陈红阳之江实验室之江实验室2023-9-7之江图计算中心定位、目标之江图计算中心定位、目标图计算理论与模型、图计算加速器架构及编译环境、单机图计算系统软硬件环境基础理论及软硬件层面基础理论及软硬件层面高并发分布式图计算系统数据存储、任务调度与高效通信、高吞吐图计算引擎、统一编程框架和支撑库高性能高可用系统层面高性能高可用系统层面图计算算法库、图数据管理与应用等大规模高效应用支撑层面大规模高效应用支撑层面2022年6月7日,之江-华科大图计算联合研究中心正式成立。研发全球领先的图计算机系统,全力打造国际一流的图计算创新中心,为实验室打造智能计算
2、国家战略科技力量提供支撑 科研总体规划科研总体规划图计算加速器图计算加速器单机图计算系统单机图计算系统分布式图计算系统分布式图计算系统高并发图计算系统高并发图计算系统面面向向图图计计算算的的通通用用计计算算系系统统(灵活定制)(灵活定制)(高效调度)(高效调度)(超高并发)(超高并发)(高可扩展)(高可扩展)大规模多样化图计算应用大规模多样化图计算应用(以数字反应堆图为牵引以数字反应堆图为牵引)PART 01PART 01第一部分第一部分朱雀图计算平台朱雀图计算平台研究背景与现状研究背景与现状以支付交易图为例,大规模异构图结构十分常见(十亿以上级别的节点,百亿以上级别的边及多维度属性)。辅助E
3、DA设计:将芯片中的电路拓扑抽象为图结构,转化为图计算任务辅助电路缺陷检测,具有高并发计算的挑战性。Gartner Gartner 在在2021 2021 年十大数据和分析技术趋势年十大数据和分析技术趋势报告中预测,到报告中预测,到 2025 2025 年图技术将应用于年图技术将应用于 80%80%的数据和分析创新。的数据和分析创新。图论的起源图的应用图数据:连接的数据分子虚拟筛选:利用图结构表示目标靶点与候选药物之间的相互作用,计算两者之间的亲和力大小,以降低实际筛选化合物数目,同时提高先导化合物发现效率。1现状:业界缺乏科学计算领域的图计算支持业界图计算平台子系统间缺乏协同性大规模图学习的
4、性能较差国产硬件适配度低图计算:下一代人工智能的基石图计算:下一代人工智能的基石图计算是推动人工智能从“感知智能”阶段迈入“认知智能认知智能”阶段的核心要素核心要素;应用场景多样,包括社交网络分析、生物信息领域、道路规划、金融风控、推荐系统等。欧式数据分布规整、结构固定,无法无法灵活的表示事物间的复杂关系事物间的复杂关系;非欧几里得空间非欧几里得空间中的图结构能表征图结构能表征世间万物的复杂关系,具有强大的数据表达能力;图学习算法图学习算法使得机器学习能够应用于非欧几里得空间的图结构中,具备对图进行学习的能力具备对图进行学习的能力。图学习算法包括经典图算法(PageRank、最短路径等),社区
5、检测算法(最大团/clique、联通量计算等),图挖掘算法(频繁集挖掘、图的模式匹配等);近年来提出的图神经网络(GNN),更是将图中的结构和属性信息与深度学习中的特征相结合与深度学习中的特征相结合。图计算已经成为大数据和人工智能领域的主旋律之一2研究背景与现状研究背景与现状驱动和环境适配编译器与支撑库开发工具套件存算一体化算子加速优化分布式内存池化近内存计算图划分图表示元数据图建模图可视化查询与分析开放式编程框架图神经网络训练图模型部署与推理图查询引擎图查询引擎图分析引擎图分析引擎图学习引擎图学习引擎多语言解析执行内存配额优化图分析算法库图分析执行引擎图算法算子库图训练引擎计算育种生物制药交
6、通网络社交网络科学计算集成框架计算资源计算资源硬件适配硬件适配图存储图存储计算引擎计算引擎开发工场开发工场领域应用领域应用之江朱雀:面向科学计算领域的高性能大规模图计算平台之江朱雀:面向科学计算领域的高性能大规模图计算平台平台特色国产硬件适配;内存池化数据直访技术;软硬件协同加速;高效的自研算法;多种GNN框架支持;图神经网络架构搜索;图开发一站式解决方案;名称起源朱雀:南方之神,于八卦为离,于五行主火,取图计算领域大展宏图之寓意。之江朱雀图计算平台之江朱雀图计算平台3 平台演示平台演示 功能模块数据集Schema定义与管理;图数据可视化查询与分析;异构计算集群任务调度;图神经网络训练与调参;