当前位置:首页 > 报告详情

030-赵正朋.pdf

上传人: 山哈 编号:725302 2025-07-04 15页 443.36KB

1、演讲者:赵正朋职位:软件工程师兆松科技(武汉)有限公司利用人工智能大模型优化RISCV编译器性能Terapines Confidential110/8/2024传统编译器优化现状 添加优化参数 调整各个优化执行的顺序 通过分析汇编代码找出优化不佳的代码片段进行修复针对目标平台特性进行调优 针对平台特性进行优化编译器优化算法已经较为成熟,现代编译器常常使用以下手段进行调优:Terapines Confidential210/8/2024使用优化参数进行调优使用编译器O3优化coremark程序:gcc-O3 core_main.c core_matrix.c core_util.c core_l

2、ist_join.c core_portme.c core_state.c-o coremark使用额外调优参数将coremark程序跑分再提升20%:gcc-O3 -Ofast-Wno-int-to-pointer-cast-mbranch-cost=1-mstrict-align-funroll-all-loops-ftree-dominator-opts-fselective-scheduling-finline-functions-falign-functions=12-falign-jumps=7-finline-limit=800 -fno-common-fno-tree-vect

3、orize-fno-tree-loop-ivcanon-fgcse-las-param=max-loop-header-insns=4-param max-jump-thread-duplication-stmts=14 core_main.c core_matrix.c core_util.c core_list_join.c core_portme.c core_state.c-o coremark但是该参数组合对其他程序却没有优化效果甚至有反效果!Terapines Confidential310/8/2024使用大模型自动调优大模型选择参数编译运行获取数据评估反馈使用大模型,根据输入代

4、码特性选择参数。可以降低优化参数的使用门槛,最大化编译器的优化性能。针对不同的基准测试程序,与O3优化相比,最终加速比在 1.15 倍到 2.82 倍之间。源代码输出最优参数组合Terapines Confidential410/8/2024使用大模型自动调优大模型选择参数编译运行获取数据评估反馈优势:参数组合极其复杂,使用大模型可以在有限时间选择出较好的参数组合可以根据源码特性选择不同的参数组合源代码输出最优参数组合难点:源码输入较大参数优化效果和编译器版本相关Terapines Confidential510/8/2024优化算法执行顺序编译器使用预先定义好的顺序来执行各个优化算法,这些顺

5、序根据经验而来,对不同的代码有不同效果Terapines Confidential610/8/2024优化算法执行顺序大模型选择优化顺序编译运行获取数据评估反馈目前的优化顺序高度依赖于编译器工程师的经验,很难调整出一个最优的顺序。使用AI模型寻找最优的优化执行顺序。针对不同的基准测试程序,与O3优化相比,最终加速比在 1.1倍左右。源代码输出最优顺序Terapines Confidential710/8/2024优化算法执行顺序大模型选择优化顺序编译运行获取数据评估反馈源代码输出最优顺序优势:可以选择最优的优化顺序可以根据源码特性选择不同的优化顺序难点:部分优化算法之间有依赖关系选择合适大模型

6、优化算法的实现和编译器版本相关Terapines Confidential810/8/2024代码片段优化foo:addi a0,a0,1 lbu a2,0(a0)sb a2,0(a1)retfoo_opt:lbu a2,1(a0)addi a0,a0,1 sb a2,0(a1)ret编译器工程师在分析代码性能时如果发现了左边的代码片段,则会想办法将其优化为右边的代码片段Terapines Confidential910/8/2024使用大模型生成代码使用大模型学习代码逻辑,直接产生优化后的代码。源代码常用的格式有

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了软件工程师赵正朋利用人工智能大模型优化RISC-V编译器性能的方法。关键点如下: 1. **编译器优化现状**:传统方法包括添加优化参数、调整优化执行顺序和针对平台特性调优。 2. **大模型自动调优**:使用AI大模型选择优化参数,相比传统O3优化,加速比在1.15到2.82倍之间。 3. **优化算法执行顺序**:AI大模型可寻找最优优化执行顺序,提升约1.1倍加速比。 4. **代码片段优化**:大模型直接生成优化后的代码,但存在代码正确性保证的难点。 5. **平台相关优化**:大模型可生成自定义指令,快速支持指令定制化。 总结:文章强调了AI大模型在编译器优化参数选择、优化顺序调整和代码优化方面的潜力,指出了正确性保证是实现全面替代传统编译器的关键难题。核心数据包括1.15-2.82倍的加速比和约1.1倍的优化效果提升。
"如何用AI优化编译器?" "AI调整优化顺序,效果如何?" "大模型定制指令,前景怎样?"
客服
商务合作
小程序
服务号
折叠