030-赵正朋.pdf-三个皮匠报告

1、演讲者：赵正朋职位：软件工程师兆松科技（武汉）有限公司利用人工智能大模型优化RISCV编译器性能Terapines Confidential110/8/2024传统编译器优化现状添加优化参数调整各个优化执行的顺序通过分析汇编代码找出优化不佳的代码片段进行修复针对目标平台特性进行调优针对平台特性进行优化编译器优化算法已经较为成熟，现代编译器常常使用以下手段进行调优:Terapines Confidential210/8/2024使用优化参数进行调优使用编译器O3优化coremark程序：gcc-O3 core_main.c core_matrix.c core_util.c core_l

2、ist_join.c core_portme.c core_state.c-o coremark使用额外调优参数将coremark程序跑分再提升20%：gcc-O3 -Ofast-Wno-int-to-pointer-cast-mbranch-cost=1-mstrict-align-funroll-all-loops-ftree-dominator-opts-fselective-scheduling-finline-functions-falign-functions=12-falign-jumps=7-finline-limit=800 -fno-common-fno-tree-vect

3、orize-fno-tree-loop-ivcanon-fgcse-las-param=max-loop-header-insns=4-param max-jump-thread-duplication-stmts=14 core_main.c core_matrix.c core_util.c core_list_join.c core_portme.c core_state.c-o coremark但是该参数组合对其他程序却没有优化效果甚至有反效果！Terapines Confidential310/8/2024使用大模型自动调优大模型选择参数编译运行获取数据评估反馈使用大模型，根据输入代

4、码特性选择参数。可以降低优化参数的使用门槛，最大化编译器的优化性能。针对不同的基准测试程序，与O3优化相比，最终加速比在 1.15 倍到 2.82 倍之间。源代码输出最优参数组合Terapines Confidential410/8/2024使用大模型自动调优大模型选择参数编译运行获取数据评估反馈优势：参数组合极其复杂，使用大模型可以在有限时间选择出较好的参数组合可以根据源码特性选择不同的参数组合源代码输出最优参数组合难点：源码输入较大参数优化效果和编译器版本相关Terapines Confidential510/8/2024优化算法执行顺序编译器使用预先定义好的顺序来执行各个优化算法，这些顺

5、序根据经验而来，对不同的代码有不同效果Terapines Confidential610/8/2024优化算法执行顺序大模型选择优化顺序编译运行获取数据评估反馈目前的优化顺序高度依赖于编译器工程师的经验，很难调整出一个最优的顺序。使用AI模型寻找最优的优化执行顺序。针对不同的基准测试程序，与O3优化相比，最终加速比在 1.1倍左右。源代码输出最优顺序Terapines Confidential710/8/2024优化算法执行顺序大模型选择优化顺序编译运行获取数据评估反馈源代码输出最优顺序优势：可以选择最优的优化顺序可以根据源码特性选择不同的优化顺序难点：部分优化算法之间有依赖关系选择合适大模型

6、优化算法的实现和编译器版本相关Terapines Confidential810/8/2024代码片段优化foo:addi a0,a0,1 lbu a2,0(a0)sb a2,0(a1)retfoo_opt:lbu a2,1(a0)addi a0,a0,1 sb a2,0(a1)ret编译器工程师在分析代码性能时如果发现了左边的代码片段，则会想办法将其优化为右边的代码片段Terapines Confidential910/8/2024使用大模型生成代码使用大模型学习代码逻辑，直接产生优化后的代码。源代码常用的格式有

030-赵正朋.pdf

相关报告