黄宁_让每一分算力都算数——Fast Apply与企业级高效能研发新范式.pdf

编号:1270130 PDF 28页 3.66MB 下载积分:VIP专享
下载报告请您先登录!

黄宁_让每一分算力都算数——Fast Apply与企业级高效能研发新范式.pdf

1、aiXapply模型与企业级算力高效应用方模型与企业级算力高效应用方案案硅心科技(硅心科技(aiXcoder)产品研发负责人产品研发负责人 黄宁黄宁Part 01.问题洞察:算力不够用?换个思路用模型Part 02.技术解析:aiXapply-4B模型 数据训练推理加速Part 03.产品实战:大小模型协作与企业算力资源Part 04.未来展望:aiXcoder场景小模型矩阵Part 01.业界怎么解决这个矛盾业界怎么解决这个矛盾?无论压缩还是蒸馏,核心没变 依然在用同一套参数做每一个任务,不管这个任务是不是真的需要这么大的模型aiXcoder的解法:大小模型协同合的解法:大小模型协同合作作a

2、iXcoder 模型发展路模型发展路径径深耕深耕“AI+软件工程软件工程”领域领域 8 年年 从第一个代码大模型到场景化专精模型从第一个代码大模型到场景化专精模型aiXapply-4B模型实模型实测测AI 编程编程Agent的真正瓶颈不在的真正瓶颈不在生成生成,而在而在应用应用关键洞察:关键洞察:用专门的应用模型来处理应用任务,能大幅提升编程智能体的速度和效用专门的应用模型来处理应用任务,能大幅提升编程智能体的速度和效率率Part 02.定义定义Apply任务:数据格式的选择与设任务:数据格式的选择与设计计数据工程:四阶段流水数据工程:四阶段流水线线原料来自真实代码提交记录原料来自真实代码提交

3、记录 每一次每一次commit 天然就是一组天然就是一组改了什么、改成什么改了什么、改成什么训练策略:跳训练策略:跳过过 SFT,直接强化学直接强化学习习结论:结论:当基座模型已具备基础能力时,直接强化学习比先微调再强化学习更有当基座模型已具备基础能力时,直接强化学习比先微调再强化学习更有效效奖励函数设计:教模型奖励函数设计:教模型改对改对和和不乱改不乱改推理加速推理加速:N-gram 投机采投机采样样Apply 输出输出 90%+是从原文件是从原文件“抄过来抄过来”的,的,推理瓶颈推理瓶颈在串行不在计在串行不在计算算评测结果:准确评测结果:准确率率 x 延迟指延迟指标标泛化能力:换场地、换题

4、型,依然稳得泛化能力:换场地、换题型,依然稳得住住结论结论:1aiXapply不仅在标准测试上击败大模型,在各不仅在标准测试上击败大模型,在各类类 OOD 场景下同样表现强场景下同样表现强劲劲2RL训练路线的泛化优势在跨格式场景中尤为突训练路线的泛化优势在跨格式场景中尤为突出出Part 03.VSCode演演示示需要录制视频,或者使用产品已有的视频!实战总结:大小模型协作实战总结:大小模型协作在在 Apply 任务上已生任务上已生效效Part 04.aiXapply只是第一只是第一步步 场景小模型矩场景小模型矩阵阵不是比谁的模型不是比谁的模型参数更多参数更多,而是比同等算力预算下谁的,而是比同等算力预算下谁的产出更产出更高高三个核心观三个核心观点点

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(黄宁_让每一分算力都算数——Fast Apply与企业级高效能研发新范式.pdf)为本站 (蓝色烟花) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠