1、陈鑫 阿里云通义灵码技术负责人致力于企业研发效率、产品质量、DevOps方向研究和探索。2011年加入阿里,带领过大数据测试团队、测试工具研发团队、研发平台团队。对研发协同、测试、交付、运维领域都有很深的见解。目前正在带领团队向云原生、极致效率、智能化等领域进行持续演进。演讲主题:AI研发产品进化论:从AI编码助手到AI程序员AI 研研发发产产品品进进化化论论:从从 AI 编编码码助助手手到到 AI 程程序序员员陈鑫 通义灵码技术负责人过过去去一一年年 AI 辅辅助助编编程程工工具具的的发发展展AI 辅助编程工具爆发式增长,呈百家争鸣态GitHub CopilotTabnineAmazon Q
2、CodeiumCursorCody AITONGYI LingmaComateDevinMarsCodeCodeGeexGenieRaccoonBableAI 辅助编程在 Gartner 报告中处于期望顶峰通通义义灵灵码码受受到到广广泛泛开开发发者者的的喜喜爱爱通义灵码的插件下载量超过 500 万为开发者编写超过 10 亿行代码202408202407202311202312202401202402202403202404202405202406202408202407202311202312202401202402202403202404202405202406数据来源:VS Code、Je
3、tBrains 插件市场下载量数据通通义义灵灵码码,你你的的智智能能编编码码助助手手IDE 客户端代码智能生成行级、函数级自动续写自然语言生成代码单元测试生成代码注释生成代码解释生成优化建议生成研发智能问答研发领域自由问答本地工程问答企业知识库问答Terminal 问答异常报错智能排查代码问题排查企业级管理和个性化账号集成和授权管理企业知识管理企业自定义扩展专用网络和推理集群沉浸式编码全工程环境感知生成粒度控制贴合开发者习惯毫秒级生成速度国内唯一入选 Gartner AI 代码助手魔力象限挑战者象限Gartner入选 2024 世界人工智能大会最高荣誉镇馆之宝WAIC首批通过信通院智能化软件工
4、程技术和应用要求CAICT开开发发者者使使用用代代码码助助手手产产品品的的痛痛点点代码生成能不能更准代码补全、智能问答推荐不准反而造成了开开发发者者阅阅读读成成本本,效率更低?能不能理解更更多多代代码码上上下下文文,做出更准确的预测?如何能让写出的代码更符合企企业业的的个个性性化化规规范范?不会写复杂的提示词如何进行胶胶水水层层代代码码批批量量生生成成?如何根据企业内数据库再结合自自然然语语言言生生成成 SQL 语语句句?如何批批量量生生成成测测试试用用例例的的数数据据?按照固定格式要求进行注注释释批批量量生生成成怎么做?不知如何与AI高效对话如何让大模型在已已有有工工程程中完成一个小需求?能
5、不能让AI在原有代码库中自自动动完完成成代代码码修修改改,无需复制粘贴?前端页面有一个缺陷,如何告诉模型,让他来完完成成修修复复?AI一次性生成代码不符合要求,如何让他完成多多轮轮迭迭代代?AI能不能更智能AI能不能自自动动定定位位缺缺陷陷,并完成修复?能不能根据设设计计图图生生成成前前端端可用代码?能不能生成可可用用的的单单元元测测试试代代码码,无需修改?能不能进行批批量量代代码码重重构构、转转换换和和基基础础软软件件升升级级?满满足足开开发发者者诉诉求求的的关关键键技技术术方方向向扩展自定义指令自定义上下文端侧执行引擎数据本地工程数据企业精选数据内部系统数据模型代码基础模型代码Agent任
6、务模型代码补全专用模型智能体单智能体多智能体协同自定义智能体扩展Qwen-Coder 2.5,超过 5.5T tokens 训练,支持 128K 上下文Qwen2.5,超过 18T tokens 训练,支持 128K 上下文通义灵码补全模型通义灵码问答模型持续训练持续训练Qwen-Coder 2.5模型与业界其他代码模型性能对比基基于于Qwen2.5模模型型家家族族构构建建灵灵码码专专用用模模型型全全面面完完整整的的代代码码分分析析实实现现全全工工程程理理解解为为模模型型输输入入准准确确上上下下文文本地服务代码分析会话管理上下文感知代码后处理向量检索执行引擎服务端提示词工程模型路由检索增强知识