王植萌-开源大语言模型基座在去哪儿网的代码生成应用.pdf

编号:153900 PDF 43页 3.76MB 下载积分:VIP专享
下载报告请您先登录!

王植萌-开源大语言模型基座在去哪儿网的代码生成应用.pdf

1、代码生成模型基座在去哪儿网的代码生成应用王植萌 去哪儿网演讲嘉宾王植萌去哪儿网基础研发团队负责人/技术委员会主席/人工智能委员会公共技术分会负责人专注于SOP+AIAgents大模型应用大模型基座在软件工程领域提效目 录CONTENTS1.代码生成模型基座应用的目的与目标2.代码生成模型的落地策略3.代码生成模型在落地过程中遇到的难点4.问题解决的具体方案和结果5.后续工作展望代码生成模型基座应用的目的与目标PART 01代码生成模型基座的目的与目标数字化转型瘦身AI引领的全流程提效代码生成模型基座的目的与目标需求域开发域测试域运维域根据需求生成checklist/TestCase技术知识管理

2、图谱代码生成代码补全CRUnitTest生成排期助手应用级接口测试生成AIOPS目标:提效20%代码生成模型基座的目的与目标模型基座层提示词工程层CoT层Agent层Multi-Agents层chatGPTGPT4CodeXcodellamastarcoder模板langchainlangchain4jAgentsSpringbootSpringBoot-QUNAR-agents代码生成模型基座的应用策略PART 02代码生成模型基座的应用策略DMAIC原则定义:用户接受率、用户留存率、用户覆盖度度量:用户接受率(NPS)、用户留存率(周活跃用户)、用户覆盖率(相对于工程师全量的覆盖度)分析:

3、哪些场景是用户的痛点(TOP3:需求分析阶段、代码阶段、日常解答问题)提升:围绕需求阶段、开发测试阶段、日常值班来规划场景保持:成本可控,ROI可持续的方式来形成正向循环需求调研与分析代码开发方面DMAIC原则定义:生成、补全代码的BenchMark测试,生成、补全代码的用户接受度,生成、补全代码的应用普及度生成、补全代码在工程师提交代码中的占比度量:用户接受度使用AI开发助手中点击Tab键采纳的数量和生成代码到用户IDE的数量做比来衡量,BenchMark采用QUNAR自定义的业务场景代码问题来作为全集,100分为github-copilot的生成结果,代码提交占比按照工程师接纳行数与其周提

4、交代码行数做比分析:关键节点包括:模型选择、生成速度、上下文输入、返回结果评估、返回结果完整性校验、用户交互时机选择,用户操作结果回收提升:围绕能跑通、可补、可用、有场景用、如何证明自己可用来不断提升保持:监控、统计面板、新模型实验的SOP代码生成模型基座的落地难点PART 03用户对于代码生成工具的负向观点对正常写代码思路有干扰功能不够安全代码补全接受率不高补全太慢与工作环境集成不够补全代码与上下文结合不足代码生成模型的落地难点模型基座:开源、商用?模型部署:大小?是否量化?提示词工程:模板?上下文?光标周围?引用文件、类?返回结果评估:完整?能否编译通过?与用户交互:IDEA?Web?VS

5、Code?与GitHub Copilot插件如何兼容?结果如何度量:试用、推广时机?模型基座Replit_3b6月,AI开发助手首次具备代码补全能力代码补全-开源模型代码生成、CR等功能-微软GPT3.5接口starcoder_15.5b7月,具备中间补全能力codellama_7b9月,代码补全体验达到可用水平,开始进行推广应用codellama_13b11月,代码补全BenchMark与github copilot持平,全司内推荐应用模型部署GPU内存 量化 8bit/4bit吞吐能力 TGI&vllm提示词工程如何构建合理的System Prompt?返回结果评估构建适合本公司实际情况的

6、评价样本1.通过方法注释,生成基础的通用算法2.对于已有方法,生成该方法的方法体注释,包括方法的参数列表注释3.对于无注释的方法,自动根据方法体内上下文生成业务代码,尽量包含日志和监控打点4.对于有注释的方法,自动根据方法体内上下文及注释中的提示生成业务代码,尽量包含日志和监控打点5.打印日志时,自动补全想要输出的占位符变量6.打印监控时,在try catch块中,根据上文成功的正向打点,在catch块补全失败的反向打点7.对于同一个类中的方法调用,自动补全参数列表8.对于同一个类中的方法调用,自动补全完整业务9.自动识别其他类(实体)中的字段,并正确调

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(王植萌-开源大语言模型基座在去哪儿网的代码生成应用.pdf)为本站 (2200) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠