《王初晴 大模型驱动的人机协同提效实践.pptx-只读.pdf》由会员分享,可在线阅读,更多相关《王初晴 大模型驱动的人机协同提效实践.pptx-只读.pdf(39页珍藏版)》请在三个皮匠报告上搜索。
1、通明湖人工智能开发与应用大会大模型驱动的人机协同提效实践演讲人:王初晴01010202030304040505目录背景新一代智能代码助手介绍企业落地经验案例演示未来展望背景大模型在软件研发领域备受关注50+AI智能编码助手各大公司纷纷下场10小时通过大模型开发愤怒的小鸟虚拟AI工程师:Devin AIAI助力研发提效初显产品突破:GitHub找到了一种绝佳的交互方式 在IDE中通过幽灵字符向开发者展示预测结果,使用Tab采纳,未采纳自动消失 未改变任何开发流程,极其丝滑的将AI能力嵌入到开发者的习惯 百度AI代码生成占比30%Google AI代码生成占比25%亚马逊编码速度提高57%Gith
2、ub Copilot 让代码编写效率提升55%新一代智能代码助手介绍百度研发智能化探索历程20222022年年9 9月月百度内部发布Comate代码推荐工具支持代码实时续写支持内部主流语言和IDE20232023年年H1H1Comate升级代码智能助手上线侧边栏,自然语言生成代码内部全面落地,80%+工程师使用面向社会发布,支持企业试用20232023年年H2H2模型全面升级续写准确率对标Copilot功能丰富度行业领先发布SAAS版,注册企业1万+20242024年年Q1Q1发布2.0版本,支持RAG,上线私域知识增强、工程架构理解上线Comate+开放平台发布个人用户免费版20242024
3、年年Q4Q4发布3.0版本,六大智能体齐亮相代码助手走进智能体时代百度研发智能化探索投入基础建设工程优化数据开发代码语言专家团队建设知识点结构,科学数据配比,训练效果更出色开发团队建设数据,能力建设和数据开发同频开展,更懂真实研发场景模型训练国内顶尖大模型算法和框架研发团队,多层组合优化,拒绝开盲盒强大算力支撑,国内最大算力资源池,一次预训练600-1200万训练成本功能体验百人工程研发团队,多年研发工具开发经验,深入理解研发过程和痛点国家重点研发计划技术积淀,行业先进的研发智能化理念和探索经验落地实践百度内部超八成工程师每天使用,最大功能实验田,数据飞轮高速运转业界独一份月级别快速全公司落地
4、经验,研发效能提升度量方案回答灵魂拷问文心快码 码随心动,快人一步知识:编程现场大数据AI:飞桨文心大模型x调研&技术设计代码测试编码开发智能搜索精准跳转方案推荐代码推荐&生成注释理解&生成代码问答单测生成风险预测修复建议反反馈馈驱驱动动优优化化过过程程创创造造数数据据基于百度文心大模型,在研发全流程全场景下为开发者提供辅助 建议的智能代码助手。结合百度积累多年的编程现场大数据、外部优秀开源数据,帮助工程师更快更好的完成开发任务,官网地址:https:/ 插件市场评分第一Jetbrains 插件市场评分第一百度每100行代码有30行是Comate生成用户满意度超过90%10000+企业注册使用
5、最受欢迎的智能代码助手智能研发能力框架精筛通用研发数据,构造预训练、SFT数据,提升底层模型效果通用研发数据场景化能力数据产研私域知识垂类领域知识ERNIE-Code 3ERNIE-Bot 3.5/4ERNIE-Speed/Lite依赖增强RAG检索增强Agent能力开放与定制化代码续写漏洞识别单测生成代码Review智能CLI代码Debug测试用例生成多端:IDE、Web、Agent场景化:智能化能力与编码、测试、评审、发布等核心场景相融合代码修复代码优化注释生成通过对私域知识的理解增强生成效果,构造更懂你的研发助手构造多种智能化能力,涵盖研发、测试、评审等全流程强化感知,让用户顺畅使用智能
6、能力;多端协同,流量供给核心能力打造专属代码大模型数据清洗代码仓库社区论坛技术文档公开优质代码数据收集数据预处理基于规则清洗敏感词过滤相似代码过滤基于规则格式化代码片段优化超长文件切割圈复杂度过滤语料分级策略语言专家精标规则集超长函数压缩格式化数据基于代码库全局提取架构、依赖基于语法树提取类、函数、属性基于技术文档提取领域设计模型训练模型推理大规模高质代码预训练代码续写代码问答后续补齐训练人类偏好对齐训练监督学习强化学习中间补齐训练复杂任务理解长文代码生成代码续写代码问答代码调优语料代码续写代码问答用户反馈数据训推一体框架块状稀疏掩码注意力计算超长序列分片并行灵活批次虚拟流水线并行多模型结构混