1、基于大模型辅助编程业务实践刘涛 中兴通讯演讲嘉宾刘涛中兴通讯AI算法专家/开源Adlik项目架构师中兴通讯资深AI算法专家,主要研究领域为AI模型并行训练,模型推理优化,高性能计算,异构硬件模型部署等技术,在相关领域取得多项专利,也是 Adlik 开源项目首席架构师,为社区多次贡献代码,撰写多篇模型优化部署领域相关的ORAN组织标准提案,近几年在WAIC,百度WaveSummit,CSDN 1024,LF AI 峰会等活动中宣讲模型部署和优化相关技术,促进AI应用生态圈建设。目前担任中兴AI预研项目经理。目 录CONTENTS1.LLM模型应用支持研发场景分析2.基于LLM模型辅助编程业务实践
2、3.中兴辅助编程应用演示LLM标志着“人工智能”从量变走向质变,有可能重塑众多产业生态3用户认可:主流应用用户数最快破亿美国生物学奥赛前1%GRE 前2%法学院入学考试前10%能看懂梗图更强理解力和逻辑能力在各种考试中名列前茅,人类前10%水准大模型能力:准确捕捉人类意图,理解上下文,有记忆,有常识,具备一定逻辑推理能力接近人类思维模式通用人工智能的奇点时刻将重构众多产业生态LLM标志着“人工智能”从量变走向质变,有可能重塑众多产业生态研发场景研究AI辅助编程,包括自动代码生成、自动错误定位、自动生成测试用例等未来将进一步扩展到需求分析、软件设计等应用场景办公场景研究利用大模型提升内部办公软件
3、和客服的用户体验未来进一步研究各类AI助手,如自动定酒店、会议等,自动生成会议纪要、文档编写等重构办公日常重构办公日常提升研发效率提升研发效率微软office365 copilot,大幅提高办公效率微软github copilot,100+万开发人员使用提升编码效率利用AI赋能研发、通用办公、业务运营核心领域,助力公司全面提效研发类泛AI场景的分析单元测试自动编译 组件组装测试研发提测自动部署转推发布交易线设计系统组装测试需求评审需求分析与分解设计设计开发开发测试测试投产投产需求需求运维运维版本检验项目立项项目立项创建项目开发设计评审投产评审监控及运营事件管理等业务需求流程状态自动化同步状态自
4、动化同步需求管理需求管理 自动拆分把用户需求拆分成产品需求、任务;自动补全扩充、完善需求说明;把一句话需求转化为完整描述需求;补全需求标题、需求 描述、验收标准 自然语言查询/定义 通过自然语言查询复杂的工作项 通过自然语言自动制作仪表板分析设计分析设计 内容生成 自动生成摘要/提纲;自动设计方案文档,画设计图;自动编写创意故事;对内容进行解释,如翻译、简写单词、成语解释等 内容结构化 类结构化的文档 制定改进计划 内容检测 自动转换为格式开发流水线开发流水线 资源智能分配 根据历史运行结果,智能推断当次占用资源,提高资源利用率 故障定位 根据CI运行报错,自动给出故障原因,帮助快速定位问题
5、一键生成 根据用户自然语言自动创建符合用户需求的流水线 根据代码库结构,结合部门代码库和流水线规范,自动生成流水线 通过API调用底层工具,完成流水线的执行cca 漏洞自动治理 针对代码漏洞、引入组件、开源合规、安全漏洞等问题提供一站式解决方案;当前代码存在哪些漏洞/问题,推荐如何治理,无需人工搜索 组件版本依赖 当某个组件要升级,AI推荐建议升级版本和依赖版本,减少人工版本探索时间测试管理测试管理 测试用例代码生成 不同粒度的自动化测试用例代码生成,包括函数级、模块级、功能级、API级、性能级 自动创建测试环境 自动创建测试环境、自动创建测试执行任务并执行、最后生成测试报告 自动生成测试文档
6、 自动创建测试计划 实例化测试记录版本管理版本管理 版本发布无人化 文档自动生成 版本发布审批决策智能化LLM应用平台总体架构代码生成类业务实践:LLM 应用研发范式通识预训练数据集通识预训练数据集基础LLM基础LLM领域LLM领域LLM场景LLM场景LLM行业/领域预训练数据集行业/领域预训练数据集场景/任务精调数据集场景/任务精调数据集LLaMA-7BGLM-6BGPT2LLaMA-13BLLaMA-30BLLaMA-65BGLM-120BChatGLM-130BGPT3GPT3.5GPT4多语言,万亿tokens百亿到千亿tokens百万到亿tokens通识数据预训练占用90%以上算力模