当前位置:首页 > 报告详情

codeLLM和RAG技术在OPPO的探索_郑志彤_DataFunCon2024.pdf

上传人: 张** 编号:158357 2024-03-31 44页 2.71MB

1、DataFunSummitDataFunSummit#20242024codeLLMcodeLLM和和RAGRAG技术在技术在OPPOOPPO的探索的探索郑志彤(Liam)-OPPO-AI中心大模型算法部首席算法架构师LLMLLM的缺陷与领域知识的缺陷与领域知识codeLLMcodeLLM和和dataLLMdataLLM的技术创新的技术创新RAGRAG技术落地技术落地展望展望LLMLLM和符号化推理的结合和符号化推理的结合目录目录 CONTENTCONTENTDataFunSummitDataFunSummit#202420240101LLMLLM的缺陷与领域知识的缺陷与领域知识01 LLM0

2、1 LLM的缺陷与领域知识的缺陷与领域知识1.1 LLM的幻觉1.2 LLM的推理鲁棒性1.3 领域知识的特性1.1 LLM的幻觉LLM幻觉的本质是什么?训练阶段:训练数据的共现偏置(co-occurrence bias)精调阶段:精调对齐时过短的上下文QA推理阶段:不恰当的prompt会导致雪崩效应(snowball)1.1 LLM的幻觉LLM本身能不能消除幻觉?不能,因为LLM是个端到端的神经网络,通过学习基于上下文的token概率来拟合训练数据,即使是训练数据无偏,也不可能捕获到小概率重要事件。1.1 LLM的幻觉如何缓解LLM的幻觉?RAG是其中最重要的一种方法。1.2 LLM的推理鲁

3、棒性Transformer的ICL能力。1.2 LLM的推理鲁棒性LLM推理的顺序性。1.2 LLM的推理鲁棒性如何提升LLM推理的鲁棒性?数据增强(data augmentation),更优的ICL网络架构。1.3 领域知识的特性非结构性领域知识实时信息文本、操作规范文档等1.3 领域知识的特性结构性领域知识数据库、知识图谱、QA对等1.3 领域知识的特性专家系统带有完全正确推理能力的知识库DataFunSummitDataFunSummit#202420240202codeLLMcodeLLM和和dataLLMdataLLM的技术的技术创新创新2 codeLLM2 codeLLM和和dat

4、aLLMdataLLM的技术创新的技术创新2.1 基模型选取2.2 非结构领域知识调优2.3 结构领域知识调优2.1 2.1 基模型选取基模型选取需求:帮助开发者文生代码、代码补全、代码注释、单元测试、代码 bug 检测,从而提高研发效能。选取标准:code/data能力强,NLP能力也要强,对齐提升潜力大。2.1 2.1 基模型选取基模型选取基线模型对比表模型名称模型名称starcoderBasestarcoderBasecodeLLAMAcodeLLAMAdeepSeekCoderdeepSeekCoder参数量15B7B、13B、34B、70B1.3B、5.7B、6.7B、33B网络架构

5、LLaMA1LLaMA2LLaMA2预训练数据1T-code及相关英文文本,35B-python620B tokens(500B(85%+8%+7%)、100B python(75%+10%+10%+5%)、20B 长code)2T tokens(70%code、10%StackExchange、7%NL-code、7%NL-math、6%NL-zh-en)预训练方法LLaMA1预训练方法在LLaMA2上继续训练,FIM、LCFT(16K)4k(1.8T)、16K(0.2T)zeroShot指标HumanEval:30.4MBPP:49.0HumanEval:31.7MBPP:41.6Huma

6、nEval:48.2MBPP:55.2HumanEval:49.4MBPP:60.6HumanEval:56.1MBPP:66.02.1 2.1 基模型选取基模型选取调优模型对比表模型模型名称名称starcoderstarcoderwazardcoderwazardcoderPanGu-PanGu-Coder2Coder2CodeFuse-CodeFuse-CodeLlama-34BCodeLlama-34BdeepSeekCoder-deepSeekCoder-instructinstructNSQL-Llama-NSQL-Llama-2-7b2-7b参数量15B15B15B34B33B7B

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了OPPO在2024年的DataFunSummit中,关于codeLLM和RAG技术的研究和应用。文章指出,LLM虽然强大,但存在幻觉和推理鲁棒性不足的问题,RAG技术是解决这些问题的有效方法。OPPO团队通过精调基模型和构建特定领域的数据集,优化了codeLLM和dataLLM的技术,特别是在非结构化和结构化领域知识的应用上。此外,RAG技术也在实时信息场景和code三方依赖场景得到了落地实践。最后,文章展望了LLM和符号化推理的结合,提出了构建价值观和逻辑结构的重要性。
"LLM缺陷与领域知识探究" "codeLLM与dataLLM技术创新" "RAG技术落地与未来展望"
客服
商务合作
小程序
服务号
折叠