1、基于大语言模型智能核价的探索与研究2023演讲人:李培圣时间:2023年11月单位:北京软件造价技术创新联盟CONTENTS研究背景PART ONE01典型实践PART TWO02行业应用案例PART THREE03提问&讨论PART FOUR0401研究背景Industry Application Cases行业问题目前随着数字化建设内容的增加,预算核价已经逐步成为信息化工作的重要内容,如何合理评估软件价格,避免廉政风险,成为管理者关注的问题,传统以人工评估为主的评估方式,主要痛点在如下三个方面:费用评估标准不统一,核价标准推广困难:软件项目核价以专家评估为主,对相关标准的遵从依靠评估人员的
2、专业素质,缺乏统一审核、管理流程;12043项目数据资产利用率不高:历史数据包含了大量的需求与造价相关信息,但缺乏统一的整理与利用,未充分挖掘数据价值,发挥数据资产效能。专家经验复制困难,核价效能有待提升:专家核价时,需逐个识别功能点数据,尤其是大型项目模块较多,需识别数据较多,时间成本和误差率较高;标准的作用标准功能点方法标准功能点方法:确定合理的需求粒度需求规格化-方便确认合理工作量软件研发成本软件研发成本=工作量工作量*单价单价工具:通过工具:通过功能点规模功能点规模评估软件费用评估软件费用工作量工作量=规模规模*生产率生产率方法导入的三个阶段深入推广建立方法导入、建立相关管理机制相关人
3、员培训及能力保障基础数据质量保障第一阶段:建立流程66引入智能工具,便于方法推广特殊场景模型构建功能点字典建立第二阶段:推广应用定期历史数据分析并挖掘最佳实践方法有效性评价及机制智能模型优化与评估第三阶段:深入分析方法导入执行策略从感知到量化从局部到全局从人工到智能工具概述系统评估依据 软件工程 软件开发成本度量规范(GB/T 36964-2018)国家标准,内置最新行业基准数据;基于大语言模型等相关技术建立功能点识别/审核模型,帮助企业合理评估软件成本、提高预算审核审核效率;通过后台模型管理功能,既满足用户数据分析、建立模型要求,又为知识转移提供载体,为后续持续优化提供基础。02典型实践In
4、dustry Application CasesGPTGPT模型概述GPT(Generative Pre-trained Transformer)是一种基于Transformer架构的自然语言处理模型,属于预训练模型,采用了无监督的学习方式,能够对大规模文本进行学习和抽象概括,并通过微调的方式用于特定的自然语言处理任务,例如文本生成、语言翻译和问答系统。GPT模型的主要特点是它可以根据输入的上下文来生成下一个词,因此可以用于文本生成等自然语言处理任务。GPTGPT模型概述特征/方法传统机器学习深度学习GPT模型模型结构简单模型,如决策树、SVM层级结构,如CNN、RNN基于注意力的复杂结构处理
5、能力针对特定任务或简单模式强于传统方法,特别是在图像和序列数据上强于传统深度学习,特别在处理长序列文本优化算法梯度下降、线性回归等梯度下降和反向传播同深度学习,但有更高效的并行处理能力预训练与微调通常不存在预训练每个任务通常独立训练大规模预训练后在特定任务上微调数据依赖性依赖于质量良好的特征工程对大量数据的需求增加极大地依赖大数据集预训练长距离依赖处理有限有限,尤其是RNN和LSTM强大,注意力机制有效处理长距离依赖通用性和灵活性较低中等高,同一模型可用于多种任务训练和推理效率通常较高取决于模型和任务训练需要高算力,但推理效率高数据源结构化数据,小规模数据集需要大规模数据集,包括结构化和非结构
6、化数据需要非常大规模的数据集,主要非结构化文本数据质量要求对数据质量和清洗有较高要求对数据多样性和代表性要求更高对数据的广泛性和多样性有极高要求,容错性更好 计算资源密集 数据偏见和不准确性 解释性和透明度不足劣势数据安全问题推理可靠性问题公众信任和接受度威胁 高度通用性 强大的上下文理解能力 持续学习和适应能力优势 技术创新和突破 新应用领域 个性化和定制化服务机会GPTGPT模型的SWOTSWOT分析优化自然语言抽取模型传统模型大语言模型例如:平台用户的管理功能,包括用户查询、新增,修改,删除功能,并管理不同用户所处角色,进行权限分配LLM模型:可以理解句子语义,根据句子含义识别传统模型: