大语言模型在法律领域的应用探索-AICon上海.pdf

编号:175746 PDF 35页 7.55MB 下载积分:VIP专享
下载报告请您先登录!

大语言模型在法律领域的应用探索-AICon上海.pdf

1、大语言模型在大语言模型在法律领域的法律领域的应用探索应用探索演讲人:蔡华华院计算/大模型算法负责人CONTENTS目 录01技术背景02训练和评估03应用框架04应用案例法律大语言模型的相关背景1.1.法律大模型法律大模型|语言模型发展阶段语言模型发展阶段FOUR统计语言模型统计语言模型大规模语言模型大规模语言模型神经语言模型神经语言模型20世纪中叶开始发展,在七八十年代达到鼎盛2020年前后,OpenAI发布了包含1750亿参数的GPT-3模型,展现了卓越的能力第一阶段第四阶段第二阶段ONETWO20世纪末自神经网络发展以来不断发展,包括RNN以及LSTM预训练语言模型预训练语言模型第三阶段

2、THREE2017年前后,Transformer架构的发布成了BERT、GPT等许多预训练模型的基础统计语言模型统计语言模型神经语言模型神经语言模型N-gramRNN预训练语言模型预训练语言模型GPT1.1.法律大模型法律大模型|语言模型发展阶段语言模型发展阶段TWOONETHREE这是文字这是文字这是文字这是文字这是文字这是这是文字这是文字这是文字ChatGPT 在两项试题达到了合格率,其中一项还跟人类水平持平。GPT-4表现“可与人类相媲美”,其在律师资格考试(UBE)分数超过90%考生。1.1.法律大模型法律大模型|大语言模型在法律领域的表现大语言模型在法律领域的表现2023年8月,浙江

3、大学、阿里巴巴达摩院和华院计算联合发布了法律大模型。1.1.法律大模型法律大模型|法律法律大大语言模型语言模型“幻觉幻觉”模型有时会生成不真实或虚构的法律内容和案例,误导用户。可解释性欠缺可解释性欠缺在法律人工智能中,模型的可解释性至关重要。然而,大模型往往是“黑箱”操作,难以让用户理解其决策过程。知识融合不足知识融合不足法律任务通常需要数据驱动和知识指导相结合,通用的大模型在这方面的能力尚显不足。1.1.法律大模型法律大模型|挑战挑战知识检索知识检索增强增强领域知识领域知识融合融合知识图谱知识图谱关联关联法律大语言模型的训练和评估收集了多源异构知识数据,不仅包含6种类型的知识:法条类、案例类

4、、模板类、书籍类、法律考试类、法律日常问答类,我们还以法条和案件法条和案件为中心节点构建了它们的关系图谱关系图谱数据。2.2.训练与评估训练与评估|领域领域数据数据收集收集规则去重语义去重内容过滤人工审查文本抽取标准规范化罪名法条刑期预测法考题解释法院意见案件事实摘要庭审问答角色扮演上下文信息数据数据筛选筛选数据数据改造改造0101数据去重0202质量管控0303结构化敏感信息0202多轮对话0101多样化指令2.2.训练与评估训练与评估|领域领域数据数据清洗清洗2.2.训练与评估训练与评估|领域知识融入模型训练领域知识融入模型训练法律大模型法律大模型显卡集群微调训练需要大量计算资源微调训练需

5、要大量计算资源合理规划资源提升训练效率合理规划资源提升训练效率存储设备网络带宽冻结部分参数高效参数微调高效参数微调 训练数据选择模型基座选择微调训练方法资源需求平衡资源需求平衡 资源需求分析资源需求分析 找到资源需求的平衡找到资源需求的平衡点点获得最佳模型性能和资源利用获得最佳模型性能和资源利用效率效率提升模型性能和泛化提升模型性能和泛化能力能力缓解模型的灾难性缓解模型的灾难性遗忘遗忘2.2.训练与评估训练与评估|参数调优和资源需求参数调优和资源需求增加部分参数重新参数化C为Decoder类模型所需计算量,N为模型参数量,D为数据量质量质量指标指标可靠性可靠性性能指标性能指标F1正确性首字响应

6、时间完整度处理效率相关度功能指标功能指标法律文书检查法律要素抽取法律文书生成法律文书摘要并发路数有效性办案报告生成结构化文书生成法律法规问答案件咨询问答证据链分析司法程序问答案情分析司法决策推理安全性安全性指标指标可维护可维护性性禁止项禁止项内容内容问题项问题项内容内容法律大模型评估指标体系法律大模型评估指标体系2.2.训练与评估训练与评估|法律法律大语言模型评测指标体系大语言模型评测指标体系法律文书检查案件要素抽取法律文书摘要语言理解语言理解0101法律法规问答案件咨询问答司法程序问答法律法律咨询咨询0303法律文书生成办案报告生成结构化文本生成内容生成内容生成0202证据链分析案情分析司法

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(大语言模型在法律领域的应用探索-AICon上海.pdf)为本站 (张5G) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠