当前位置:首页 > 报告详情

史鑫鑫_金融领域大模型数据集管理与应用.pdf

上传人: 探** 编号:711792 2025-06-04 35页 3.15MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了蚂蚁集团在大安全数据研发方面的探索和实践,强调了数据管理的重要性。关键点如下: 1. 提出了Data-Centric AI(DCAI)大模型研发范式,以高质量数据集为核心,迭代大模型性能。 2. 面临业务复杂、数据孤岛等问题,提出了统一数据管理平台,打破数据孤岛,提升数据应用效率。 3. 介绍了数据集、专题、样本库分层管理理念,以及标签化数据管理方式,实现数据精细化运营。 4. 利用CoT(思维链)构建车间,实现高质量样本构建自动化、流程化,提高大模型数据生产效率。 5. 文中提到了结构化、半结构化、图片、视频、音频等多种数据类型的管理和应用。 核心数据:日产高质量CoT样本达到十万+,实现了数据应用效率从“天”到“秒”的提升。
"如何提升数据效率?" "大模型数据管理秘籍?" "AI增强闭环,怎样实现?"
客服
商务合作
小程序
服务号
折叠