当前位置:首页 > 报告详情

02-官维-以智能化评测赋能数据分析:DeepInsight自动化评测集生成与实践.pdf

上传人: 可*** 编号:991586 2025-12-07 34页 5.31MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据标记内容,全文主要内容概括如下: 1. **演讲嘉宾**:官维,蚂蚁数据分析平台评测负责人,主导DI智能化评测体系构建。 2. **背景介绍**:AI+BI领域评测现状与挑战,特别是中文Text2SQL评测的难点,如资源稀缺、语言表达差异等。 3. **业界方案对比**:对比了Spider、SParC、CSpider、DuSQL等评测集,指出其局限性,如数据库规模小、SQL复杂度不足等。 4. **方案设计及优势**:提出基于SQL计算特征和语义表达特征的标注方法,并详细介绍了评测集生成方案。 5. **评测建设结果**:构建了评测体系,开源了500道题,并取得专利和论文成果。评测结果支持本地模型/代理模型评测。 6. **迭代方向**:计划扩展评测能力,包括多轮对话、模糊语义、知识依赖、智能分析等场景,并建设评测榜单。
AI数据分析新利器?" 蚂蚁如何打造智能化评测体系?" 蚂蚁评测集在AI+BI领域的应用!"
客服
商务合作
小程序
服务号
折叠