1、整数智能信息技术(杭州)有限责任公司杭州浙江大学计算机创新技术研究院/M o l a rI n t e l l i g e n c e整数智能自动驾驶行业解决方案/M o l a rI n t e l l i g e n c e企业介绍整数智能人工智能行业的数据领航员整数智能人工智能行业的数据领航员/M o l a rI n t e l l i g e n c e产品服务数据集构建服务(ACE Service)智能数据工程平台(ABAVA Platform)01数据集构建服务ACE Service数据采集服务数据预处理数据标注服务成品数据集为什么需要更专业的数据工程平台行业翘楚Tesla的数据
2、工程实践平台5大优势助力自动驾驶数据闭环如何获取我们的数据工具数据采集场地及设备场地设施自研软件整数智能目前拥有合作的智能车辆改制标定场地共1300平,包括一般常规工作场地300平、重型工作场地200平以及标定场地800平为降低相机标定对场地的设施要求,整数智能自研了专用的标定软件平台监控数据采集工作流程以一台车的工作流程为例,整个设计部分一般耗时3-5天;线束改制根据车辆和安装设备不同,一般耗时为1-3周;传感器标定一般为1-2天,软件部署一般在3天内完成,整个系统集成调试部分耗时不超过1周。工作流程数据预处理清洗对齐数据清洗数据对齐抽帧处理根据客户需求对需要标注的视频数据进行抽帧处理数据筛
3、选算法筛选:通过算法对全量待标注的数据进行初步筛选人工筛选:由于算法可能存在一些识别错误、筛选遗漏等的情况,需要在算法筛选的基础上,由人工再进行校对和修正由于采集设备的时钟不同步,各种传感器采集到的数据时间戳可能存在不对齐的问题,进行数据对齐工作以避免后续标注失误数据脱敏对车牌号、人脸等敏感信息进行脱敏脱密处理数据标注全场景覆盖的数据标注能力数据标注如何保障高质量的数据交付?成品数据集极致的数据交付速度整数智能储备了自动驾驶领域多场景的海量数据,为企业用户提供匹配用户需求的成品数据集服务,交付可应用于AI模型训练的高质量数据集,节约重新采集数据、标注数据的时间及人力成本。成品数据集整数智能致力
4、于打造安全稳定的基础数据平台和完善的数字生态体系,已获得多项安全资格认证,做到数据来源可控、数据产权清晰、加密数据隔离、交付数据销毁,全流程保障您的数据安全。整数如何保障您的数据安全?平台经过 ISO 9001/27001 信息安全管理体系认证,全流程保障数据安全平台按流程节点分配权限,对数据采集、标注、审核等分流管理,保证全链路数据加密隔离,交付完成数据会作销毁基于堡垒机、数据管理(DMS)、日志审计(SLS)、数据库安全(DBSS)等系统构建底层安全和拦截手段02智能数据工程平台ABAVA Platform为什么需要更专业的数据工程平台行业翘楚Tesla的数据工程实践平台5大优势助力自动驾
5、驶数据闭环如何获取我们的数据工具数据采集服务数据预处理数据标注服务成品数据集自动驾驶算法的研发,高度依赖数据工程Garbage in,garbage out.数据工程的核心在于,高质量、高效率的数据标注行业翘楚Tesla的实践,数据工程优化带来极致的效率提升Telsa AI Day 2022-https:/ AI Day 2022-https:/ OTA升级的时候被安装5.使用新模型重复上述步骤,形成闭环Tesla的数据闭环行业翘楚Tesla的实践,数据工程优化带来极致的效率提升搭建数据闭环的难点01 数据采集采集车采集:全量采集道路数据,数据量比较有限,无法针对性量产车采集:在用户车端设置特
6、定的触发方式,采集特定场景的corner case数据,并利用这些数据来迭代模型02 数据合规和预处理数据需要进行脱敏脱密等合规性处理进行筛选、抽帧等数据清洗处理03 数据存储04 数据标注自动驾驶领域需要大量有效数据,数据标注一直是耗时耗成本的问题,长期要在控制成本、采用自动化标注提升效率的同时保证数据质量和按时交付05 模型训练需要高效便携的模型训练平台06 测试验证整数智能ABAVA数据工程平台助力自动驾驶数据闭环全域覆盖,专业的数据工具套件全域覆盖,专业的数据采集与清洗工具套件ABAVA平台提供高效的数据采集工具和基于特征提取的数据清洗工具,通过数据云盘、数据集等功能实现数据精准筛选,