1、1附件高质量数据集典型案例名单(按推荐单位排序,排名不分先后)序号案例名称申报单位推荐单位1芯片陶瓷封装基板表面缺陷二维数据集东北大学教育部2数字教育应用算法智能诊断公共数据集北京师范大学、中国信息通信研究院教育部3VenusPod 蛋白质序列数据集上海交通大学教育部4中国全球海洋融合数据集 1.0国家海洋信息中心自然资源部5无人机森林防火智能巡护监测系统高质量数据集中国林业科学研究院资源信息研究所自然资源部6建筑机器人作业场景感知视觉高质量数据集构建与应用实践中国建筑第四工程局有限公司、住房和城乡建设部科技与产业化发展中心住房和城乡建设部7“交通+能源”高质量数据集中国交通通信信息中心、中海
2、石油气电集团有限责任公司交通运输部2序号案例名称申报单位推荐单位8长江智慧航运高质量数据集长江水上交通监测与应急处置中心交通运输部9农业典型作业场景多模态数据集中国农业科学院农业信息研究所农业农村部10应急管理“久安”AI大模型高质量数据集应急管理部大数据中心应急管理部11中国地震局“震典”地震监测人工智能数据集建设及其应用中国地震台网中心应急管理部12中国电信网络大模型高质量数据集中国电信集团有限公司国务院国资委13肺结核影像精标注高质量数据集中国联合网络通信有限公司国务院国资委14石油化工领域高质量数据集中国石油化工集团有限公司国务院国资委15中国移动人时空三元组高质量数据集中国移动通信集
3、团有限公司、北京航空航天大学、交通运输部规划研究院、中国移动通信集团山东有限公司国务院国资委16跨领域合成图文高质量数据集中电数据产业集团有限公司国务院国资委17天然气管网运行高质量数据集国家石油天然气管网集团有限公司油气调控中心国务院国资委3序号案例名称申报单位推荐单位18建筑行业供应链高质量数据集中国建筑集团有限公司、中建电子商务有限责任公司国务院国资委19电网调度负荷预测高质量数据集中国南方电网有限责任公司国务院国资委20scCompass:亿级多物种单细胞转录组AI 数据集中国科学院计算机网络信息中心、中国科学院动物研究所中国科学院21面向人群复杂特征的高质量 DNA 甲基化数据集中国
4、科学院北京基因组研究所(国家生物信息中心)中国科学院22全球海洋环境变化关键参数高质量数据集中国科学院海洋研究所、中国科学院大气物理研究所、中国科学院南海海洋研究所中国科学院23地球大数据创新青藏高原高质量数据集中国科学院青藏高原研究所中国科学院24CMA-RAV1.5:10 公里分辨率全球大气再分析数据集国家气象信息中心中国气象局25面向灾害天气场景的强对流天气人工智能应用训练数据集国家气象信息中心中国气象局26高精细风资源数据集国家气候中心中国气象局27高质量电子疾病档案(EDR)数据集浙江省疾病预防控制中心国家疾控局4序号案例名称申报单位推荐单位28广东省预防接种高质量数据集广东省疾病预
5、防控制中心国家疾控局29主流价值语料库人民网股份有限公司人民日报社30中文互联网语料库系列数据集(CCI)北京智源人工智能研究院北京市政务服务和数据管理局31亿海蓝水运物流高质量数据集亿海蓝(北京)数据技术股份公司北京市政务服务和数据管理局32全球多口音英语高质量语音数据集北京海天瑞声科技股份有限公司北京市政务服务和数据管理局33基于“警银网通”AI反诈数据标签高质量数据集恒安嘉新(北京)科技股份公司北京市政务服务和数据管理局34数据堂教育高质量数据集构建及应用数据堂(北京)科技股份有限公司北京市政务服务和数据管理局35百度智能云自动驾驶高质量数据集百度智能云(山西)科技有限公司山西省数据局3
6、6农作物芽期、幼苗期高质量数据集构建及应用内蒙古八爪智能科技有限公司内蒙古自治区政务服务与数据管理局37省域政务热线高质量数据集辽宁省民心网、辽宁民心出版传媒有限公司、联通(辽宁)产业互联网有限公司辽宁省数据局5序号案例名称申报单位推荐单位38空天地多源融合农业种植全要素高质量数据集吉林省空天产业发展投资有限公司、北京观微科技有限公司吉林省政务服务和数字化建设管理局39多语种大模型数据集建设吉林科讯信息科技有限公司、科大讯飞股份有限公司吉林省政务服务和数字化建设管理局40具身智能领域百万真机高质量数据集智元创新(上海)科技有限公司上海市数据局41中国移动研发大模型高质量数据集中移(苏州)软件技