当前位置:首页 > 报告详情

从数据到洞察:五十亿像素开源样本库应用探索.pdf

上传人: 山海 编号:627038 2025-04-21 33页 12.50MB

1、从数据到洞察:五十亿像素开源样本库应用探索易智瑞信息技术有限公司 遥感事业部马宇龙 为什么要制作全新格式的五十亿像素开源样本库?地区:京津冀城市群提取里面的常见5个类别:建筑 耕地 林地 草地 水体一个实际项目需求7景高分六号PMS影像分类任务 630平方公里覆盖面积 2米分辨率 4波段RGBNIR 160GB数据量大小(预处理后)分辨率高,覆盖范围大,数据量大无论是机器学习还是深度学习,都需要大量样本。机器学习 or 深度学习?核心核心3 3步骤步骤机器学习机器学习深度学习深度学习样本点状点状样本目标轮廓轮廓样本质量高于数量样本质量和数量同样重要样本量小,简单,几乎不用样本库进行样本数据管理

2、样本量大,复杂,可以构建样本库进行样本数据管理需要有背景类无需背景类算法全部利用光谱利用光谱信息主要利用空间利用空间信息,一部分利用光谱信息不受分辨率影像受分辨率影像使用CPU需要GPU需要手动从原始数据中选择和提取特征并分配权重,然后才能训练机器学习模型深度学习模型可以使用已知错误的反馈进行自我学习结果基于像素光谱特征的分类基于光谱和空间特征的提取获取样本训练模型模型分类数据集数据集类别数类别数影像数量影像数量分辨率(米)分辨率(米)波段数波段数影像大小影像大小定位定位/日期日期/传感器参数传感器参数时间时间SPARCS SPARCS ValidationValidation78030111

3、00010002016BiomeBiome4963011900090002017So2Sat LC242So2Sat LC24217400,6731010 bands32322019SEN12MSSEN12MS33180,66210 to 50up to 13 bands25625620199595-CloudCloud143,90230NIR,RGB3843842019ALCD Cloud ALCD Cloud MasksMasks83810RGB1,8301,8302019Slovenia LULCSlovenia LULC109401065,005,002019LandConverNet

4、LandConverNet71,98010NIR,RGB2562562020SentinelSentinel-2 Cloud 2 Cloud Mask CatalogueMask Catalogue1851320131,0241,0242020开源遥感像素分割分类样本库(截止2021)多光谱(1050米)包含513张11类地表类别和7类云类别的哨兵二号云掩膜样本数据集。Sentinel-2 Cloud Mask CatalogueSPARCS(Spatial Procedures for Automated Removal of Cloud and Shadow)包含80张landsat 阴影

5、、水面阴影、水、雪、陆地、云、洪水7类掩膜样本数据集。SPARCS数据集数据集类别数类别数影像数量影像数量分辨率(米)分辨率(米)波段数波段数影像大小影像大小定位定位/日期日期/传传感器参数感器参数时间时间Massachusetts Massachusetts BuildingsBuildings21511RGB1,5001,5002013Massachusetts Massachusetts RoadsRoads21,1711RGB1,5001,5002013Zurich SummerZurich Summer8200.62NIR,RGB1,0001,1502015DstlDstl-SIFD

6、SIFD1057up to 0.3up to 163,3503,4002017IEEE GRSS Data IEEE GRSS Data Fusion Contest Fusion Contest 2017201717301.49643666,3745152017IEEE GRSS Data IEEE GRSS Data Fusion Contest Fusion Contest 20182018201148417212022018DLRSDDLRSD172,1000.3RGB2562562018DeepGlobe Land DeepGlobe Land

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了五十亿像素开源样本库的的制作和应用,旨在为机器学习和深度学习提供大量高质量的样本数据。该样本库包含五个常见类别:建筑、耕地、林地、草地和水体,适用于高分六号PMS影像分类任务。文章强调了样本质量和数量的重要性,并指出在机器学习和深度学习过程中,需要大量样本数据来进行训练。此外,文章还讨论了不同卫星数据的波段选择和数据归一化的重要性,以及如何将RGB tif图像转换为分类tif和dat格式,以便在GIS软件中直接读取。最后,文章提到了即将发布的高分二号标签样本库,该样本库将包含五个类别和二十四类别的数据,适用于不同气候区的省级行政区,旨在简化深度学习模型的训练过程。
"高分六号PMS影像分类任务"如何操作? 深度学习模型训练中,如何选择合适的波段? 开源遥感像素分割分类样本库有哪些优势和特点?
客服
商务合作
小程序
服务号
折叠