CN119600435A

CN119600435A - 一种高密度竹灌丛的监测方法、系统及应用

Info

Publication number: CN119600435A
Application number: CN202411618421.0A
Authority: CN
Inventors: 梁好; 杨浩; 莫利; 罗鹏; 齐敦武; 李红林; 吴素娟; 蒋敏
Original assignee: CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING; Chengdu Institute of Biology of CAS
Current assignee: CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING; Chengdu Institute of Biology of CAS
Priority date: 2024-11-13
Filing date: 2024-11-13
Publication date: 2025-03-11

Abstract

本发明属于植物信息识别技术领域，具体涉及一种高密度竹灌丛的监测方法、系统及应用。具体技术方案包括：一种高密度竹灌丛的监测方法，步骤包括：sentinel‑2数据获取与预处理；从获得的数据中，选择绿光、近红外和短波红外2三个波段组合；优化数据处理模式；将样本集进行神经网络深度学习，获得高密度竹灌丛模型；向高密度竹灌丛模型中输入待测影像，获得高密度竹灌丛图斑。本发明方法在实现了高精度监测的同时，不需要依赖高质量物候时间序列数据，仅需单期遥感影像即可实现监测，可靠性、时效性均大幅提升。

Description

一种高密度竹灌丛的监测方法、系统及应用

技术领域

本发明属于植物信息识别技术领域，具体涉及一种高密度竹灌丛的监测方法、系统及应用。

背景技术

大熊猫国家公园内由于早期森林经营停止，一些大熊猫主食竹种，例如：短锥玉山竹、冷箭竹、华西箭竹等通过无性繁殖迅速扩散并占据林下空间，导致整个森林更新和演替缓慢或停止，形成高密度竹灌丛。

不同于结构错落、植被分布立体且丰富的天然林，高密度竹灌丛乔木稀疏，林下以低矮竹灌为主，同时密度极高，竹灌盖度超过90％。这种结构导致大熊猫等野生动物难以进入或穿越，同时，稀疏的乔木也无法形成大熊猫等野生动物个体和种群活动所需的隐蔽条件，致使该类型植被无法或难以被野生动物所利用，成为大熊猫国家公园范围内最为典型的受损(退化)栖息地类型之一。因此，高密度竹灌丛的监测评估一直是实现受损栖息地精细化监测的重点和难点。

传统受损地监测方法主要依赖搜集的历史土地利用与林地调查资料，初步确定受损栖息地的大致分布，并针对性进行地面样方与样线的野外踏勘调查，最终确定受损栖息地的位置、面积与分布。这种方法虽然准确率高，但调查成本过高，且频繁的监测活动也会增大对栖息地的人为干扰。

近年来还逐渐演变出以小型无人机为辅助手段的调查方法，但同样存在成本高昂，无法有效监测整个区域，成果更新缓慢等问题。

遥感作为植被监测领域新兴监测手段，有着大幅宽、回访周期短、空间分辨率高、辐射信息丰富等特点。植被遥感一般以植被“红边”为特征结合星载多光谱载荷形成NDVI(归一化植被指数)等植被指数，对植被进行监测，能快速、大范围有效区分植被与非植被地物，但对精细化植被分类精度较低。这是因为NDVI等植被指数是相对指标，受到卫星侧摆角度、大气扰动、传感器性能、太阳辐照度等的影响，不具有绝对指示性。同时，植被指数普遍存在“饱和”现象，导致难以单纯依靠光谱信息有效区分各种细分植被。

针对这一问题，一种解决方法是利用遥感时序数据对细分植被进行监测，即利用细分植被的特定物候特征在长时间序列遥感影像上呈现出的不同于其它植被的时序光谱曲线来进行区分。这种方法的监测精度虽然较高，但需要完整物候期遥感数据作为支撑，对数据期数和数据质量均有较高要求，如果缺少关键物候数据或数据质量较低，则监测精度会大幅下降。因此，该方法不适用于多云多雨等气候带。同时，高依赖于时序数据，意味着监测无法实时进行，监测时效将滞后。

另一种解决方法是使用深度学习技术实现对细分植被的监测，即通过输入大量细分植被影像样本，让神经网络自动学习其特征，形成分类模型，再用模型进行端到端的细分植被语义分割监测。这种方法的优势在于不需要探究植被机理，仅需让网络自动学习特征即可完成建模。劣势在于深度学习通常使用RGB真彩色可见光三波段影像作为输入，如果监测主体没有明显的语义特征，则训练难以收敛，模型精度低。而对于高密度竹灌丛，仅从纹理、形状、边缘和可见光像素亮度上较难与其它细分植被区分开，即无明显语义信息；直接使用深度学习技术，很可能精度较低。若使用遥感多光谱数据作为输入，虽然多通道光谱信息可以被模型自动学习和精炼提取，但大量的光谱冗余信息会造成模型学习能力低，需要更长的训练时间、更深层数和参数规模更大的模型来弥补，才能完成训练收敛，也存在数据复杂、成本高昂、时间开销大等问题。

因此，目前尚无成熟可靠的高密度竹灌丛监测技术存在。

发明内容

本发明的目的是提供一种高密度竹灌丛的监测方法、系统及应用。

为实现上述发明目的，本发明所采用的技术方案是：一种建立识别高密度竹灌丛的模型的方法，所述方法包括如下步骤：

S1、sentinel-2数据获取与预处理；

获取待监测区域的sentinel-2数据，获取增益与偏移量，进行辐射定标处理，将DN值转化为辐亮度，再将辐亮度转化为大气表观反射率，求解地表真实反射率数据，去除大气干扰；

S2、从S1获得的数据中，选择绿光、近红外和短波红外2三个波段组合；

S3、优化数据处理模式；

3-1对步骤S2获得的波段组合进行正样本富集优化；

3-2对正样本富集优化后的数据进行位深降维百分比拉伸优化，获得样本集；

S4、将样本集进行神经网络深度学习，获得高密度竹灌丛模型。

相应的，一种高密度竹灌丛的监测方法，步骤S1～S4与建立识别高密度竹灌丛的模型的方法相同，在获得高密度竹灌丛模型后，向高密度竹灌丛模型中输入待测影像，即可获得高密度竹灌丛图斑。

优选的，步骤S1中，将DN值转化为辐亮度的转换公式如下：

L_λ＝k*DN+c，其中，L_λ为辐亮度，k为增益，c为偏移量，DN为遥感影像像元亮度值，记录地物的灰度信号。

优选的，步骤S1中，将辐亮度转化为大气表观反射率的转换公式：其中ρ_λ为大气表观反射率，ESUN_λ为太阳辐照度，θ为太阳高度角，d为日地距离。

优选的，步骤3-1中，进行正样本富集优化的步骤包括：

3-1-1获得样本数据

利用地面采样得到的原始样本生成样本栅格，将样本栅格对齐步骤S2获得的波段组合数据，将样本随机打乱，分为由训练、验证、测试组成的数据集；

3-1-2计算正样本像素占比，获得正样本集

遍历全部训练数据集，判断每项训练数据中正样本占比，判断公式如下：

其中，ρ为像素占比，M_size为该样本数据尺寸，M_label为该样本数据中正样本像素数量；

若计算得像素占比超过0.1，则进入正样本集，否则结束此项数据富集流程；

3-1-3获得富集正样本

对于进入正样本集的数据，随机选定一正样本像素作为裁剪中心，随机进行正样本中心外扩裁剪，获得局部区域正样本；再对局部区域正样本进行尺度缩放，再进行垂直/水平翻转，再用背景值填充数据尺寸到需要尺寸。

优选的，步骤3-2中，位深降维百分比拉伸优化包括如下步骤：

3-2-1对单个样本数据的优选波段分别进行灰度直方统计，得到该样本地理范围内的像素值分布区间；

3-2-2去除像素值分布区间中出现的“长尾”分布；

3-2-3对有效像素进行范围拉伸，范围拉伸公式为：

式中，ρ_16bit为16bit遥感数据中任意一点的灰度值，ρ_max与ρ_min分别为长尾截取后的灰度值上下限，ρ_8bit为应用位深降维百分比拉伸后的该点8bit灰度值，ρ_outmax与ρ_outmin为低维深度上下限。

优选的，步骤S4中，选择focal loss作为代价函数。

相应的，一种计算机装置/设备/系统，包括存储器、处理器及存储在存储器上的计算机程序，所述处理器执行所述计算机程序以实现所述方法的步骤。

相应的，一种计算机可读存储介质，其上存储有计算机程序/指令，该计算机程序/指令被处理器执行时实现所述方法的步骤。

相应的，一种计算机程序产品，包括计算机程序/指令，该计算机程序/指令被处理器执行时实现所述方法的步骤。

相应的，一种终端设备，包括至少一个处理器以及至少一个存储器；至少一个程序被存储在所述存储器中，被配置为由所述处理器执行所述方法。

本发明具有以下有益效果：

本发明提供了一种高密度竹灌丛的监测方法，尤其适用于大熊猫国家公园受损栖息地的高密度竹灌丛监测。本发明利用高密度竹灌丛独特机理，组合优选波段输入，并设计多项针对性算法调整高密度竹灌丛正负与难易样本比例，在单期遥感影像上实现了对高密度竹灌丛的有效监测。相比于常规方法，本发明方法在实现了高精度监测的同时，不需要依赖高质量物候时间序列数据，仅需单期遥感影像即可实现监测，可靠性、时效性均大幅提升。具体来说：

1、本发明的方法填补了遥感尺度对高密度竹灌丛监测的空白。在本发明以前，没有可应用到高密度竹灌丛上的有效遥感监测技术。本发明从遥感机理角度出发，通过大量实测样方对齐sentinel-2数据进行分析，在遥感尺度筛选出三个高密度竹灌丛优选特征波段，利用深度学习技术实现了高密度竹灌丛遥感监测。相比传统方法覆盖范围更广，单次监测时间消耗更短，可提供连续监测服务，掌握受损地周期变化情况。此外，非接触式的特点也可以最大程度上减少人类活动对大熊猫栖息地造成破坏。

2、本发明提出的技术方案充分结合了传统遥感反演与深度学习模型的优势。本发明通过遥感机理分析得到三个优选多光谱特征波段，并通过神经网络自动学习已被突出的特征，可以在更少的数据量上实现更好的监测效果，并极大减小了网络计算量，同时三特征波段的结构可以直接应用于绝大部分深度学习网络(通常采用真彩色输入)而不需要进行多通道模型改造。

3、现有方法进行深度学习数据处理时，通常采用常规增广方式叠加，没有针对遥感影像的特点进行优化。本发明充分考虑了遥感影像中目标地物高密度竹灌丛数量少而分布零散的特点，设计了从统计过滤后随机正样本像素点进行正样本富集的增广管道，可以有效解决样本不均衡导致的模型偏向。同时，针对遥感数据位深冗余造成的特征杂糅问题设计了位深降维百分比拉伸算法，从统计学角度拉伸特征区间，增大各反射峰的距离，可以突出高密度竹灌丛的相对特征，使模型更易学习，并更快达到收敛。

附图说明

图1为高密度竹灌丛监测方法流程图；

图2为高密度竹灌丛(左)与天然林(右)无人机影像对照图；

图3为典型植被地面反射光谱(400-900nm)示意图；

图4为大熊猫国家公园典型高密度竹灌丛卫星光谱响应曲线之一；

图5为大熊猫国家公园典型高密度竹灌丛卫星光谱响应曲线之二；

图6为正样本富集流程图；

图7为sentinel-2卫星SWIR2波段灰度直方统计图(2024年8月1日大熊猫森林公园区域)；

图8为图7SWIR2波段比特降维百分比拉伸处理后灰度直方统计图。

具体实施方式

本发明提供了一种高密度竹灌丛的监测方法，尤其适用于监测大熊猫国家公园受损栖息地的高密度竹灌丛。所述方法整体流程如图1所示，具体包括如下步骤：

S1、sentinel-2数据获取与预处理

sentinel-2，即哨兵2遥感卫星，携带多光谱成像仪(MSI)，A、B星综合重访周期约为5天，在10米分辨率上拥有红、绿、蓝、近红外四个波段，在20米分辨率上拥有三个红边，两个短波红外，共计五个波段。可以通过Copernicus Open Access Hub，USGSEarthExplorer，Google Earth Engine，Amazon Web Services，Planetary Computer等平台免费下载Sentinel-2数据，数据获取简便，成本低廉。

对于以上任意公开渠道获取到的大熊猫国家公园范围内云量低于10％的L1C级别原始sentinel-2数据，首先根据数据xml头文件获取每个像元的DN数字信号值增益与偏移量，进行辐射定标处理，将DN值转化为辐亮度，转换公式如下：

L_λ＝k*DN+c。其中，L_λ为辐亮度，k为增益，c为偏移量，DN为遥感影像像元亮度值，记录地物的灰度信号。

再将辐亮度转化为大气表观反射率，转换公式如下：

其中ρ_λ为大气表观反射率，ESUN_λ为太阳辐照度，θ为太阳高度角，d为日地距离。

得到表观反射率后，通过6S模型(Second Simulation of a Satellite Signalin the Solar Spectrum)求解地表真实反射率数据，去除大气干扰。对于分辨率低于10m的波段，利用GDAL Warp进行重采样，插值方法为双线性内插，通过插值技术将20m分辨率的影像数据转换为10m分辨率的影像数据。优选的方案为，为了减小存储和内存开销，利用线性公式将得到的32bit浮点型地表真实反射率转换到16bit无符号整形进行存储。

S2、优选波段组合

现有技术的实时监测方法通常使用可见光(真彩色)三波段作为数据输入，但仅使用可见光波段较难识别高密度竹灌丛。sentinel-2卫星具有多光谱通道，使用多个光谱通道可以提高识别精度，但过量的冗余数据会增加训练成本和时间。因此，根据高密度竹灌丛的冠层反射特性，从遥感机理角度出发，解构敏感性，筛选多光谱组合优选波段作为数据输入是必要的。

基于大量前期实际采样与踏勘数据，发明人积累了海量的高密度竹灌丛结构与矢量图斑信息，将图斑对齐当期sentinel-2影像，变化波段组合，分析敏感波段。高密度竹灌丛与天然林的信息存在显著差异，两者的无人机影像对比如图2所示；左图为高密度竹灌丛，右图为天然林。具体来说，在先采样结果显示：

从生态学定义上来看，高密度竹灌丛冠层普遍较小且低矮，单冠层高度通常不超过3米，范围通常不超过10米，在sentinel-2上作为小于传感器分辨率的混合像元存在。因此，在多波段通道纹理上，表现为均匀或含有少量颗粒(乔木)特征，与天然林地构成明显区分(由于天然林地的树种多样，高矮不一，冠层多超过单像元尺度，在卫星尺度通常表现为不均匀随机分布的多颗粒特征)。

从光谱学角度上来看，虽然高密度竹灌丛的覆盖度较高，但相较于天然林，其在垂直尺度吸收和折射光线的机会更少。因为低矮的竹灌会使太阳辐射更容易到达地面，并反射回卫星传感器进行成像。因此，高密度竹灌丛表现出高反射特征，即在影像上表现为更高亮度。

从植被物化性质上来看，植被在可见光波段呈绿色，这是因为植被多吸收红光和蓝紫光用于光合作用，而反射绿光；同时由于叶片结构的存在，在近红外呈强反射特征。因此，利用红光吸收与近红外强反射特征即“红边”可以轻易区分植被和其它地物，但不同植被在可见光的光谱响应基本是相同的，而在近红外波段表现出较大差异(图3)。因此，可以利用近红外区分不同植被类型。

虽然不同的植被在近红外有着不同的光谱响应，但这种差异是趋势而非绝对值响应。这些光谱响应受到卫星传感器、光照、角度和云层等的影响。通过实测图斑叠加对应时期卫星影像，发明人绘制了大熊猫国家公园两个区域的典型地物(高密度竹灌丛、天然林、连片人工林)在sentinel-2光谱区间的响应曲线(图4、5)，发现高密度竹灌丛在卫星尺度的光谱表现为在可见光(VIS)波段呈典型绿植特征，反射率略高于周围的天然林、连片人工林。在近红外(NIR)通道，竹灌丛、天然林和人工林间的光谱差异达到最大，而从可见光到近红外通道，高密度竹灌丛表现出了最高的变化率。随着波长增加，三者的反射光谱在两个短波红外通道(SWIR1、SWIR2)间都呈下降趋势，但竹灌丛始终保持了较其它两者更高的反射特征。在SWIR2区间内，连片人工林和天然林的光谱呈显著下降趋势，且差异进一步减小，但高密度竹灌丛仍保持了较高反的射特征。同时，对比图4、5可知，虽然两个不同区域的高密度竹灌丛光谱响应曲线趋势一致，但不同区域反射率绝对值差异较大；因此，仅通过阈值无法将高密度竹灌丛与天然林区分开。

基于上述高密度竹灌丛特征，选择绿光(Green)、近红外(NIR)和短波红外2(SWIR2)三个波段组合作为高密度竹灌丛的特征提取输入。

2-1使用绿光和近红外过滤非植被地物

使用绿光波段用于区分“绿色”植被和其它非绿色地物，另外，由于植被具有叶片结构，而叶内复杂的叶腔结构和腔内对近红外辐射的多次散射控制会导致植被在NIR波段出现高反射特征，因此选用NIR波段作为补充，可以过滤掉不存在叶片结构的非植被类绿色地物。

2-2提取高密度竹灌丛特征

在过滤非植被地物后，提取高密度竹灌丛特征，将其与其它植被类型进行区分；具体包括：

2-2-1高密度竹灌丛在NIR波段出现全局极值反射率，显著高于附近其它植被类型。

2-2-2VIS到NIR呈现的最高变化率，植被从VIS到NIR出现的反射率跃升中，高密度竹灌丛相比附近其它植被类型拥有最高跃升程度。

2-2-3在SWIR2波段上高密度竹灌丛表现出高反射特征，而其它植被则普遍出现低值收敛现象。

2-3特征学习与应用

步骤2-2中提取的特征均属于高密度竹灌丛和周围植被对比而来的相对特征，具有空间异质性，存在分布不规则性和取值多样的特点，较难准确用数学公式去定义和量化判别。因此，优选的方案为：以Green-NIR-SWIR2三波段影像作为输入数据，数据尺寸可选为3*512*512(其中尺寸结构依次为波段数、影像高方向像素和影像宽方向像素)，采用深度学习技术模拟人脑思考来自动学习优选波段中这种相对特征，形成基于像素的语义分割网络，最终实现对高密度竹灌丛的识别。

由于深度学习允许端到端训练，即从原始影像输入到分类输出均由网络自动学习优化，而不依赖人工设计的规则(特征提取，边缘检测，分割算法等)与特征(如颜色、纹理、边缘、形状等)，在复杂背景与空间异质性的高密度竹灌丛遥感监测任务中具有优势。具体步骤为：使用segformer-b4网络，将输入的遥感影像数据分割为多个等尺寸块(patches)，每个小块映射为一个token。这些token通过多个不同尺寸的self-attention编码器让token间交互并加权，学习到多尺度上下文(周边)特征信息，并通过深度多层结构(16层)不断向高维进行抽象，每层都会根据上层的输出结果重新计算特征，并不断加强全局信息融合，从而产生更丰富与抽象概括的高密度竹灌丛高维特征。得到高维特征后，通过MLP(逐像素分类头)将高维特征映射回每个token对应位置，并得到该位置的类别概率图(如0代表背景，1代表高密度竹灌丛)，选择最高概率类别作为该位置类别，进而得到与输入图像尺寸大小相同的高密度竹灌丛逐像素分类结果。

优选波段组合充分挖掘了多光谱传感器潜力，从辐射传输机理角度提供了高密度竹灌丛的识别理论基础。通过优选波段组合减少了信息冗余，为模型从输入层面提供了清晰的语义信息，有效降低了高维度(抽象)特征挖掘难度，同时三波段的输入组合可以兼容绝大部分为普通影像任务设计的视觉深度学习网络结构，无需重新设计模型，降低了优化与迁移成本。

S3、优化数据处理模式

为了提升深度学习模型的训练效果，本发明通过正样本富集和样本位深降维百分比拉伸两个改进数据处理算法进行优化。

3-1正样本富集优化

由于遥感影像成像角度和对象尺度均和普通影像存在较大差异，遥感影像中自然地物普遍具有“旋转不变性”、“尺度不变性”、“可分割性”特征。利用这些遥感影像特征，设计了正样本富集算法和管理流程，流程如图6所示，具体操作如下：

3-1-1获得样本数据

利用地面采样得到的原始样本生成样本栅格(地面实际调查图斑)，将样本栅格对齐优选后的sentinel-2三波段影像(步骤S2获得的优选波段组合数据)，同步以0.1重叠率滑动裁剪为512×512的样本，并将样本随机打乱分为训练：验证：测试＝7：2：1的数据集。

3-1-2计算正样本像素占比，获得正样本集

单独遍历全部训练数据集，通过如下公式判断每项训练数据中正样本(高密度竹灌丛)占比。

其中，ρ为像素占比，M_size为该样本数据尺寸，M_label为该样本数据中正样本像素数量。

若计算得像素占比超过0.1，则进入正样本集，否则结束此项数据富集流程。

3-1-3获得富集正样本

对于进入正样本集的数据，随机选定一正样本像素作为裁剪中心，按(150×150)～(350×350)像素范围随机进行正样本中心外扩裁剪，获得局部区域正样本。

再对局部区域正样本按0.8～1.2的随机比例进行尺度缩放，0.6的概率进行垂直/水平翻转，最后用背景值填充数据尺寸到512×512。

根据富集需要，重复上述处理流程5～10次。

这样处理的目的是保证经过富集流程后的增广数据仍然100％保留一定随机区域的正样本像素，从而避免了常规方法随机裁剪和缩放后有概率仅得到纯负样本区域，加剧正负样本不均衡的现象。而且遥感影像中，由于地物尺度普遍较小，正样本像素占比更低，获得纯负样本的概率很大。同时，对样本中不同正像素随机选择中心点进行分割，可以有效利用遥感“可分割性”原则，在有限高密度竹灌丛样本中，通过随机正分割与后续富集管道，制作出更多不同中心、角度、大小的高密度竹灌丛正样本，提升正样本占比，平衡数据集分布。通过正样本富集算法，可以增大正样本在整体训练样本中的占比，同时尽量减少过拟合风险，引导模型更多学习正样本特征，提升监测精度。

3-2样本位深降维百分比拉伸优化

本发明从遥感数据预角度提出了样本位深降维百分比拉伸算法，可以增强波段特征，提高识别效果。一方面，高密度竹灌丛在SWIR2波段存在不同于周围植被类型的高反射特征，对比图4、5可知，这种特征是相对的，因此需要将这种相对特征进行放大，突出与其他地物的差异，同时保证原有特征分布趋势不变，以便帮助模型更好的学习异质性高密度竹灌丛的共通特征。另一方面，遥感影像通常呈现出整体过暗趋势，导致地物间区分度过小。在图像处理领域，一张观感正常、易于区分的影像的像素值分布应尽量满足正态分布，不会出现过曝和过暗。而遥感影像由于地物繁多，成像条件复杂，大量像素通道被占比较小却高亮的地物(如云，雾)占据，地物像素则分布在较小的区间内，从而导致整体影像过暗，地物间的反射差异被缩小。因此，基于上述遥感影像特性与高密度竹灌丛SWIR2反射率相对特征，设计了样本位深降维百分比拉伸算法，具体如下：

3-2-1对单个样本数据的三个优选波段(绿光、近红外和短波红外)分别进行灰度直方统计，以得到该样本地理范围内的像素值(亮度)分布区间。

统计示例如图7所示。根据图7，像素大量集中在一个短区间(如图7中灰度值1000-11000)内。

3-2-2去除直方统计中出现的“长尾”分布。如图7所示，像素集中的区间外有数量少但分布广泛的“长尾”像素。“长尾”指亮度值极高(低)的低频像元，这些像元通常占据绝大多数亮度区间但数量稀少，对影像整体是无效贡献，因此需要截取去除。去除方法为：将直方统计中有效像素上下限各向内截取1％，从而去除“长尾”，仅保留占比较大的有效像元。

3-2-3对有效像素进行范围拉伸。由于预处理后的sentinel-2遥感影像为16bit数据类型，经裁剪“长尾”后，需要对有效像素进行范围拉伸，考虑到16bit数据量为8bit的256倍，为了减少运算和存储开销，将去除“长尾”后的16bit遥感影像数据按如下线性公式拉伸到8bit色彩范围。

式中，ρ_i6bit为16bit遥感数据中任意一点的灰度值，ρ_max与ρ_min分别为长尾截取后的灰度值上下限，ρ_8bit为应用位深降维百分比拉伸后的该点8bit灰度值，ρ_outmax与ρ_outmin为低维深度上下限。

将图7拉伸到8bit色彩范围后，具体如图8所示。图7的像素值集中分布在1000-10000区间中，大量有效信息被压缩在此区间，而经过算法处理后获得的图8，像素值分布更趋近正态分布，有效信息被拉伸到整个灰度空间，没有出现过多无效像素占据灰度的情况。因此，通过位深降维百分比拉伸算法，在去除长尾影响，有效增强遥感影像中地物对比度的同时，还能减小空间占用，实现有效像素区域的对比度拉伸，增大高密度竹灌丛与其他植被在SWIR2波段的反射差异，简化特征图抽象程度，降低模型学习难度。

S4、segformer神经网络深度学习，获得高密度竹灌丛模型

在实现了基于遥感机理的波段优选与数据处理的算法优化后，将高密度竹灌丛样本集送入segformer深度学习模型，进行调优训练。

segformer模型结构为：以vision-transformer作为backbone，segformer-b4为下游分割网络，同时结合卷积神经网络(CNN)和transformer的优势，利用基于self-attention的不同大小encoder，实现类似于CNN的多尺度特征提取与融合机制，以兼顾transformer的全局捕捉能力。在面对分布零散，尺度不一的高密度竹灌丛提取任务中具有优势。

将步骤S3获得的完成了正样本富集与位深降维百分比拉伸的训练集输入segformer模型，并进行常规数据增广，选取AdamW作为优化器，初始学习率为0.00006。

考虑到即使完成了正样本富集，仍存在难、易样本分布不均的问题，因此使用focal loss作为代价函数，公式如下：

FL_pt＝-α_t(1-pt)^γlog(pt)

式中，α_t为平衡因子(可选为0.6)，用于调整正负样本权重比，γ为焦点因子(可选为2)，调整难易样本的权重比，pt为目标的预测概率。

focal loss可以通过焦点与平衡因子调节样本反向传播权重，实现对难样本的偏向性学习。使用focal loss能在模型层面平衡反向传播方向，减轻模型对易样本的偏向，专注于难样本学习，提高模型鲁棒性。将Batch size设置为12，训练50个epoch，每个epoch验证一次精度，并采用了early stop机制，在连续5轮验证后，精度如果不继续上升，结束训练，获得高密度竹灌丛模型，防止模型过拟合。

S5、高密度竹灌丛推理与后处理，获得高密度竹灌丛图斑

以步骤S4训练得到的最优高密度竹灌丛模型为基础，传入任意待检测的sentinel-2影像，按G、NIR、SWIR2顺序对影像进行优选重排，并参照步骤S2的方法，进行位深降维百分比拉伸后送入模型。由于推理所用影像远大于训练尺寸，在推理影像上应用滑窗切图，减小硬件显存压力，并在推理完成后反向滑窗恢复原始影像尺寸，推理完成，得到8bit预测栅格。

由于高密度竹灌丛不会出现在林线海拔以上，因此输入目标地点数字高程模型(DEM数据)与目标林线阈值(林线数据)，将DEM数据裁剪并重采样到sentinel-2卫星尺度，将预测栅格与DEM数据完成对齐。判断每个栅格像元值是否同时满足高程小于林线和预测值为高密度竹灌丛，如果同时满足，则保留该像元预测值，否则将预测栅格值赋0值。

将后处理完成的预测栅格进行形态学处理，过滤较小的孤立图斑，并完成矢量化，得到高密度竹灌丛预测图斑。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。若未特别指明，实施例中所用的技术手段为本领域技术人员所熟知的常规手段。所获得的数据均为进行至少3次重复后获得的平均值，且各重复获得的均为有效数据。

实施例

本实施例中，训练与推理硬件环境为：cpu为intel i9 11900，gpu为nvidia rtx3090，内存为64g ddr4，软件环境为windows10 pro，cuda版本为12.6，python版本为3.9，使用pytorch 2.4.1作为基础深度学习框架，gdal作为栅格与矢量处理库，py6s作为大气校正库模型，mmsegmentation作为模型开发框架，实现代码均由python编写。

1、获取遥感数据并进行预处理

以大熊猫国家公园荥经片区为实验区域，选择2023年7月8日与2024年8月1日数据质量较高(云量低于10％)的四景sentinel-2多光谱数据，使用python对sentinel-2数据分波段进行辐射定标，使用py6s进行大气校正并分别裁剪到大熊猫国家公园荥经片区。

2、优选波段组合

分别选取当期影像中的G(绿光)，NIR(近红外)，SWIR2(短波红外2)波段，并以NIR为基础，将SWIR2波段双线性内插到10m分辨率，以G-NIR-SWIR2的波段顺序对齐并保存为3通道16bit影像。

3、优化数据处理处理

将实地采样得到的荥经片区高密度竹灌丛图斑栅格化，得到背景标注为0、高密度竹灌丛标注为1的8bit标签数据。

对齐影像与标签，以0.1重叠率进行滑动裁剪，得到512×512大小的样本(影像+标签为一个样本)共528张。将样本随机排序并切分为训练：验证：测试＝7：2：1的样本集。

单独取出训练集，进行正样本富集，得到375个正富集样本。将其全部放入训练集，以保证正样本富集不会影响到验证与测试结果。

在数据加载器中编写位深降维百分比拉伸代码，并将其作为数据加载的必选步骤，其他数据增强项目保持默认全开。

4、segformer神经网络深度学习，获得高密度竹灌丛模型

选用并编写segformer-b4模型作为深度学习网络，设置batch_size为12，AdamW作为优化器，初始学习率设置为0.00006，代价函数为focal loss。其中，平衡因子设置为0.6，焦点因子设置为2，epoch设置为50。每隔1个epoch进行一次验证，并保留最佳模型，0-2epoch进行线性预热学习，随后执行正常学习，并设置early stop机制，在连续5轮验证后精度不继续上升，认为已实现收敛，结束训练，防止模型过拟合。

在测试集上进行模型精度的验证，精度评估指标包括：IoU(交并比)、准确率、精确率和F1分数(F1 score)。IoU被定义为预测区域与真实区域的交集在预测区域与真实区域的并集上的占比，准确率被定义为正确预测的样本数占总样本数的比例，精确率被定义为正确预测的样本数占全部预测为正的预测样本数的比例，f1 score则是准确率和精确率的调和平均值。将训练得到的最佳模型推理全部测试集数据，并计算上述指标。

同时设置对照组：以sentinel-2R-G-B常规可见光数据作为输入，预处理步骤相同，只是不运行正样本富集与位深降维百分比拉伸算法，同样使用segformer-b4模型，训练参数保持一致，训练50epoch。

对比结果如表1所示。

表1不同方法模型精度对照表

方法	准确率(％)	精确率(％)	IoU	F1 score	整体精度(％)
						本发明方法	74.38	71.99	57.68	73.16	87.10
对照组	43.99	78.04	39.15	56.27	71.95

结果显示：对照组的准确率和精确率指标间存在巨大差异，说明对照组的模型没有完成有效收敛，在性能上存在极大的偏向。即：监测的高密度竹灌丛大多确实是真值，但存在大量漏检，将大量实际高密度竹灌丛真值漏报为背景，IoU指标差距巨大，表明对照组无法得到有效高密度竹灌丛边界。而本发明的方法准确率和精确率得分均较高，且分数接近，说明本发明方法能较好提取出高密度竹灌丛边界，且在高密度竹灌丛遥感监测中，不仅能找到大多数高密度竹灌丛，而且找到的高密度竹灌丛中大部分都是正确的真值，高达73.16的F1分数也证明了这点。

以上所述的实施例仅是对本发明的优选方式进行描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案做出的各种变形、变型、修改、替换，均应落入本发明权利要求书确定的保护范围内。

Claims

1.一种建立识别高密度竹灌丛的模型的方法，其特征在于：所述方法包括如下步骤：

S1、sentinel-2数据获取与预处理；

S3、优化数据处理模式；

3-1对步骤S2获得的波段组合进行正样本富集优化；

2.一种高密度竹灌丛的监测方法，其特征在于：所述方法包括如下步骤：

S1、sentinel-2数据获取与预处理；

S3、优化数据处理模式；

3-1对步骤S2获得的波段组合进行正样本富集优化；

S4、将样本集进行神经网络深度学习，获得高密度竹灌丛模型；

S5、向高密度竹灌丛模型中输入待测影像，获得高密度竹灌丛图斑。

3.根据权利要求1或2所述方法，其特征在于：步骤S1中，将DN值转化为辐亮度的转换公式如下：

4.根据权利要求1或2所述方法，其特征在于：步骤S1中，将辐亮度转化为大气表观反射率,转换公式如下：

5.根据权利要求1或2所述方法，其特征在于：步骤3-1中，进行正样本富集优化的步骤包括：

3-1-1获得样本数据

3-1-2计算正样本像素占比，获得正样本集

3-1-3获得富集正样本

对于进入正样本集的数据，随机选定一正样本像素作为裁剪中心，随机进行正样本中心外扩裁剪，获得局部区域正样本；

对局部区域正样本进行尺度缩放，再进行垂直/水平翻转，再用背景值填充数据尺寸到需要尺寸。

6.根据权利要求1或2所述方法，其特征在于：步骤3-2中，位深降维百分比拉伸优化包括如下步骤：

3-2-2去除像素值分布区间中出现的“长尾”分布；

3-2-3对有效像素进行范围拉伸，范围拉伸公式为：

式中，ρ_16bit为16bit遥感数据中任意一点的灰度值,ρ_max与ρ_min分别为长尾截取后的灰度值上限和下限，ρ_8bit为应用位深降维百分比拉伸后的该点8bit灰度值，ρ_outmax与ρ_outmin分别为低维深度上限和下限。

7.根据权利要求1或2所述方法，其特征在于：步骤S4中，选择focal loss作为代价函数。

8.一种计算机装置/设备/系统，包括存储器、处理器及存储在存储器上的计算机程序，其特征在于，所述处理器执行所述计算机程序以实现权利要求1～7任意一项所述方法的步骤。

9.一种计算机可读存储介质，其上存储有计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行时实现权利要求1～7任意一项所述方法的步骤。

10.一种计算机程序产品，包括计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行时实现权利要求1～7任意一项所述方法的步骤。