-
利用遥感技术对森林、湿地、荒漠等进行调查监测[1-5],提供科学有效的数据支撑具有重要的研究意义。我国的森林资源不仅分布辽阔,还时时处于变化中,利用遥感数据时效性和宏观性的特点,科学、快速、准确地提取大区域植被类型及其变化规律信息是森林资源现代化管理的主要内容之一。
面向国家级或省级的大区域植被遥感分类大多基于中低分辨率遥感影像的像元特征,随着分类研究的发展,研究人员发现单分类算法存在不同程度的错分和误分现象,但不同分类器错分和误分的像素并不集中也没有统一规律,说明不同的分类器之间的性能存在差异。也就是说,分类器间存在互补性,某一分类算法错分或误分的样本在另一分类器中存在正确识别的可能,基于这一发现产生了多分类器组合分类思想[6-9],多分类器组合的新分类方法也得到越来越广泛的实验验证和应用。
证据理论是以A. P. Dempster的研究工作为基础发展起来的,Dempster的研究是用概率范围去模拟事件发生的不确定性,G.Shafer将证据理论推广研究应用于处理不确定性信息,因此证据理论也称为D-S理论。证据理论的主要特征包括:(1)发展了Bayes概率理论,具有表达不确定信息的能力,相比Bayes概率理论,证据理论的先验数据更容易获取,具有灵活性。(2)证据理论是一种可以综合多源信息的融合方法[10-13]。证据理论的合成规则,可以对不同来源的专家知识进行很好的融合,并且对数据格式的限制较低。因此,采用证据理论进行多分类器组合,将不同分类规则得到的同一区域的不同分类结果优势信息进行融合,可以得到一个精度更高的综合分类结果。
本研究基于证据理论原理实现大区域植被遥感分类。已有证据理论分类的研究,大多将多光谱波段作为融合的证据源,或者对多种专题数据进行信息融合,而多光谱遥感数据较难避免云和阴影的影响,专题数据存在时效性不统一的问题。实验数据选取16天合成一期的2001年23期NDVI时序数据,减少云影噪声影响的同时能够反映植被完整的物候周期信息。通过IDL程序将多分类规则处理得到的植被类型特征信息归一化处理为基本概率赋值作为证据源数据,依据证据理论实现多源信息综合,将组合结果依据最大信任度原则确定植被类型。另外,为了避免不同证据源低信任值相近可能导致的“Zadeh”悖论问题,设置了超集假设参与组合。实验过程中尽量减少人为干预,依靠分类算法挖掘实验数据的时间空间特征,实现了大区域植被类型信息客观、快速、高效地提取。
HTML
-
本实验辨识框架为{乔木、灌木、草地、湿地、农田},超集假设Θ=[乔木、灌木、草地、湿地、农田]。以影像行列定位为(1000, 1000)的像素P的类型确定过程为例。
实验区域时序NDVI影像结合快速采集的样本数据,通过最小距离、最大似然和时序SAM规则生成的类型特征影像,经过归一化处理得到多证据源的基本概率赋值。P点处的3个证据源的基本概率赋值,如表 1所示:
项目
Items最小距离规则
m(X1)Minimum distance最大似然规则
m(X2)Maximum likelihood光谱角规则
m(X3)Spectral angle乔木Tree 0.264 0.288 0.248 灌木Shrub 0.250 0.237 0.239 草地Grass 0.152 0.201 0.165 湿地Wetland 0.180 0.254 0.189 农田Crop 0.151 0.017 0.156 θ 0.003 0.003 0.003 Table 1. The mBpa values of 3 evidence sources
将归一化处理得到的三组证据源数据,依据证据理论合并原理进行两两规则证据源组合和3个规则证据源的组合。P点处的组合证据源的基本概率赋值,如表 2所示:
项目
Items乔木
Tree灌木
Shrub草地
Grass湿地
Wetland农田
Cropθ m(X1⊕X2) 0.354 0.275 0.144 0.213 0.014 8*10-6 m(X1⊕X3) 0.314 0.286 0.122 0.164 0.114 7*10-6 m(X2⊕X3) 0.336 0.266 0.158 0.226 0.014 7*10-6 m(X1⊕X2⊕X3) 0.399 0.299 0.109 0.183 0.010 ≈0.00 Table 2. The pixel values of combined classifiers based on evidence theory
依据信任函数原理,单一元素假设的信任函数即为该元素的基本概率赋值。因此,实验中各类型的信任函数值与各类型的基本概率赋值相等,即Belief(i)= mBpa(i),其中i为对应的类型。
最后,由最大信任度原则确定实验影像中P点处乔木类的基本概率赋值最大,因此P为乔木类。
表 2中组合证据源的基本概率赋值表明,P点处乔木和灌木分别是第一优势类和第二优势类。两两规则证据源组合的mBpa(乔木)与mBpa(灌木)的差值分别为0.079、0.048、0.07,3个规则证据源组合的mBpa(乔木)与mBpa(灌木)的差值为0.1,差值增大。乔木类型特征随着合成次数的增加而增大,与非乔木类型的特征差异更为显著。
因此,通过证据理论合成规则,合成证据源越多合成次数越多,优势类的基本概率赋值与其他类的差值越大,类型特征优势越明显。
-
在实验区域随机布设2 000个样点,将中国植被图与WESTDC土地覆盖图中同一类型重叠的区域视为真实地类分布,落于真实地类分布区域内的样点作为实验的验证样本。
单分类器得到的分类结果的生产精度、用户精度和总体精度,以及3个单分类器的各平均精度,如表 3所示:
分类规则
Classifier生产精度Production accuracy/% 用户精度User accuracy/% 总精度
Overall accuracy/%乔木Tree 灌木Shrub 草地Grass 湿地Wetland 农田Crop 乔木Tree 灌木Shrub 草地Grass 湿地Wetland 农田Crop 最小距离Minimum distance 74.92 83.33 53.98 57.50 53.85 86.48 9.8 88.41 44.66 17.28 66.60 最大似然Maximum likelihood 81.68 22.22 60.47 47.50 19.23 78.82 28.57 69.97 31.15 41.67 69.88 时序SAM Spectral angle 69.14 94.44 52.21 53.75 57.69 86.04 10.34 80.82 34.96 19.74 62.77 平均精度Mean accuracy 75.25 66.66 55.55 52.92 43.59 83.78 16.24 79.23 36.92 26.23 66.42 Table 3. Precision evaluation of single classifiers
两两规则组合分类得到的分类结果的生产精度、用户精度和总体精度,以及组合分类器的各平均精度,如表 4所示:
分类规则
Classifier生产精度Production accuracy/% 用户精度User accuracy/% 总精度
Overall accuracy/%乔木Tree 灌木Shrub 草地Grass 湿地Wetland 农田Crop 乔木Tree 灌木Shrub 草地Grass 湿地Wetland 农田Crop 最小距离+最大似然Min+max 88.28 61.11 67.55 62.50 46.88 84.65 21.15 85.45 49.02 71.43 78.14 最大似然+时序SAM Max+sam 84.16 72.22 69.32 56.25 50.00 83.88 27.66 79.93 44.12 69.57 76.19 时序SAM+最小距离Sam+min 80.69 100.00 57.82 72.50 59.38 87.79 15.52 92.89 42.03 36.54 72.56 平均精度Mean accuracy 84.38 77.78 64.90 63.57 52.09 85.44 21.44 86.09 45.06 59.18 75.63 Table 4. Precision evaluation of combined classifiers
表 3中最大似然分类器的精度最高,总精度为69.88%,最小距离分类器次之,总精度为66.60%,时序SAM分类器的总精度最小为62.77%,单分类器的平均总精度为66.42%。
表 4中最大似然与最小距离规则组合的分类结果精度最高,其总精度为78.14%,时序SAM与最小距离规则组合的分类结果精度最低,其总精度为72.56%,两两规则组合分类结果的平均总精度为75.63%,大于单分类器的平均总精度。对比单分类规则和两两规则组合分类结果中各类植被的平均生产精度和平均用户精度,两两规则组合分类结果的各平均精度都有提高。
可见证据理论组合分类规则的方法对分类总精度、各类型生产精度和用户精度均有不同程度的提高;并且参与组合的单分类规则精度越高,越能有效提高组合分类的精度。
生产精度、用户精度和总体精度与单分类器、两两规则组合分类器的平均精度对比分析,如表 5所示:
分类规则的平均精度
Mean accuracy of classifiers生产精度Production accuracy/% 用户精度User accuracy/% 总精度
Overall accuracy/%乔木Tree 灌木Shrub 草地Grass 湿地Wetland 农田Crop 乔木Tree 灌木Shrub 草地Grass 湿地Wetland 农田Crop 单分类算法Single classifier 75.25 66.66 55.55 52.92 43.59 83.78 16.24 79.23 36.92 26.23 66.42 两两规则组合Two classifiers combined 84.38 77.78 64.90 63.57 52.09 85.44 21.44 86.09 45.06 59.18 75.63 三个规则组合Three classifiers combined 89.72 83.33 69.32 76.25 53.13 86.15 34.09 91.80 48.03 89.47 80.84 Table 5. Precision evaluation of single and combined classifiers
表 5中单分类器分类结果的平均总精度为66.42%,两两规则组合分类结果的平均总精度为75.63%,3个规则组合分类结果的总精度最高为80.84%。对比单分类规则、两两规则组合、3个规则组合分类结果中各类植被的平均生产精度和平均用户精度,3个规则组合分类结果的各精度最高。因此,证据理论可以实现多分类算法的组合,并且证据源越多,越能提高分类精度。