-
森林生物量与森林蓄积量一样,既是各级森林资源监测的重要指标,更是反映森林生态系统生产力的重要参数[1-3]。对森林生物量的估计,既可通过建立立木生物量模型来获得[4-5],也可通过建立林分生物量或生物量转换因子模型来获得[2, 4]。根据Luo等[6]的综述,1978年至2013年间,我国学者已发表了近200个树种的5924个立木生物量模型。2014年以来,国家林业局有计划地编制了我国主要树种的立木生物量模型,并颁布实施了系列行业标准[7-13]。但是,不论是国外[5, 14-20]还是国内[21-28],发表的林分生物量模型都要显著少于立木生物量模型。
在已有的林分水平模型中,影响最大的是方精云等[21-22]发表的21种森林类型的材积源生物量模型,该模型在很多研究中得到了引用[27, 29-32]。此外,王斌等[24]利用1266个不同森林类型样地的数据,建立了我国16种森林类型的生物量与蓄积量之间的双曲线模型。经分析,这些模型存在3个方面的不足:一是建模样本较少,大部分模型都是建立在小样本基础上。如方精云等[22]建立的21个模型有18个(仅落叶松、油松、杉木除外)的建模样地数在30以下,王斌等[24]建立的16个模型有10个的建模样地数在50以下。二是建模方法简单,基本都是采用普通最小二乘法,未考虑生物量和蓄积量数据的异方差性。三是评价指标单一,仅提供了确定系数R2[22]或相关系数R[24]这一项评价指标,未提供其他误差方面的评价指标,其适用性存疑。因此,对林分生物量建模方法做进一步研究是非常必要的。
本研究利用我国3种主要针叶林(落叶松Larix spp.、油松Pinus tabulaeformis Carr.、杉木Cunninghamia lanceolata (Lamb.) Hook.)的3000个样地的地面实测数据,采用加权回归估计[33]和分段建模方法[34],建立林分水平的材积源生物量模型,既为这3种森林类型的生物量调查提供计量依据,也为规范林分生物量建模方法提供科学参考。
HTML
-
本研究所用数据为第九次全国森林资源清查的固定样地调查资料,涉及我国3种主要的针叶林类型,即:落叶松林、油松林和杉木林。按优势树种(占65%以上)确定的这3种类型的针叶林,全国的有效样地数(蓄积量大于0)分别为2490、1185和3152个,每个样地都基于每木胸径测量数据,采用一元立木材积模型和立木生物量模型计算出蓄积量和生物量(包括地上生物量和地下生物量)。由于样地数主要集中在每公顷蓄积量和生物量较小的区段,为了保证所建模型具有广泛适用性,将全部样地按每公顷生物量大小用上限排外法分为4级(< 50,50~100,100~150,≧150 t·hm−2),按每级样本量尽量均等的原则[35-36]选取建模样本,每公顷生物量150 t以上的样地数相对较少,尽可能多选一些用作建模样本,剩下的样地作为检验样本。经综合考虑,最后确定3种林分类型选取建模样地分别为1200、800和1000个。表1是3种针叶林分的建模样地数和检验样地数按每公顷生物量等级的分布情况,图1是根据全部3000个建模样地数据绘制的散点图。
生物量等级
Biomass class/(t·hm−2)落叶松 Larix spp. 油松 Pinus tabulaeformis 杉木 Cunninghamia lanceolata 建模样地数
Number of
modeling plots检验样地数
Number of
validation plots建模样地数
Number of
modeling plots检验样地数
Number of
validation plots建模样地数
Number of
modeling plots检验样地数
Number of
validation plots< 50 300 431 300 229 300 1 326 50~100 300 550 300 83 300 646 100~150 300 259 120 59 250 154 ≧ 150 300 50 80 14 150 26 合计 Total 1 200 1 290 800 385 1 000 2 152 Table 1. The number of modeling plots and validation plots for three coniferous forest types
-
将基于前述3种针叶林3000个样地的蓄积量、生物量实测数据,首先分别普通回归和加权回归,建立林分生物量模型,并分析其建模效果,最后再用分段建模方法,建立估计效果更好的生物量模型。
-
林分生物量主要与林分蓄积量有关,基于蓄积量的生物量模型应用最为广泛[21-22, 24, 27, 29-32]。根据方精云等[22]对全国21种森林类型的研究结果,林分生物量与蓄积量之间呈线性相关。从3000个样地的每公顷生物量与蓄积量数据的散点图分析,这种线性相关规律也是非常明显的(图1)。因此,本研究确定采用如下线性形式的林分生物量模型:
式中:B为每公顷生物量(t·hm−2),V为每公顷蓄积量(m3·hm−2),a0、b0为模型参数,ε1为误差项,假定其服从均值为0的正态分布。将(1)式两边除以V,可得到如下林分生物量转换因子模型:
式中:BCF为生物量转换因子(= B/V),c0、d0为模型参数,ε2为误差项。式(2)为非线性模型,如果设定y = BCF,x = 1/V,则可以转为以下线性模型:
上述模型(1)、(3)的参数可采用普通线性回归估计方法求解。根据对模型的结构分析,模型参数之间理论上应该存在以下关系:
事实上,模型(2)、(3)的拟合结果,就相当于模型(1)的加权回归结果,其权函数为w = 1/V。因此,根据实际的拟合结果,式(4)必然是不成立的。由于生物量数据与蓄积量数据类似,都具有异方差性,模型(1)应该采用加权回归估计才是合适的[33, 37]。参照有关权函数的研究结论[37],权函数w = 1/V效果不一定最好,更通用的权函数应为w = 1/V k,其中k一般在0.5~1.0之间。
为了区别,这里将生物量模型(1)的拟合方法称为普通回归,生物量转换因子模型(2)或(3)的拟合方法称为加权回归1(权函数w1 = 1/V),以模型(1)为基础进行的加权回归估计方法称为加权回归2(权函数w2 = 1/V k)。
-
当变量的取值范围很大时,用一个模型通常难以对各个区段都作出准确估计,解决这一问题的有效方法就是分段建模。在建立单木水平的生物量模型时,就已经有人用到了这一方法[34]。林分生物量的建立,同样可能碰到这一问题。假设最小的区段(如每公顷蓄积量50 m3·hm−2以下)存在明显偏估,就可以将自变量V = 50 m3·hm−2置为两个模型的链接点,并将适用于V < 50 m3·hm−2的模型参数设定为a1和b1,适用于V≧50 m3·hm−2的模型参数设定为a2和b2。为了保证两个模型在链接点的估计值一致,先拟合其中一个模型的2个参数后,另一个模型2个参数的估计就要受到这一条件的约束,其中只有一个参数是独立估计的,另一个参数直接根据(5)式由其他3个参数推出。
根据两个分段模型拟合的先后顺序,可以得出2组分段模型:
式(6)是先拟合适用于V < 50 m3·hm−2的模型参数a1和b1,再拟合适用于V≧50 m3·hm−2的模型;式(7)是先拟合适用于V≧50 m3·hm−2的模型参数a2和b2,再拟合适用于V < 50 m3·hm−2的模型。通过对比其评价指标的优劣,选定拟合效果较好的模型。
-
用于模型评价的指标包括以下6项:确定系数R2、估计值的标准差(也称剩余标准差)SEE、总体相对误差TRE、平均系统误差ASE、平均预估误差MPE和平均百分标准误差MPSE[38-39]。其中MPE和MPSE的计算公式如下:
式中:yi为实际调查值,
${\hat y_i}$ 为模型预估值,$\bar y$ 为样本平均值,n为样地数,tα为置信水平α时的t值。对建立的回归模型,计算以上6项指标值,根据指标大小进行模型评价。从实用性角度考虑,一般要求模型的TRE和ASE均在 ± 3%以内,MPE小于3%,MPSE小于15%。另外,残差图也是评价模型的重要参考依据。一个好的模型,残差应当呈随机分布。也就是说,模型每个区段的总体相对误差TRE都应该相差不大,一般应在 ± 5%以内。为了评价模型的广泛适用性,还采用检验样本进行独立交叉检验,计算模型的总体相对误差TRE是否在允许误差范围内。
1.1. 数据资料
1.2. 建模方法
1.2.1. 回归估计方法
1.2.2. 分段建模方法
1.2.3. 模型评价方法
-
利用3种针叶林的3000个样地的每公顷蓄积量和生物量数据,分别采用普通回归、加权回归1(权函数w1 = 1/V)和加权回归2(权函数w2 = 1/V k)拟合线性生物量模型(1),其拟合结果和评价指标见表2。
林分类型
Forest type估计方法
Method参数估计值 Parameter estimate 评价指标 Evaluation indices a0 b0 R2 SEE/m3 TRE/% ASE/% MPE/% MPSE/% 落叶松 Larix spp. 普通回归 OR 10.4923 0.7409 0.953 15.00 0.00 −4.84 0.81 15.26 加权回归1 WR1 0.0811 0.8659 0.919 19.64 −5.02 −0.02 1.06 12.74 加权回归2 WR2 0.2827 0.8342 0.937 17.33 −1.59 2.86 0.93 12.90 油松 Pinus tabulaeformis 普通回归 OR 3.2800 1.0706 0.914 16.57 0.00 −5.28 1.56 18.71 加权回归1 WR1 0.0476 1.1300 0.911 16.85 −0.91 0.00 1.58 15.43 加权回归2 WR2 0.0653 1.1243 0.912 16.79 −0.44 0.36 1.58 15.44 杉木 Cunninghamia lanceolata 普通回归 OR 10.1919 0.6172 0.938 14.04 0.00 −5.79 1.01 16.85 加权回归1 WR1 0.0551 0.7461 0.886 18.94 −6.22 −0.01 1.36 13.36 加权回归2 WR2 0.2562 0.7121 0.914 16.44 −1.98 3.58 1.18 13.76 注:加权回归1的评价指标是针对生物量模型(1)而不是生物量转换因子模型(2),加权回归2的权函数为w2 = 1/V 0.7。
Note:The values of evaluation indices in WR1 are for the biomass model (1), not for the biomass conversion factor model (2), and the weighted function in WR2 is w2 = 1/V 0.7; WR means weighted regression, and OR means ordinary regression.Table 2. The parameter estimates and evaluation indices of stand-level biomass models
从表2可以明显看出,不论是2个参数的估计值还是6项评价指标,加权回归2的结果都居于普通回归和加权回归1之间,且更接近加权回归1的结果,唯有TRE和ASE这2项指标比较特殊:普通回归TRE为0,ASE较大;加权回归1则ASE接近于0,TRE较大;而加权回归2则处于折中状态,TRE和ASE都与0相差不大,尽可能同时控制在预定的误差范围内(如 ± 3%以内)。尽管从R2、SEE和MPE这3项指标看,普通回归模型要好些,但从ASE和MPSE看,则普通回归模型要显著差些。最后,再来看另外一项重要指标总体相对误差TRE,为了更深入了解模型在不同生物量等级的拟合效果,表3分别落叶松、油松和杉木按建模样本和检验样本列出了总体和各个生物量等级的TRE。
林分类型
Forest type生物量等级
Biomass class/(t·hm−2)建模样本 Modeling plots 检验样本 Validation plots 普通回归 OR 加权回归1 WR1 加权回归2 WR2 普通回归 OR 加权回归1 WR1 加权回归2 WR2 落叶松 Larix spp. < 50 −19.95% 2.02% 5.00% −19.53% 2.90% 5.90% 50~100 −0.82% −1.36% 2.10% −0.69% −1.20% 2.27% 100~150 2.09% −4.36% −0.89% 1.83% −4.64% −1.17% ≧ 150 2.28% −7.50% −4.08% 4.40% −5.24% −1.74% 合计 Total 0.00% −5.02% −1.59% −2.07% −2.37% 1.05% 油松 Pinus tabulaeformis < 50 −13.22% −6.59% −6.18% −12.86% −5.81% −5.40% 50~100 −1.83% −2.71% −2.24% 0.76% 0.01% 0.49% 100~150 2.45% −0.22% 0.27% 5.40% 2.75% 3.25% ≧ 150 7.71% 3.89% 4.41% 9.91% 6.34% 6.87% 合计 Total 0.00% −0.91% −0.44% −0.68% 0.06% 0.53% 杉木 Cunninghamia lanceolata < 50 −19.85% 2.48% 6.35% −18.97% 4.34% 8.26% 50~100 1.71% −2.00% 2.37% 1.11% −2.63% 1.71% 100~150 3.06% −6.71% −2.43% 3.70% −6.03% −1.72% ≧ 150 1.67% −10.76% −6.61% 2.52% −9.68% −5.49% 合计 Total 0.00% −6.22% −1.98% −5.50% −1.64% 2.59% Table 3. The total relative errors of stand-level biomass models
从表3可以看出,不论是考虑建模样本还是检验样本,加权回归模型的结果都要优于普通回归模型,而加权回归模型2又要略优于加权回归模型1。因此,从模型本身特性、6项评价指标及独立检验结果综合考虑,应当采用加权回归模型2的拟合结果。
然而,如果再仔细查看表3中加权回归模型2在各个生物量等级的TRE(加粗的部分),发现还是存在一些不足,如:生物量小的区段总体上表现为正偏,而生物量大的区段总体上表现为负偏(油松相反);部分区段TRE较大,超出了 ± 5%的范畴。根据对残差图所作的分析,生物量小的区段容易出现较大偏差,因此,如果采用分段建模方法,应该能提高预估精度。综合考虑样本量的支撑程度和规范统一性,本研究将自变量V = 50 m3·hm−2设置为分段建模的链接点,同时建立了式(6)和式(7)两套模型,拟合结果见表4,基于建模样本和检验样本计算的各个生物量等级的总体相对误差TRE见表5。
林分类型
Forest type模型
Model参数估计值 Parameter estimate 评价指标 Evaluation indices a1 b1 a2 b2 R2 SEE/m3 TRE/% ASE/% MPE/% MPSE/% 落叶松 Larix spp. (6) 0.1162 0.9292 8.2572 0.7664 0.953 15.07 −0.10 1.15 0.81 11.56 (7) 0.0676 0.9797 11.7874 0.7453 0.955 14.74 −0.52 −0.49 0.79 11.39 油松 Pinus tabulaeformis (6) 0.0413 1.1434 3.0528 1.0832 0.915 16.54 0.07 0.08 1.55 15.41 (7) 0.0300 1.1575 4.3150 1.0718 0.915 16.50 −0.24 −0.55 1.55 15.42 杉木 Cunninghamia lanceolata (6) 0.1004 0.7867 6.9799 0.6491 0.936 14.23 0.23 2.46 1.02 11.90 (7) 0.0170 0.8653 12.4800 0.6160 0.941 13.63 −0.57 −0.63 0.98 11.57 注:用黑体表示的参数估计值,是根据其他3个参数推算的。
Note:The black parameter estimates are derived from other three.Table 4. The parameter estimates and evaluation indices of segmented biomass models
林分类型
Forest type生物量等级
Biomass class/(t·hm−2)建模样本 Modeling plots 检验样本 Validation plots 模型(6)Model(6) 模型(7)Model(7) 模型(6)Model(6) 模型(7)Model(7) 落叶松 Larix spp. < 50 −4.53% −9.10% −3.72% −8.32% 50~100 −0.77% −2.98% −0.63% −2.85% 100~150 0.81% 0.47% 0.54% 0.21% ≧ 150 0.19% 1.05% 2.35% 3.09% 合计 Total −0.10% −0.52% −0.31% −1.94% 油松 Pinus tabulaeformis < 50 −5.01% −10.32% −4.20% −9.69% 50~100 −1.61% −2.98% 1.16% −0.42% 100~150 0.64% 1.27% 3.65% 4.19% ≧ 150 4.65% 6.49% 7.16% 8.66% 合计 Total 0.11% −0.56% 1.23% −0.51% 杉木 Cunninghamia lanceolata < 50 −1.76% −9.61% −0.17% −8.25% 50~100 1.75% −1.27% 1.13% −1.85% 100~150 1.03% 1.26% 1.70% 1.88% ≧ 150 −1.34% 0.55% −0.39% 1.31% 合计 Total 0.23% −0.57% 0.77% −3.11% Table 5. The total relative errors of segmented biomass models
从表4的6项评价指标看,模型(6)和(7)之间的差异不明显;但从表5的对比可以看出,模型(6)明显优于模型(7),每个生物量等级的误差基本都在 ± 5%以内。除油松的分段模型改进甚微外,落叶松和杉木的分段模型有显著改进,杉木分段模型各生物量等级的误差甚至达到了 ± 2%以内。因此,综合考虑模型的各项评价指标及检验结果,最终选定分段模型(6)作为3种针叶林分的生物量估计模型。
-
本研究针对我国在林分生物量建模方面存在的样本数量偏少、建模方法简单、评价指标单一等问题,基于第九次全国森林资源清查3000个固定样地的实测数据,综合利用加权回归方法和分段建模方法,建立了落叶松、油松、杉木3种主要针叶林的每公顷生物量模型。最终确定的分段回归模型如下:
其确定系数R2在0.915~0.953之间,平均预估误差MPE在0.81%~1.55%之间,平均百分标准误差MPSE在11.56%~15.41%之间。林分生物量与蓄积量呈线性相关,这与方精云等[22]的研究结论是一致的。但是,由于在样本数量、建模方法等方面存在的差异,模型的适用性肯定会有很大不同。在引言中提到方精云等[22]建立的21个林分类型的生物量模型,建模样本数量在30以上的仅有以下3个模型:
表6列出了利用本研究所收集的全部样地对这3个模型的检验结果。可以看出,3个模型不仅总体的TRE远远超出了允许误差范围,不同生物量等级的估计值更是存在非常大的系统偏差。通过与本研究所建模型参数进行对比,发现式(13)~(15)的截距参数都要偏大,而斜率参数都要偏小,这正是对蓄积量小的样地会产生正偏而对蓄积量大的样地会产生负偏的直接原因。之所以其参数估计值出现大的偏差,主要原因应该是参数估计方法不恰当,采用的是普通回归而不是加权回归。其次,样本量的大小及样本结构的好坏也是影响因素之一。笔者曾试图系统抽取表1中全部样本的2/3建模、1/3检验,尽管建模样本数量大幅增加,但因为样本结构不理想,建模结果并未达到预期要求。因此,建模成功的要素,一是样本数量足够;二是样本结构合理;三是建模方法科学。表6也列出了利用全部样本对本研究所建模型的检验结果,总相对误差都在 ± 1%以内,各个生物量等级的估计误差大都在 ± 5%以内,最大的也未超出 ± 10%的范围。这样的模型,才是适用性广的模型。
生物量等级
Biomass class/(t·hm−2)落叶松 Larix spp. 油松 Pinus tabulaeformis 杉木 Cunninghamia lanceolata 模型(13)
Model (13)模型(10)
Model (10)模型(14)
Model (14)模型(11)
Model (11)模型(15)
Model (15)模型(12)
Model (12)< 50 101.71% 4.23% −6.84% 7.90% 49.42% 0.46% 50~100 16.91% 0.68% −24.67% 2.02% −14.17% −1.31% 100~150 1.17% −0.67% −29.48% −2.37% −24.12% −1.27% ≧150 −7.01% −0.47% −33.23% −6.46% −27.40% 1.22% 合计Total 11.62% 0.19% −25.19% −0.20% −6.26% −0.52% Table 6. The comparison of total relative errors of different biomass models
图2展示了落叶松生物量模型(10)和模型(13)的残差分布,可以看出,因为模型(13)的截距参数a0 = 33.8060,会得出每公顷蓄积量为0的落叶松林其生物量高达33.8 t·hm−2的结果,从而导致每公顷蓄积量较小的林分,其生物量估计结果出现正偏;每公顷蓄积量较大的林分,其生物量估计结果出现负偏。其他2个树种的生物量模型(11)、(12)与模型(14)、(15)的残差分布对比情况也类似,为省篇幅,不再列出。