-
森林生态系统中存储的生物量-碳储量是全球碳循环的基础。研究表明,全球森林生态系统大约含有861 ± 66 Gt碳储量[1],这对于全球气候调节服务至关重要[2]。生物量估计的常用方法是建立回归模型,目前,国内外研建了大量的单木生物量模型[3-7],这些单木模型是林分生物量计算的基础。由于森林资源调查数据中可能没有单木数据,仅记录了林分因子,导致单木生物量模型的应用受限。而在大尺度上更直接有效的方法是建立林分生物量模型,利用林分因子估计生物量,但是林分层次的生物量模型并不多见[8-10]。此外,为了制定应对气候变化的适应性经营策略,迫切需要了解气候对生物量估算的影响。Rudgers等[11]发现林木生物量及其分配会受到气候的影响,使得生物量模型的参数变化,进而影响生物量估计结果。Fu等[12]和Zeng等[13]建立了气候敏感的单木生物量异速生长方程,发现气候与生物量之间存在显著关系。Usoltsev等[14]将气候变量引入可加性林分生物量方程中以确定气候对林分生物量的影响。因此,在生物量估计模型中应考虑气候变量,以减少模型的不确定性。
常见的模型参数估计方法是最小二乘法,然而森林生长受到立地质量[15]和外界干扰[16]的影响,可能导致调查数据存在较多的离群点,加上生物量数据的异方差性[17],如果使用最小二乘方法求解参数可能会导致模型参数的有效性降低,引起模型的不确定性增加[18]。因此,有学者提出了用稳健回归来尽可能降低离群点对参数估计的影响[19],郭清文等[18]的实验结果证明:基于稳健回归的生物量模型不仅能有效降低建模数据中离群点带来的影响,还使得参数估计在理论上接近最优。
本研究利用东北和华北地区的落叶松(Larix spp.)人工林生物量数据,比较稳健回归方法和普通最小二乘方法求解林分生物量模型的差异,并在模型中考虑气候因子,量化分析林分因子和气候因子对林分生物量(包括林分地上生物量AGB和林分总生物量TGB)的解释率,以期为大尺度生物量精准估计提供基础模型和方法。
HTML
-
数据来源于黑龙江、吉林、辽宁、北京、河北、山西和内蒙古等7个省份(34°34′~53°33′ N,97°12′~135°05′ E)第8次森林资源连续清查(2009—2013)中的落叶松人工纯林固定样地。经逻辑检查后共得到445块有效样地数据。样地调查因子包括平均年龄、平均胸径以及平均高等,其中平均高是在样地中测量3 ~ 5株平均木的树高取平均值得到。考虑到划分训练集和验证集可能会导致气候因子对林分生物量的解释率量化受到抽样的影响,因此本研究没有进行样本划分,各因子统计量见表1。气候因子来自ClimateAP[20],根据每个样地的地理坐标和海拔下载,气候因子变量名及其描述见表2,样地气候因子为1981 — 2010期间的平均值。
变量
Variables平均值Mean 标准差S.D. 最小值Min. 最大值Max. 平均年龄 Age/a 28 9 11 60 平均高 H/m 12.0 4.0 4.2 24.0 株数密度 N/(株·hm−2) 1021 595 263 3933 平均胸径 Dg/cm 13.4 4.3 6 26.4 林分蓄积 V/(m3∙hm−2) 82.81 53.22 3.28 282.25 地上生物量 AGB/(t∙hm−2) 53.98 33.49 2.75 168.07 总生物量 TGB/(t∙hm−2) 72.05 44.53 3.74 226.50 Table 1. Summary statistics of stand variables and biomass
变量 Variables 描述 Description AHM 湿热指数
Annual heat: moisture indexCMD 哈格里夫斯气候水分亏缺
Hargreaves climatic moisture deficitDD_0 0℃以下的天数
Degree-days below 0℃DD_18 18℃以下的天数
Degree-days below 18℃DD18 18℃以上的天数
Degree-days above 18℃DD5 5℃以上的天数
Degree-days above 5℃EMT/℃ 近30年期间的极端最低气温
Extreme minimum temperature over a 30-year periodEXT/℃ 近30年期间的极端最高气温
Extreme maximum temperature over a 30-year periodEREF 哈格里夫斯相对蒸发
Hargreaves reference evaporationMAP/mm 年平均降水量
Mean annual precipitation (mm)MAT/℃ 年平均温度
Mean annual temperatureMCMT/℃ 最冷月份的平均温度
Mean coldest month temperatureMWMT/℃ 最暖月份的平均温度
Mean warmest month temperatureNFFD 无霜期天数
The number of frost-free daysPAS/mm 上年8月至当年度7月期间的降雪量
Precipitation as snow between August in previous year and July in current yearTD/℃ 最暖月份的平均温度和最冷月份的平均温度之差
Temperature difference between MWMT and MCMT, or continentalityTable 2. The name of climatic variables and its description
-
林分生物量使用单木生物量模型计算,然后累加得到。我国林业行业标准《LY/T 2654—2016:立木生物量模型及碳计量参数—落叶松》[4]中就提供了落叶松的单木生物量模型,对于有行业标准的伴生树种也采用行业标准中给出单木生物量模型进行计算,剩余树种则使用文献[3]和[5]中给出的单木生物量模型进行计算。
-
最小二乘是回归模型参数求解的常用方法,但如果建模数据中存在离群点且排除是数据录入错误等原因所导致的,则使用最小二乘回归可能得到的不是最优估计。而稳健回归是在剔除离群点和保留离群点之间的一个折中,根据观测值的稳健情况对每个样本点进行赋权,对应的优化目标为式(1)。
式中,wi是第i个样本对应的权重,yi为第i个样本的因变量实测值;
$ {\widehat{y}}_{i} $ 为第i个样本的模型估计值。本研究使用Huber提出的稳健回归方法(式2)[19],可以看出权重估计依赖于残差分布,而残差估计又反过来需要权重。因此,稳健回归是一个迭代重复加权最小二乘直到结果收敛,获得稳健的参数估计结果的过程。
式中,wj表示第j次迭代的权函数;uj表示第j次迭代的标准化残差。
-
董利虎等[9]指出落叶松林分生物量模型的误差结构是相乘的,本研究以式(3)~(6)作为基础林分生物量模型,分别采用最小二乘法和稳健回归法求解模型参数。因为使用对数回归来消除生物量数据的异方差,在预测时会产生偏差,曾伟生等[21]详细讨论了非线性模型对数回归的偏差矫正原理与方法,本研究采用Baskerville[22]提出的校正因子CF,对模型进行矫正。
式中,B为林分生物量,包括AGB和TGB;Dg为林分平均胸径;N为株数密度;H为林分平均高;βi(i = 1 ~ 4)为模型参数;
$\varepsilon $ 为误差项。向最优基础林分生物量模型中添加气候变量,为了降低气候变量的共线性,本研究采用主成分分析和相关分析方法筛选气候变量,步骤如下:(1)对所有气候变量进行主成分分析;(2)选择因子载荷较大的气候变量;(3)通过相关分析筛选出气候变量之间相关性较低但和林分生物量相关性较高的气候变量。最后利用筛选出来的气候变量建立气候敏感的林分生物量模型。
-
模型评价包括两方面:首先确保模型参数在0.05水平下显著;其次使用决定系数(R2)、均方根误差(RMSE)、相对均方根误差(rRMSE)等指标对模型进行评价,公式见文献[23]。
-
林分生物量的总解释率可被划分为:(1)独立解释的部分(a:林分因子的独立解释率,c:气候因子的独立解释率);(2)共变的部分(b),即无法确定是由哪个因子所解释的部分;(3)模型不可解释的部分(d)。计算方法如下:含林分因子和气候因子的全模型的R2即为总解释率a + b + c,且存在a + b + c = 1−d的关系,最优基础林分生物量模型的R2为a + b,仅以气候因子为自变量的林分生物量模型的R2为b + c。由上述关系可计算a、b、c和d。
1.1. 数据来源
1.2. 林分生物量计算
1.3. 最小二乘回归与稳健回归
1.4. 基础林分生物量模型与气候敏感的林分生物量模型的建立
1.5. 模型评价
1.6. 各因子解释率量化
-
所有模型参数在0.05水平下显著(表3、表4)。对于同一形式的模型,2种方法的参数估计值略有差异,从参数符号可以看出AGB和TGB均随Dg、N和H的增加而增加,但CF没有明显的区别。从基础模型的评价指标发现,AGB模型优于TGB模型。对于AGB而言,采用直接引入变量的模型比变量组合形式的模型拟合效果要好,除5号和6号模型的评价指标显示出普通最小二乘回归略优于稳健回归外,其余模型均显示出稳健回归略优于普通最小二乘回归,其中模型8的R2最高,可达0.967,稳健回归的RMSE和rRMSE要比普通最小二乘回归分别低0.046 t∙hm−2和0.085%,二者差异不大。对于TGB而言,其规律和AGB相似,所有TGB模型中,15号和16号模型的R2可达0.953,稳健回归的误差统计量略好一些,但比AGB模型低0.014。由于建模数据的质量较好,两种方法建立的模型没有太大差异,稳健回归的优越性没有得到充分体现,甚至普通最小二乘回归略优于稳健回归。不论是AGB还是TGB,最优基础模型形式相同,采用稳健回归的方法求得的参数略优。因此,本研究分别以模型8和模型16作为AGB和TGB的最优基础林分生物量模型,用于解释率的量化分解。
序号
Number模型
Model方法
Method模型参数 Model parameters R2 RMSE/(t∙hm−2) rRMSE/% CF β1 β2 β3 β4 1 式3 OLS −9.279 0 (0.097 9) 2.472 5 (0.018 4) 0.992 7 (0.010 5) — 0.940 8.203 15.198 1.058 28 2 Huber −9.274 9 (0.099 8) 2.471 8 (0.018 8) 0.992 3 (0.010 7) — 0.940 8.197 15.186 1.058 28 3 式4 OLS −8.337 2 (0.116 6) 0.805 2 (0.007 6) 0.889 6 (0.012 9) — 0.927 9.050 16.766 1.073 51 4 Huber −8.324 0 (0.114 3) 0.808 2 (0.007 4) 0.884 0 (0.012 6) — 0.928 8.997 16.669 1.073 57 5 式5 OLS −9.066 0 (0.095 0) 0.986 7 (0.009 9) 0.453 2 (0.019 1) — 0.961 6.639 12.299 1.055 24 6 Huber −9.069 3 (0.098 3) 0.984 4 (0.010 3) 0.466 5 (0.019 8) — 0.959 6.764 12.531 1.055 28 7 式6 OLS −9.044 7 (0.085 8) 2.184 7 (0.027 6) 0.295 6 (0.023 3) 0.960 5 (0.009 3) 0.966 6.145 11.384 1.049 74 8 Huber −9.001 8 (0.090 6) 2.153 2 (0.029 1) 0.326 1 (0.024 6) 0.955 1 (0.009 9) 0.967 6.099 11.299 1.049 84 注:1.括号中的数值为参数标准差:2.OLS代表普通最小二乘回归,Huber代表稳健回归。下同。
Notes: 1.The value in parentheses is the standard deviation of the parameter. 2.OLS stands for general least square regression, Huber stands for robust regression. The same as below.Table 3. Fitting and evaluation results of basic stand aboveground biomass model
序号
Number模型
Model方法
Method模型参数 Model parameters R2 RMSE/(t∙hm−2) rRMSE/% CF β1 β2 β3 β4 9 式3 OLS −8.959 7 (0.115 5) 2.468 9 (0.021 7) 0.989 4 (0.012 4) — 0.914 13.083 18.158 1.069 22 10 Huber −8.959 2 (0.120 1) 2.469 9 (0.022 6) 0.989 0 (0.012 9) — 0.913 13.112 18.199 1.069 22 11 式4 OLS −8.051 4 (0.120 0) 0.807 1 (0.007 8) 0.888 0 (0.013 2) — 0.926 12.109 16.807 1.075 74 12 Huber −8.040 9 (0.117 9) 0.810 6 (0.007 6) 0.882 2 (0.013 0) — 0.926 12.066 16.747 1.075 80 13 式5 OLS −8.695 1 (0.106 2) 0.972 5 (0.011 1) 0.488 2 (0.021 4) — 0.950 9.902 13.744 1.061 94 14 Huber −8.681 5 (0.110 0) 0.967 5 (0.011 5) 0.508 0 (0.022 1) — 0.949 10.032 13.924 1.062 00 15 式6 OLS −8.677 2 (0.100 6) 2.122 0 (0.032 4) 0.356 4 (0.027 3) 0.950 6 (0.011 0) 0.953 9.687 13.445 1.058 58 16 Huber −8.634 2 (0.104 4) 2.089 2 (0.033 6) 0.390 6 (0.028 4) 0.944 4 (0.011 4) 0.953 9.628 13.364 1.058 69 Table 4. Fitting and evaluation results of basic stand total biomass model
-
主成分分析表明,前3个主成分的贡献率分别为56.0%、22.9%、16.7%,其中第一主成分中载荷大于0.3的气候变量有:MAT,NFFD,EMT,主要是和温度有关的气候变量;第二主成分中载荷大于0.3的气候变量有:CMD,AHM,主要是和湿热特征有关的气候变量;第三主成分中载荷大于0.33的气候变量有:TD,EXT,MWMT,主要是和极端天气有关的气候变量。从相关分析(表5)的结果看出:AGB和TGB的结果相似,都与AHM和CMD的相关系数较高,而与其他气候因子的较低。由于AHM和CMD之间的相关系数为0.856,而AHM和林分生物量的关系更密切,因此将AHM添加到最优基础林分生物量模型中,得到气候敏感的林分生物量模型。
变量 Variables AGB TGB MAT NFFD EMT CMD AHM TD EXT MWMT AGB 1 0.999 −0.085 −0.090 −0.082 −0.285 −0.350 0.074 −0.025 −0.059 TGB 1 −0.082 −0.078 −0.084 −0.306 −0.363 0.094 −0.001 −0.037 MAT 1 0.956 0.937 0.053 0.376 −0.555 0.461 0.698 NFFD 1 0.870 −0.076 0.296 −0.373 0.545 0.802 EMT 1 0.095 0.418 −0.758 0.179 0.458 CMD 1 0.856 −0.249 −0.102 −0.114 AHM 1 −0.389 0.040 0.142 TD 1 0.430 0.202 EXT 1 0.915 MWMT 1 Table 5. Correlation coefficient matrix between stand biomass and some climatic variables
从表6看出,气候敏感的林分生物量模型(模型17 ~ 20)的参数均显著,2种算法的参数估计结果略有差异,AGB和TGB均随AHM增加而降低,但矫正因子CF基本没有差异。根据评价指标,稳健回归稍优于普通最小二乘回归,而气候敏感的模型明显优于最优基础模型:对于AGB,模型18与4相比,R2提高了0.41%,而RMSE和rRMSE降低了6.85%;对于TGB,模型20与16相比,R2提高了0.63%,而RMSE和rRMSE降低了6.79%。这说明建立气候敏感的林分生物量在统计上是合理的,气候因子对林分生物量有显著影响,加入AHM后,模型的拟合优度提升。本研究分别以模型18和模型20作为AGB和TGB的最优气候敏感的林分生物量模型,用于解释率的量化分解。
序号
Number模型
Model方法
Method模型参数 Model parameters R2 RMSE/
(t∙hm−2)rRMSE/% CF β1 β2 β3 β4 β5 17 log(AGB) = β1 + β2 × log(Dg) +
β3 × log(H)+β4 × log(N) +
β5 × log(AHM)OLS −8.105 4
(0.101 2)2.202 1
(0.023 4)0.225 69
(0.020 4)0.957 8
(0.007 9)−0.257 7
(0.019 4)0.971 5.730 10.616 1.041 89 18 Huber −8.090 6
(0.106 0)2.191 8
(0.024 5)0.238 6
(0.021 3)0.955 1
(0.008 3)−0.258 3
(0.020 3)0.971 5.708 10.575 1.041 92 19 log(TGB) = β1 + β2 × log(Dg) +
β3 × log(H)+β4 × log(N) +
β5 × log(AHM)OLS −7.581 4
(0.118 9)2.142 3
(0.027 5)0.274 8
(0.023 40)0.947 6
(0.009 3)−0.300 6
(0.022 8)0.959 9.037 12.543 1.049 41 20 Huber −7.561 2
(0.124 3)2.130 2
(0.028 7)0.290 3
(0.025 0)0.944 0
(0.009 7)−0.301 8
(0.023 8)0.959 9.016 12.514 1.049 44 Table 6. Fitting and evaluation results of climate sensitive stand biomass basic model
-
分别以AGB和TGB为对象,量化气候因子和林分因子对林分生物量的贡献,结果如图1所示。对于AGB:气候因子的总解释率(b + c)为9.73%,其中独立解释部分(c)为0.40%,而林分因子的总解释率(a + b)为96.70%,独立解释部分(a)为87.37%,共变部分(b)为9.33%,二者的总解释率(a + b + c)为97.10%。对于TGB:气候因子的总解释率(b + c)为10.58%,其中独立解释部分(c)为0.60%,而林分因子的总解释率(a + b)为95.30%,独立解释部分(a)为85.32%,共变部分(b)为9.98%,二者共同解释率为95.90%。总的来看,林分因子对林分生物量的解释率很高,加入气候因子后模型解释率明显提升,但其中共变部分较大,气候因子的独立解释率不到1%。气候因子对AGB的独立解释率小于对TGB的独立解释率,说明不同组分的生物量对于气候的响应程度有所不同。