-
杜仲(Eucommia ulmoides Oliv.) 为杜仲科杜仲属落叶乔木,栽培与利用的历史长达两千多年,是第四纪冰川侵袭后仅留存在我国的单属种孑遗树种,也是目前我国重要的经济林和工业原料林树种,属国家二级保护野生植物,在国内29个省(区、市)均有种植[1]。杜仲叶富含多种化学成分,包括黄酮类、环烯醚萜类、苯丙素类、木脂素类等,具有很高的药用价值[2]。此外,杜仲叶在功能食品、保健品及功能饲料等领域也有广阔的应用[3]。2018年,杜仲叶拟被国家卫健委会列为药食同源目录[4]。
植物叶片表型特征与植物生理生化及繁殖特征具有密切的相关关系,直接影响植物的基本行为与功能[5-6]。因此,叶片表型性状多样性是遗传多样性的具体表现,研究叶片表型遗传多样性有助于了解物种遗传规律和变异程度,尤其是对种质资源收集、保存、评价与利用等具有重要意义[7-9]。研究表明,在器官形态上不同种质杜仲表现出明显的变异,根据叶色和叶形发现有紫红叶、小叶、大叶及长叶柄等变异类型,根据枝条形态发现有短枝、龙拐杜仲等变异类型,杜仲叶片主要活性物质含量及橡胶含量也发现有显著的差异[10-12]。
近年有关杜仲种质资源遗传多样性研究已有报道,主要集中在雄花和果实形态性状多样性[13-14],雄花和叶片活性成分多样性[15-16]及采用分子标记技术对杜仲种质资源遗传多样性和群体遗传结构进行研究[17];但关于杜仲种质资源叶片表型性状遗传多样性尚未开展系统研究,在表型特征中,叶片变异是遗传变异的重要体现[18]。本文以701份杜仲种质资源叶片为研究对象,对 14个表型性状进行测定,通过多样性分析、相关性分析、聚类分析、随机森林类群分类预测等方法,旨在系统全面揭示杜仲种质资源叶片表型性状遗传变异规律,以期为杜仲优良资源选育和优异性状的挖掘提供科学依据。
-
701份供试材料来自中国林业科学研究院经济林研究所杜仲种质资源库(113°36′ E,34°55′ N),种质资源库采用6株小区,定植株行距 3 m × 3 m,其栽培立地条件及管理方式均一致。于2019年7月初对资源库8年生杜仲成熟叶片进行采集,每份种质选择长势一致、无病虫害的4~6株,每株均从东南西北4个方向选取中部枝条,采取各枝条中部新鲜成熟叶片30片,低温冷藏带回实验室进行表型性状测定与分析。种质来源与数量见表1。
来源 Germplasm sources 样本数/株 Sample numbers 来源 Germplasm sources 样本数/株 Sample numbers 安徽亳州 Bozhou,Anhu 5 湖南江垭 Jiangya,Hu’nan 28 北京杜仲公园 Eucommia Park,Beijing 263 湖南株洲 Zhuzhou,Hu’nan 5 北京清华大学 Tsinghua University,Beijing 4 吉林集安 Ji’an,Jilin 9 北京万泉河路 Wanquanhe Road,Beijing 25 江苏响水 Xiangshui,Jiangsu 18 福建建阳 Jianyang,Fujian 7 江西南昌 Nanchang,Jiangxi 2 广西漠川 Mochuan,Guangxi 10 山东济南 Ji’nan,Shandong 3 贵州遵义 Zunyi,Guizhou 21 山东青州 Qingzhou,Shandong 2 河北安国 Anguo,Hebei 36 山西侯马 Houma,Shanxi 7 河南鹤壁 Hebi,He’nan 8 山西运城 Yuncheng,Shanxi 4 河南洛阳 Luoyang,He’nan 92 陕西略阳 Lueyang,Shaanxi 4 河南南阳 Nanyang,He’nan 8 陕西杨陵 Yangling,Shaanxi 3 河南汝阳 Ruyang,He’nan 13 四川广元 Guangyuan,Sichuan 16 河南三门峡 Sanmenxia,He’nan 4 新疆阿克苏 Aksu,Xinjiang 6 河南商丘 Shangqiu,He’nan 34 新疆乌鲁木齐 Urumqi,Xinjiang 6 河南新乡 Xinxiang,He’nan 17 云南盐津 Yanjin,Yunnan 7 河南郑州 Zhengzhou,He’nan 8 浙江杭州 Hangzhou,Zhejiang 6 湖北神农架 Shennongjia,Hubei 5 重庆沙坪坝 Shapingba,Chongqing 7 湖北武汉 Wuhan,Hubei 8 Table 1. Number and origin of germplasm resources
-
鲜比叶质量:用直径1 cm的打孔器在10个叶片上打取50个圆片,电子天平称量;干比叶质量:50个鲜圆片烘干后的质量;叶片含水量:50个鲜圆片质量与相应50个干圆片质量之差;节间距:量取枝条的长度和叶痕总数,枝条长度与相应叶痕总数的比值,量取5根枝条取平均值;叶柄长:用游标卡尺测量10个叶片取平均值;用万深LA-S植物叶片图像分析仪(杭州万深检测科技有限公司)测量叶片长、叶片宽、长宽比、叶面积、叶片红色成分、叶片蓝色成分、叶片绿色成分、叶绿素参考值、叶周长,测量10个叶片取平均值。RGB颜色模型是一种颜色标准,本文通过采用RGB系统模型中的红色成分、蓝色成分、绿色成分描述叶片颜色特征[19]。
-
叶片14个表型性状的最小值、最大值、平均值、标准差、变异系数和遗传多样性指数用 Excel软件进行处理和计算。遗传多样性指数用Shannon-wiener指数(H')表示,
$H^{\prime}=-\displaystyle\sum Pi\ln P i$ ,其中,Pi为某一性状第i级别试验材料份数占总份数的百分比。根据平均值(μ)和标准差(σ)将各性状划分为10级,从第1级(Xi<μ − 2σ)到第10级(Xi≥μ + 2σ),每0.5σ为1级,统计各级的分布频率[20]。基于杜仲14个表型性状,利用R统计软件进行相关性分析和主成分分析[21],采用ward.D2系统聚类对杜仲种质资源进行聚类,聚类方法采用平方欧氏距离,通过R扩展软件包randomForest来实现表型性状数据随机森林建模[22]。 -
在701份供试的杜仲资源中,各表型性状最小值、最大值、平均值、标准差、变异系数、多样性指数存在不同程度的差异(表2)。 14个表型性状的遗传多样性指数分布在1.90~2.09之间,平均多样性指数为2.04,其中,叶片长和叶柄长的遗传多样性指数最高(2.09),其次是叶片宽、叶周长、长宽比,含水量的遗传多样性指数最低(1.90)。
性状 Traits 最小值 Max 最大值 Min 平均值 Mean 标准差 SD 变异系数 CV/% 遗传多样性指数 H' 鲜比叶质量 Specific leaf fresh weight (SLFW)/g 1.17 2.97 1.96 0.20 9.99 2.03 干比叶质量 Specific leaf dry weight (SLDW)/g 0.46 1.07 0.73 0.09 12.14 2.06 含水量 Water content of leaf (WC)/g 0.58 2.26 1.23 0.13 10.65 1.90 节间距 Internode length (IL)/mm 0.34 3.44 2.18 0.36 16.54 2.06 叶片长 Leaf length (LL)/mm 94.15 181.17 135.90 14.63 10.77 2.09 长宽比 Length to width ratio of leaf (LTWR) 1.58 2.81 2.08 0.19 8.90 2.07 叶片宽 Leaf width (LW)/mm 43.11 95.93 65.76 7.44 11.32 2.08 叶面积 Leaf area (LA)/mm2 2 670.21 10 389.33 5 819.23 1 203.41 20.68 2.07 叶片红色成分 Red component of leaf (RC) 44.50 102.00 61.54 4.55 7.40 1.97 叶片蓝色成分 Blue component of leaf (BC) 22.00 57.00 35.78 3.24 9.05 2.02 叶片绿色成分 Green component of leaf (GC) 55.00 117.00 75.03 6.12 8.15 2.00 叶绿素参考值 Chlorophyll reference value (CRV) 1.64 3.91 3.29 0.15 4.57 1.99 叶周长 Leaf perimeter (LP)/mm 266.49 533.89 398.11 44.85 11.27 2.08 叶柄长 Stipe length (SL)/mm 1.00 2.75 1.72 0.31 18.27 2.09 平均值 Mean 11.41 2.04 Table 2. Statistical analysis of leaf phenotypic traits of Eucommia ulmoides germplasm resources
14个表型性状存在不同程度的变异,变异系数为4.57%~20.68%,平均值为11.41%,其中,叶面积、叶柄长和节间距具有较大的离散程度,叶面积的变异系数最大(20.68%),是叶片表型性状变异程度最大的性状,最大值为最小值的3.9倍,叶绿素参考值变异系数最小,为4.57%。
-
不同来源杜仲叶片14个性状平均值、标准差和多重比较(样本数大于10)结果(表3)表明:14个表型性状在不同来源间均有显著差异存在。山西杜仲资源叶片的叶绿素参考值、鲜比叶质量和干比叶质量最大、含水量最高,叶片蓝色成分最小;湖北杜仲资源的长宽比最大;四川杜仲资源的节间距、叶片长、叶片宽、叶面积和叶周长最大,鲜比叶质量最小,含水量最低;江苏杜仲资源的叶片绿色成分、红色成分最大,但其干比叶质量、叶片长、长宽比、叶面积、叶绿素参考值和叶周长均最小;河南种质资源的叶柄最长,湖北种质的叶柄最短。
性状 Traits 北京 Beijing 贵州 Guizhou 河北 Hebei 河南 He’nan 湖北 Hubei SLFW/g 1.99 ± 0.2 ab 1.86 ± 0.18 bc 1.95 ± 0.18 bc 1.97 ± 0.18 abc 1.95 ± 0.24 bc SLDW/g 0.74 ± 0.09 bc 0.69 ± 0.08 c 0.72 ± 0.09 bc 0.73 ± 0.08 bc 0.73 ± 0.13 bc WC/g 1.25 ± 0.14 ab 1.17 ± 0.11 bc 1.23 ± 0.11 ab 1.25 ± 0.12 ab 1.22 ± 0.13 ab IL/mm 2.13 ± 0.34 bc 2.09 ± 0.27 c 2.13 ± 0.31 bc 2.18 ± 0.36 bc 2.41 ± 0.30 a LL/mm 133.62 ± 13.85 c 132.76 ± 14.21 c 136.83 ± 12.01 c 137.67 ± 15.24 c 138.26 ± 9.34 bc LTWR 2.06 ± 0.17 bc 2.18 ± 0.22 ab 2.06 ± 0.13 bc 2.07 ± 0.18 bc 2.21 ± 0.29 a LW/mm 65.36 ± 6.90 abcd 61.39 ± 7.58 d 66.57 ± 5.26 abc 67.00 ± 8.55 ab 63.63 ± 7.96 bcd LA/mm2 5 717.80 ± 1119.10 bcd 5 304.72 ± 1210.55 cd 5 973.15 ± 967.72 abc 6 030.20 ± 1 344.96 abc 5 637.56 ± 915.01 cd RC 62.24 ± 4.68 a 61.57 ± 3.96 ab 61.07 ± 5.14 ab 61.41 ± 4.29 ab 58.96 ± 4.68 bc BC 35.86 ± 3.46 a 37.05 ± 2.46 a 35.47 ± 3.17 a 35.71 ± 3.04 a 35.89 ± 2.36 a GC 76.12 ± 5.97 ab 73.79 ± 4.36 abc 75.58 ± 7.00 ab 74.89 ± 6.05 ab 72.82 ± 6.91 bc CRV 3.26 ± 0.16 cd 3.27 ± 0.12 cd 3.28 ± 0.13 cd 3.30 ± 0.13 cd 3.34 ± 0.12 bc LP/mm 393.50 ± 40.33 bc 383.30 ± 43.11 c 398.24 ± 38.27 bc 403.47 ± 50.3 bc 396.82 ± 36.20 bc SL/mm 1.74 ± 0.32 ab 1.75 ± 0.33 ab 1.61 ± 0.31 abc 1.79 ± 0.28 a 1.49 ± 0.21 c 性状 Traits 湖南 Hu’nan 江苏 Jiangsu 山西 Shanxi 四川 Sichuan 新疆 Xinjiang SLFW/g 1.88 ± 0.15 bc 1.86 ± 0.18 bc 2.09 ± 0.17 a 1.84 ± 0.14 c 1.97 ± 0.15 abc SLDW/g 0.70 ± 0.08 c 0.70 ± 0.10 c 0.82 ± 0.08 a 0.71 ± 0.08 c 0.78 ± 0.07 ab WC/g 1.18 ± 0.08 bc 1.16 ± 0.10 bc 1.28 ± 0.11 a 1.13 ± 0.08 c 1.19 ± 0.09 abc IL/mm 2.11 ± 0.32 c 2.16 ± 0.32 bc 2.29 ± 0.28 abc 2.46 ± 0.32 a 2.36 ± 0.31 ab LL/mm 135.98 ± 12.2 c 123.75 ± 11.54 d 146.64 ± 19.08 ab 147.91 ± 12.05 a 134.38 ± 14.62 c LTWR 2.12 ± 0.18 abc 2.03 ± 0.21 c 2.16 ± 0.23 ab 2.14 ± 0.14 abc 2.06 ± 0.15 bc LW/mm 64.52 ± 5.69 abcd 61.84 ± 8.45 cd 68.49 ± 8.76 ab 69.51 ± 5.03 a 65.32 ± 4.41 abcd LA/mm2 5 715.55 ± 907.52 bcd 4 992.53 ± 1106.25 d 6 491.22 ± 1 471.75 ab 6 623.15 ± 1 007.96 a 5 718.37 ± 875.78 bcd RC 62.51 ± 3.40 a 62.92 ± 4.26 a 60.95 ± 3.58 ab 58.81 ± 3.83 bc 57.04 ± 5.19 c BC 35.29 ± 3.04 a 35.97 ± 3.63 a 32.77 ± 3.84 b 36.06 ± 2.83 a 35.04 ± 4.48 a GC 76.00 ± 4.10 ab 77.06 ± 6.69 a 72.82 ± 5.62 bc 70.41 ± 4.42 cd 68.71 ± 6.64 d CRV 3.29 ± 0.11 cd 3.23 ± 0.15 d 3.48 ± 0.14 a 3.40 ± 0.12 ab 3.48 ± 0.21 a LP/mm 387.07 ± 32.97 c 378.22 ± 45.78 c 419.35 ± 60.47 ab 433.18 ± 29.71 a 398.84 ± 34.74 bc SL/mm 1.67 ± 0.25 abc 1.57 ± 0.35 bc 1.76 ± 0.37 ab 1.62 ± 0.28 abc 1.51 ± 0.25 c 注:性状全称见表2。同行不同字母表示差异显著(P<0.05)。下同。 Notes: Traits details see Table 2. Different letters in indicate significant difference at P<0.05. The same below. Table 3. Comparison of leaf traits from different origin among Eucommia ulmoides germplasm (Mean±SD)
-
叶片14个性状的相关性分析结果(表4)表明:84对性状组合中有45对组合的相关性达极显著水平(P<0.01),其中,呈极显著正相关的有26对,呈极显著负相关的有19对;鲜比叶质量和含水量间的正相关系数最大(0.928),叶片绿色成分和叶绿素参考值间的负相关系数最大(−0.637),其中,鲜比叶质量与干比叶质量、含水量,叶面积与叶片长、叶片宽,叶周长与叶面积、叶片长、叶片宽,叶片红色成分与叶片绿色成分这8组性状的正相关性极高,相关系数均在0.80以上。叶面积与节间距、叶片长、叶片宽、叶绿素参考值、叶周长、叶柄长6个性状呈极显著正相关,与长宽比、叶片红色成分、叶片绿色成分3个性状呈极显著负相关。叶绿素参考值与干比叶质量、叶片长、叶片宽、叶面积、叶周长、叶柄长6个性状呈极显著正相关,与叶片红色成分、绿色成分、蓝色成分3个性状呈极显著负相关。叶柄长除与含水量、长宽比、叶片蓝色成分相关性不显著外,与鲜比叶质量、干比叶质量、含水量等10个性状呈显著相关(P<0.05)。
性状
TraitsSLFW SLDW WC IL LL LTWR LW LA RC BC GC CRV LP SL SLFW 1 SLDW 0.837** 1 WC 0.928** 0.574** 1 IL −0.098** −0.089* −0.087* 1 LL 0.004 0.048 −0.026 0.166** 1 LTWR −0.073 −0.056 −0.071 −0.021 0.344** 1 LW 0.066 0.094* 0.036 0.173** 0.684** −0.442** 1 LA 0.044 0.084* 0.009 0.181** 0.836** −0.141** 0.911** 1 RC −0.014 −0.071 −0.028 −0.105** −0.207** −0.041 −0.165** −0.191** 1 BC −0.050 −0.093* −0.012 0.052 −0.023 −0.036 0.001 −0.019 −0.248** 1 GC −0.026 −0.071 −0.010 −0.098** −0.250** −0.052 −0.191** −0.219** 0.876** −0.420** 1 CRV 0.071 0.154** 0.002 0.052 0.281** 0.087* 0.197** 0.244** −0.619** −0.426** −0.637** 1 LP 0.029 0.072 −0.006 0.198** 0.852** −0.003 0.818** 0.839** −0.161** −0.005 −0.209** 0.224** 1 SL 0.095* 0.114** 0.064 −0.081* 0.328** 0.024 0.296** 0.338** −0.084* −0.045 −0.121** 0.163** 0.288** 1 Table 4. Correlation analysis of 14 phenotypic traits in leaves of Eucommia ulmoides germplasm resources
-
对14个表型性状主成分分析(表5)发现:前6个主成分特征值均大于1,且累积贡献率达到89.211%,说明前6个主成分能解释绝大部分杜仲叶片性状变异。第1主成分中,叶面积的正向特征向量最大,为0.951,其次为叶周长、叶片长、叶片宽,分别为0.933、0.900、0.899,这些性状主要与叶片大小有关。第2主成分中,鲜比叶质量正向特征向量最大,为0.998,其次是含水量、干比叶质量,分别为0.912、0.857,这些性状主要与叶片水分含量和质量有关。第3主成分中,叶片绿色成分正向特征向量最大,为0.948,其次是叶片红色成分,为0.938,主要与叶片颜色有关。第4主成分中,叶绿素参考值正向特征向量最大,为0.603,代表了叶片的光合作用,叶片蓝色成分负向特征向量最大,为−0.972。第5主成分中,长宽比正向特征向量最大,为0.994,主要反映叶片的形状。第6主成分中,节间距正向特征向量最大,为0.831。从14个性状中提取出叶面积、鲜比叶质量、叶片绿色成分、叶绿素参考值、长宽比、节间距6个叶片表型性状,这些性状是导致杜仲种质叶片表型性状差异的主要因素,可作为杜仲种质资源的评价指标。
性状 Traits 主成分 Principal component 1 2 3 4 5 6 SLFW 0.020 0.998 −0.007 0.007 −0.019 −0.037 SLDW 0.059 0.857 −0.081 0.096 −0.016 −0.059 WC −0.010 0.912 0.045 −0.055 −0.018 −0.015 IL 0.234 −0.072 −0.072 −0.012 0.020 0.831 LL 0.900 −0.008 −0.115 0.024 0.380 −0.003 LTWR −0.050 −0.054 −0.046 0.028 0.994 −0.021 LW 0.899 0.040 −0.069 0.004 −0.405 0.011 LA 0.951 0.022 −0.090 0.022 −0.111 −0.002 RC −0.107 −0.005 0.938 0.091 −0.002 −0.030 BC −0.017 −0.042 −0.204 −0.972 −0.019 0.030 GC −0.151 −0.018 0.948 0.223 −0.025 0.001 CRV 0.178 0.056 −0.753 0.603 0.048 −0.029 LP 0.933 0.013 −0.065 0.003 0.046 0.049 SL 0.416 0.064 −0.077 0.032 0.058 −0.610 特征值 Eigenvalue 4.065 2.603 2.132 1.449 1.215 1.025 贡献率 Contribution rate/% 29.036 18.592 15.226 10.353 8.680 7.324 累计贡献率 Cumulative contribution rate/% 29.036 47.628 62.854 73.207 81.887 89.211 Table 5. Principal component analysis of phenotypic traits of 701 Eucommia ulmoides germplasm resources
-
根据14个表型性状,将701份杜仲种质划分为4个类群(图1),其中,第I类群包含的种质最多,有209份种质,其次是第Ⅳ类群有203份种质,第Ⅱ类群有178份种质,第Ⅲ类群有111份种质。分析4个类群杜仲种质资源的14个叶片表型性状(表6)发现:每个类群之间杜仲种质资源叶片的表型性状存在较大差异。第Ⅰ类群节间距、叶片长、叶片宽、叶面积、叶周长等形状均显著高于其他类群种质,第Ⅱ类群鲜比叶质量、干比叶质量、含水量均显著高于其他类群种质,第Ⅲ类群叶片长、叶片宽、长宽比、叶面积、叶周长和叶柄长均显著低于其他类群种质,第Ⅳ类群中叶片红色成分、绿色成分显著高于其他类群种质。
性状 Traits 项目 Items 类群 Group 第I类群 Group I 第Ⅱ类群 GroupⅡ 第Ⅲ类群 Group Ⅲ 第Ⅳ类群 Group Ⅳ SLFW/g 均值 ± 标准差 1.87 ± 0.15 c 2.18 ± 0.15 a 1.85 ± 0.15 c 1.92 ± 0.14 b 变异系数CV/% 8.02 6.88 8.11 7.36 SLDW/g 均值 ± 标准差 0.70 ± 0.07 bc 0.82 ± 0.07 a 0.69 ± 0.07 c 0.71 ± 0.07 b 变异系数CV/% 10.00 8.54 10.14 9.48 WC/g 均值 ± 标准差 1.18 ± 0.09 c 1.35 ± 0.14 a 1.16 ± 0.09 c 1.21 ± 0.09 b 变异系数CV/% 7.63 10.37 7.76 7.81 IL/mm 均值 ± 标准差 2.34 ± 0.34 a 2.08 ± 0.32 b 2.15 ± 0.43 b 2.12 ± 0.31 b 变异系数CV/% 14.53 15.38 20.00 14.85 LL/mm 均值 ± 标准差 146.72 ± 11.57 a 132.61 ± 12.26 c 117.74 ± 9.33 d 137.59 ± 10.50 b 变异系数CV/% 7.89 9.25 7.92 7.63 LTWR 均值 ± 标准差 2.10 ± 0.16 a 2.08 ± 0.19 a 2.03 ± 0.19 b 2.10 ± 0.20 a 变异系数CV/% 7.62 9.13 9.36 9.58 LW/mm 均值 ± 标准差 70.50 ± 6.76 a 64.34 ± 7.35 b 58.47 ± 4.65 c 66.10 ± 5.60 b 变异系数CV/% 9.59 11.42 7.95 8.47 LA/mm2 均值 ± 标准差 6 664 ± 1 144 a 5 594 ± 1 094 b 4 503 ± 578 c 5 866 ± 837 b 变异系数CV/% 17.17 19.57 12.84 14.27 RC 均值 ± 标准差 58.76 ± 2.82 d 60.58 ± 3.69 c 61.90 ± 4.19 b 65.05 ± 4.57 a 变异系数CV/% 4.80 6.09 6.77 7.02 BC 均值 ± 标准差 36.75 ± 2.84 a 35.37 ± 3.03 b 36.38 ± 2.57 a 34.82 ± 3.76 b 变异系数CV/% 4.80 8.57 7.06 10.81 GC 均值 ± 标准差 70.86 ± 3.53 d 73.73 ± 4.99 c 75.88 ± 5.04 b 80.01 ± 6.03 a 变异系数CV/% 4.98 6.77 6.64 7.53 CRV 均值 ± 标准差 3.36 ± 0.13 a 3.34 ± 0.12 a 3.24 ± 0.11 b 3.21 ± 0.16 b 变异系数CV/% 3.87 3.59 3.40 5.14 LP/mm 均值 ± 标准差 429.39 ± 39.73 a 386.50 ± 39.41 c 348.05 ± 25.14 d 403.47 ± 33.22 b 变异系数CV/% 9.25 10.20 7.22 8.24 SL/mm 均值 ± 标准差 1.78 ± 0.30 a 1.76 ± 0.31 a 1.47 ± 0.23 b 1.76 ± 0.31 a 变异系数CV/% 16.85 17.61 15.65 17.71 Table 6. Comparison of phenotypic traits of various groups of Eucommia ulmoides germplasm resources
-
利用鲜比叶质量、叶片绿色成分、叶面积、叶绿素参考值、节间距、长宽比6个叶片表型性状建立随机森林判别模型,对4个类群进行分类预测,从701份杜仲种质中选出75%的样本作为训练集,25%的样品作为独立测试集。利用随机森林算法对训练集进行训练构建预测模型, 模型节点变量数为4,随机森林中的数目为500,其交互验证的预测准确率为80.11%,初建的随机森林模型有待进一步优化。通过调整模型节点变量数优化随机森林模型,根据模型误判率均值确定模型节点变量数,当节点变量数为1时,模型误判率均值为17.61%最低,预测准确率均值为82.39%(表7),因此,模型节点变量数选取为1。基于随机森林分类输出的杜仲叶片表型性状重要程度见表8,平均降低精度重要性依次为:鲜比叶质量>叶片绿色成分>叶面积>叶绿素参考值>节间距>长宽比。建立的随机森林判别模型能够有效区分各类群种质,并验证了这6个叶片表型可作为杜仲种质资源的评价指标。
样品类型
Sample type训练集 Training set 测试集 Test set I类群
Group IⅡ类群
Group ⅡⅢ类群
Group ⅢⅣ类群
Group ⅣI类群
Group IⅡ类群
Group ⅡⅢ类群
Group ⅢⅣ类群
Group Ⅳ样品个数
Number of samples157 134 84 153 52 44 27 50 准确预测个数
Accurate prediction number141 115 68 111 42 36 21 38 预测准确率
Prediction accuracy/%89.81 85.82 80.95 72.55 80.77 81.82 77.78 76.00 平均准确率
Average accuracy/%82.39 79.09 Table 7. Prediction results of germplasm classification of Eucommia ulmoides of various groups
性状 Traits 不同类群分类预测中各变量的重要性
The importance of each variable in the classification of various groups平均降低精度
Mean Decrease Accuracy平均降低基尼系数
Mean Decrease GiniI类群 Group I Ⅱ类群 Group Ⅱ Ⅲ类群 Group Ⅲ Ⅳ类群 Group Ⅳ SLFW 56.04 120.75 39.24 27.19 112.71 110.50 IL 24.41 13.89 −2.42 5.87 25.08 33.11 LTWR 9.26 1.81 6.22 5.59 11.66 29.61 LA 63.32 8.69 92.50 29.44 92.95 94.20 GC 74.45 14.27 10.67 78.48 93.87 87.94 CRV 5.62 16.30 15.70 23.93 31.65 33.55 注:平均降低精度指随机森林预测准确性的降低程度,该值越大表示该变量的重要性越大。平均降低基尼系数通过基尼指数计算每个变量对分类树每个节点上观测值的异质性的影响,从而比较变量的重要性,该值越大表示该变量的重要性越大。 Notes: Mean decrease accuracy refers to the degree of decrease in the accuracy of random forest prediction, and the higher the value, the greater the importance of the variable. Mean decrease Gini calculates the influence of each variable on the heterogeneity of observations on each node of the classification tree through the Gini index, so as to compare the importance of the variable. The higher the value, the greater the importance of the variable. Table 8. Importance of the six phenotypic traits in leaves for classification of various groups
Diversity Analysis of Leaf Phenotypic Traits of Eucommia ulmoides Germplasm Resources
- Received Date: 2021-06-17
- Accepted Date: 2021-08-16
- Available Online: 2022-10-20
Abstract: