-
杨树(Populus L.)具有速生、易繁殖、适应性强和生产力高等特性,在木材加工、碳汇造林、制浆造纸和生物燃料等方面发挥着重要作用[1]。杨树提供了大量木材,但是杨树人工林土壤氮素缺乏导致其木材产量受到严重制约[2-4],因此选育高产量的杨树品种具有重要意义。作物育种的关键步骤是选择,而常规育种是以表型选择为基础的。基于亲本杂交和后代表型选择的传统育种费时费力,挖掘和公布一个新的品种需要至少10 a以上的时间。基因组选择(Genomic selection, GS)也被称为基因组预测,通过在早期阶段淘汰潜力较小的个体来降低育种成本[5-7]。基因组选择现在被广泛用于数量性状的遗传改良,GS可以减少植物育种中表型观察所需的成本和工作量[8]。通过使用详细的基因组信息揭示一个基因型的基因优势,可以使农业和林业生产发生革命性的变化[9]。
GS的预测准确度影响因素包括群体的大小、群体结构、亲缘关系、分子标记、表型的精度、目标性状的遗传力和统计模型等[10-11]。分子标记的数量和密度影响基因组预测的准确度和效率,因此需要足够的分子标记并且选择适合模型才能得到准确的育种值[12]。统计模型在GS研究中具有重要地位,其对表型和基因型数据的训练效果决定着标记效应是否估计准确,进而对后续的育种计划产生影响[13]。采用固定和随机效应的混合线性模型(Mixed linear model,MLM)直接预测个体的遗传优点,被称为最佳线性无偏预测(Best Linear Unbiased Prediction,BLUP)。VanRaden借助BLUP于2008年提出了基于G矩阵的gBLUP(Genomic BLUP)方法[14]。目前gBLUP已经广泛应用于动植物育种研究中,并且因为它的高效、稳健等优点,现在仍饱受青睐。Wang等人基于gBLUP,压缩个体分成不同的组构建了cBLUP (Compressed BLUP)模型和区段化标记(bin 标记)构建了sBLUP(SUPER BLUP)模型[15]。
育种计划的成功取决于对遗传参数的精确估计,包括对育种值的可靠预测[16-17]。育种值是遗传效应对该性状表型值的加性效应[18],它消除了环境影响,反映了真实的遗传效应,提高了选择的准确性。通过估算亲本和杂交后代的育种值进行基因型选择可以代替表型选择,从而提高选择的效率和准确性。育种值的估算对重要造林树种的遗传改良起到了重要作用。有效地建立基因型-表型关系,以便作出可靠的预测,指导探索巨大的遗传选择空间。对于杂交作物来说尤其如此,因为潜在杂交品种的数量太高,无法进行广泛的测试。由于GS在提高动物育种遗传收益方面取得的巨大成功,因此GS被引入到植物育种研究的许多方面,如自交系性能预测、亲本选择和杂交预测[19-20]。利用GS对植物的重要的经济性状进行预测育种值,加快育种计划具有重要的意义。目前在杨树的经济相关性状的全基因组选择方面的研究十分欠缺,亟须展开基因组选择相关的研究工作。
在F1杂交育种中,随着自交系数量的增加,需要测试的亲本组合数量呈指数增长。因此,利用GS对有杂种优势的F1代进行预选,可以实现高效育种。本研究对高氮和低氮环境下的地径、株高和茎生物量等性状进行全基因组选择研究,利用3个全基因组选择模型(gBLUP、sBLUP、cBLUP)和已经观测364个基因型的表型观测值(包含2个亲本和362个杂交F1代)对502个基因型进行预测育种值,为杨树遗传育种工作奠定基础。
-
前期试验获得了2个亲本和500个杂交F1代的全基因组重测序数据[23]。重测序数据经过过滤后,获得了1 447 341个高质量的SNPs,均匀分布在19个染色体上(图1)。对500个杂交群体和2个父母的SNP数据进行PCA分析。结果可以看出丹红杨和通辽1号杨的差异较大,杂交群体可以分为2个亚群体。一个亚群偏向于丹红杨,一个亚群偏向于通辽1号杨(图2)。
-
丹红杨的地径在高氮和低氮条件下分别比通辽1号杨提高2.2倍和2.9倍。丹红杨的株高在高氮和低氮条件下分别比通辽1号杨提高了1.8倍和2.5倍。丹红杨的茎生物量在高氮和低氮条件下分别比通辽1号杨提高了20倍和33倍。结果说明丹红杨的生长表型在不同氮环境下显著高于通辽1号杨。在夏皮罗-威尔克检验中(表1),杂交群体中3个性状的W检验值范围为0.96~0.99,接近1,说明表型数据符合正态分布。在高氮和低氮环境下,杂交群体的地径、株高和茎生物量的变异系数在0.13~0.42之间。氮素利用率相关性状的变异系数表明F1群体具有丰富的遗传变异和选择潜力。地径、株高和茎生物量的遗传力分别为0.72、0.70和0.70(表1)。
性状
Traits处理条件
Condition亲本
Parents杂交后代
F1 populations丹红杨
Danhong通辽1号杨
Tongliao1最小值
min最大值
max均值
mean变异系数
Coefficient of variation正态性检验
norm test W遗传力
Heritability地径
Ground diameter/mm高氮 High N 25.2** 7.8 10.0 24.8 18.4 0.15 0.99 0.72 低氮 Low N 24.1** 6.2 6.7 22.7 15.6 0.18 0.99 株高
Plant height/cm高氮 High N 350.0** 126.7 148.0 365.0 293.6 0.13 0.96 0.70 低氮 Low N 335.6** 97.0 142.0 366.7 269.4 0.17 0.98 茎生物量
Stem biomass/g高氮 High N 288.3** 13.6 20.8 304.5 146.7 0.40 0.97 0.70 低氮 Low N 244.9** 7.3 17.8 253.9 108.9 0.42 0.97 注:*, ** 分别表示丹红杨和通辽1号杨之间的差异水平P < 0.05 和 P < 0.01
Notes: *, ** significant difference between two parents' levels of P < 0.05 and P < 0.01, respectivelyTable 1. Statistical analysis of phenotypic traits of poplar hybrid populations
-
在502个基因型中包括具有田间测定表型值的364个基因型和没有测得表型的138个基因型。利用cBLUP、gBLUP、sBLUP模型对杂交群体在高氮条件下的地径、株高和茎生物量进行了全基因组预测育种值(图3)。结果表明cBLUP模型对地径、株高和茎生物量的预测的准确率分别为0.139、0.012、0.001。gBLUP模型对地径、株高和茎生物量的预测的准确率分别为0.990、0.987、0.990。sBLUP模型对地径、株高和茎生物量的预测的准确率分别为0.544、0.803、0.829。结果说明gBLUP预测结果最准确接近于1,而cBLUP预测结果的准确性最低。
Figure 3. Comparative analysis of prediction accuracy of phenotypic traits breeding value under high nitrogen environment calculated by different models
364个基因型的观测值TBV和cBLUP、gBLUP、sBLUP计算的地径的均值分别为17.91、17.94、18.28、18.08;株高的均值分别为292.28、293.75、297.28、293.68;茎生物量的均值分别为144.61、144.61、144.61、144.61(表2)。结果说明3个模型计算的育种值的均值和观测值的均值差异较小。观测值TBV和cBLUP、gBLUP、sBLUP计算的地径的方差分别为2.96、0.42、2.90、1.76;株高方差分别为69.89、23.05、59.80、40.59;茎生物量的方差分别为58.45、19.49、58.45、42.89(表2)。通过方差的比较分析,可以看出cBLUP模型计算的方差值远小于观测值的方差值。
性状
Traits模型
Model均值
Mean方差
SD最小值
Min最大值
Max偏度
Skew峰度
Kurtosis标准误
SE地径/mm
Ground diameterTBV 17.91 2.96 7.84 25.19 −0.13 −0.03 0.16 cBLUP 17.94 0.42 16.96 18.86 0.06 −0.55 0.03 gBLUP 18.28 2.90 7.84 25.19 −0.21 0.34 0.20 sBLUP 18.08 1.76 13.60 24.55 0.11 0.25 0.12 株高/cm
Plant heightTBV 292.28 69.89 126.67 1131.67 7.17 79.70 3.77 cBLUP 293.75 23.05 251.53 571.89 8.28 98.29 1.59 gBLUP 297.28 59.80 169.55 896.01 6.71 61.19 4.13 sBLUP 293.68 40.59 250.34 675.52 7.90 70.27 2.80 茎生物量/g
Stem biomessTBV 144.61 58.45 13.60 304.53 0.52 −0.09 4.03 cBLUP 144.61 19.49 91.55 203.39 0.45 0.00 1.35 gBLUP 144.61 58.45 13.60 304.53 0.52 −0.09 4.03 sBLUP 144.61 42.89 72.41 347.31 1.01 1.88 2.96 注:364个基因型的数据比较结果。TBV为观测值,cBLUP、gBLUP、sBLUP分别为3个模型计算的育种值
Notes: Data comparison results of 364 genotypes. TBV is the observed value, and cBLUP, gBLUP, and sBLUP are the breeding values calculated by the three modelsTable 2. Statistical analysis of observed value and breeding value under a high nitrogen environment
-
群体试验在单一环境下进行,受环境因素影响的表型数据不稳定,在不同的环境下鉴定表型性状的育种值更具有稳定性。图4所示,cBLUP模型对低氮条件下的地径、株高和茎生物量的预测的准确率分别为0.108、0.052、0.055;gBLUP模型预测的准确率分别为0.985、0.991、0.990;sBLUP模型准确率分别为0.574、0.590、0.777。
Figure 4. Comparative analysis of prediction accuracy of phenotypic traits breeding value under low nitrogen environment calculated by different models
364个基因型观测值TBV和cBLUP、gBLUP、sBLUP计算地径的均值分别为16.23、16.24、15.81、15.98;株高的均值分别为277.54、277.68、273.78、275.49;茎生物量的均值为109.01、109.01、109.01、109.01。结果说明低氮条件下地径、株高和茎生物量的育种值和观测值的均值比较分析发现差异较小(表3)。观测值TBV和cBLUP、gBLUP、sBLUP计算的地径的育种值的方差分别为3.31、0.35、1.92、2.14;株高的方差分别为48.32、2.50、22.32、29.42;茎生物量的方差分别为46.59、2.55、46.59、35.00(表3)。通过方差的比较分析可以看出cBLUP模型计算的方差值较小,gBLUP和sBLUP计算的育种值的方差与观测值的方差较为接近。
性状
Traits模型
Model均值
Mean方差
SD最小值
Min最大值
Max偏度
Skew峰度
Kurtosis标准误
SE地径/mm
Ground diameterTBV 16.23 3.31 2.40 25.33 −0.48 0.91 0.18 cBLUP 16.24 0.35 15.38 17.07 0.01 −0.84 0.02 gBLUP 15.81 1.92 8.99 22.56 −0.35 1.28 0.13 sBLUP 15.98 2.14 8.52 20.15 −0.74 0.71 0.15 株高/cm
Plant heightTBV 277.54 48.32 97.00 376.67 −0.75 0.61 2.61 cBLUP 277.68 2.50 272.23 282.76 0.01 −1.05 0.17 gBLUP 273.78 22.32 184.10 330.00 −0.62 1.11 1.54 sBLUP 275.49 29.42 189.11 339.51 −0.56 0.03 2.03 茎生物量/g
Stem biomessTBV 109.01 46.59 7.33 253.87 0.56 0.35 3.22 cBLUP 109.01 2.55 104.25 113.60 −0.02 −1.44 0.18 gBLUP 109.01 46.59 7.33 253.87 0.56 0.35 3.22 sBLUP 109.01 35.00 54.38 253.55 0.77 0.93 2.42 注:364个基因型的数据比较结果。TBV为观测值,cBLUP、gBLUP、sBLUP分别为3个模型计算的育种值
Notes: Data comparison results of 364 genotypes. TBV is the observed value, and cBLUP, gBLUP, and sBLUP are the breeding values calculated by the three modelsTable 3. Statistical analysis of observed value and breeding value under a low nitrogen environment
-
因为gBULP预测的育种值准确率较高,因此利用了杂交群体502个基因型的茎生物量的育种值进行了评价和筛选。根据高氮和低氮条件下茎生物量的均值把F1代群体划分为4种类型(图5)。低氮高效型(Ⅰ区域):本区域F1代的茎生物量在低氮条件下高于均值,在高氮条件下低于均值。双高效型(Ⅱ区域):本区域F1代的茎生物量在低氮和高氮条件下均高于平均值。高氮高效型(Ⅳ区域):本区域F1代的茎生物量在低氮条件下低于均值,在高氮条件下高于均值。低氮低效型(Ⅲ区域):本区域F1代的茎生物量在低氮和高氮条件下均低于平均值。双高效型(Ⅱ区域)包括191个基因型,均值(茎生物量在低氮条件和高氮条件下的均值)的前20名包括16-1-16、16-1-194、13-116、13-73、13-481、13-268、13-286、13-566、13-173、13-578、16-1-65、13-242、16-1-189、13-40、13-608、16-1-170、16-1-22、13-237、13-272、13-335。双高效型中前20名符合育种目标的要求,可作为优良遗传材料保存,进一步研究。
Genomic Selection of Seedling Growth Traits in a Poplar Hybrid Population
- Received Date: 2023-03-03
- Accepted Date: 2023-09-01
- Available Online: 2023-12-20
Abstract: