-
九叶青花椒(Zanthoxylum armatum ‘Jiuyeqing’)为芸香科(Rutaceae)花椒属(Zanthoxylum L.)竹叶花椒的主要栽培品种,具有矮化、丰产、质优、抗逆等优良特性[1],其果实清香,麻味纯正,备受消费者喜爱,市场需求旺盛[2]。我国花椒属植物的基础研究十分薄弱,花椒属物种间的系统发育关系尚待进一步解析。
长期以来,国内外有关花椒属植物的研究大都集中在其化学成分的提取和分离[3-4],以及提取物种所具有的生物活性[5]和相应的药用价值方面[6],仅有少数学者基于少量的核基因(ETS 和 ITS)[7-8]、叶绿体基因(rps16和 trnL-trnF)[8]、分子标记(SSR、RAPD 和 SRAP)[9-10]开展了花椒属内几个物种间的亲缘关系研究。但基于单个片段或分子标记其有效信息位点不足,花椒属内物种间的系统位置支持率不高,花椒属内种间系统进化关系未能很好的解析。因此,解析九叶青花椒的叶绿体基因组结构特征与系统进化关系,为花椒种质资源的分子鉴定、品种选育和农艺经济性状的遗传分析具有重要意义,亦为花椒属系统进化研究提供依据。
叶绿体是植物进行光合作用的重要细胞器,在植物生长发育过程中具有重要作用[11]。叶绿体基因组一般具有保守的四分体结构,即包括大单拷贝区(Large Single Copy, LSC),小单拷贝区(Small Single Copy, SSC),2个反向重复区(Inverted Repeat Region, IRs)。大多数被子植物叶绿体基因组为母系遗传,且叶绿体基因组的核苷酸替换率适中[12],因此,叶绿体基因组是进行系统进化和分化时间分析的理想标记[13]。近年来,随着叶绿体基因组测序成本降低,使其在植物系统进化分析中广泛应用[14]。本研究利用高通量测序技术进行主栽品种九叶青花椒叶绿体全基因组测序,通过组装、拼接和注释得到其全长叶绿体基因组序列,并对其叶绿体基因组结构、组成及系统进化关系进行分析,旨在丰富花椒的遗传信息,为未来研究花椒属植物间的系统进化、亲缘关系及品种鉴定提供理论依据。
-
注释组装获得九叶青花椒完整的叶绿体基因组图谱见图1。该叶绿体基因组序列全长158 579 bp,包括大单拷贝区域(LSC)长85 780 bp,小单拷贝区域(SSC)长17 603 bp,2个反向重复区(IRa和IRb)相等长度为27 598 bp。共注释了133个基因,其中,88个蛋白编码基因,37个tRNA基因和8个 rRNA基因。叶绿体基因组总的GC含量为38.5%,IR区域(42.5%)的GC含量明显高于LSC 区域(36.8%)和SSC 区域(33.6%),这可能主要是IR区域具有高GC含量的rRNA基因造成的。在注释的九叶青花椒叶绿体基因组中18个特异基因具有内含子,包括12个特异编码基因和6个特异tRNA基因。除pafI具有2个内含子外,其余均具有1个内含子。rps12基因被截断为2个片段,其中,1个外显子位于LSC区域,另外2个外显子位于IR区域。最长内含子位于trnK-UUU基因,长2 503 bp,主要是因为内部包含matK基因;rps12基因内含子最短(538 bp)。
-
通过软件测算在九叶青花椒叶绿体基因组中存在19个串联重复序列,其中,长度最大为25 bp,最小为14 bp,长度为18 bp的重复序列最多,有6个。该叶绿体基因组中共检测到长片段重复序列49个,其中,21个正向重复,8个反向重复,19个回文重复和1个互补重复(图2)。重复长度范围为19~50 bp,其中,长度为20 bp的重复最多(10个),其次是19 bp(9个),而重复长度为26、31、48、50 bp的最少,均1个。在九叶青花椒叶绿体基因组中共预测到70个SSR,包括60个单核苷酸,1个二核苷酸,9个复合型SSR(表1)。75.7%的SSR位于IGS和内含子等非编码区域且A/T碱基在SSR中出现频率较高,在60个单核苷酸SSR中,包含A碱基SSR有26个,包含T碱基SSR有32个。从表1可以看出,SSR在叶绿体基因组中分布随机,表明SSR数量丰富,遗传信息含量高,可筛选具有多态性的引物,为未来研究花椒种群遗传多样性和遗传结构提供参考。
序号
Number重复类型
Repeat type简单重复序列
SSR起始
Start终止
End所在位置
Position1 p1 (T)19 1 771 1 789 IGS 2 p1 (T)11 2 418 2 428 matK 3 p1 (A)10 3 085 3 094 matK 4 p1 (A)10 4 684 4 693 IGS 5 p1 (A)10 6 287 6 296 IGS 6 p1 (T)13 6 873 6 885 IGS 7 c (A)12gacgtacattttatcaaaaattatacttaatagagttgctcaaa
ggggggaattc(T)127 281 7 359 IGS 8 p1 (A)14 7 770 7 783 IGS 9 p1 (T)14 8 334 8 347 IGS 10 c (A)11(AAT)5 8 717 8 740 IGS 11 p1 (T)11 9 319 9 329 IGS 12 p1 (A)13 9 834 9 846 intron 13 p1 (A)15 13 273 13 287 intron 14 p1 (A)11 14 122 14 132 IGS 15 p1 (T)10 16 570 16 579 IGS 16 p1 (T)11 19 493 19 503 rpoC2 17 p1 (A)12 23 671 23 682 intron 18 p1 (T)20 24 067 24 086 intron 19 p1 (T)10 27 372 27 381 rpoB 20 p1 (A)18 28 352 28 369 IGS 21 p1 (C)10 28 617 28 626 IGS 22 c (T)12caatagaaaaaaagaaagagaaaagagagggattaagatattgtgtgttttgagatactataaaatcaattgcagaaatggagttgctccaaaaaaag(A)10 29 037 29 156 IGS 23 p1 (A)10 29 784 29 793 IGS 24 p1 (T)10 31 390 31 399 IGS 25 p1 (T)10 31 563 31 572 IGS 26 p1 (T)11 32 418 32 428 IGS 27 p1 (T)13 33 368 33 380 IGS 28 p1 (G)11 36 561 36 571 psbC 29 p1 (T)10 45 777 45 786 intron 30 p1 (A)12 47 071 47 082 IGS 31 p1 (T)15 51 184 51 198 IGS 32 p1 (T)10 52 626 52 635 IGS 33 p1 (T)10 53 551 53 560 intron 34 p1 (T)19 56 537 56 555 IGS 35 p1 (A)12 57 034 57 045 IGS 36 p1 (T)12 61 599 61 610 IGS 37 c (T)14cattttttcaaaatattcgagagtttcttttttaatag(A)10 62 628 62 689 IGS 38 p1 (A)10 65 486 65 495 IGS 39 p1 (A)10 67 533 67 542 IGS 40 p1 (A)10 68 248 68 257 IGS 41 p1 (A)10 68 735 68 744 IGS 42 p1 (A)11 69 053 69 063 IGS 43 p1 (T)10 69 446 69 455 IGS 44 p1 (A)10 72 760 72 769 clpP 45 p1 (T)10 74 477 74 486 IGS 46 p1 (T)10 76 170 76 179 IGS 47 p1 (T)12 83 898 83 909 rpl16 48 p1 (T)16 85 546 85 561 IGS 49 p1 (T)11 101 363 101 373 IGS 50 p1 (A)16 110 363 110 378 IGS 51 p1 (T)10 110 534 110 543 IGS 52 c (T)11atttaccattaatggtaaat(A)11 110 781 110 822 IGS 53 p1 (A)12 112 609 112 620 ycf1 54 c (A)10ttcttttgctattcatttttcttttgctattcatagttattttgaatctttcccaac
aactt (A)10115 675 115 756 IGS 55 c (A)17cgtac(T)11 116 867 116 899 IGS 56 p1 (A)11 117 100 117 110 IGS 57 p1 (T)12 117 541 117 552 IGS 58 c (T)10atttaactgaaactgaagagaaggaaaaagacttccttgttcattggctaacgaac(T)12 118 691 118 768 IGS 59 p1 (A)10 120 421 120 430 IGS 60 p1 (T)10 122 121 122 130 IGS 61 p2 (TA)6 122 278 122 289 IGS 62 p1 (A)13 124 680 124 692 intron 63 p1 (T)11 126 547 126 557 IGS 64 p1 (A)10 127 040 127 049 IGS 65 p1 (T)11 129 898 129 908 ycf1 66 p1 (T)12 131 740 131 751 ycf1 67 c (T)11atttaccattaatggtaaat(A)11 133 538 133 579 IGS 68 p1 (A)10 133 817 133 826 IGS 69 p1 (T)16 133 982 133 997 IGS 70 p1 (A)11 142 987 142 997 IGS 注:p单个SSR类型;p1/p2/p3中数字分别表示构成基序的碱基个数;c复合SSR类型;IGS代表基因内间隔区
Notes: p is a single SSR type; the numbers in p1/p2/p3 indicate the number of bases constituting the motif, respectively;c is the compound SSR type; IGS represents the intergenic spacerTable 1. Chloroplast genome SSR prediction
-
在九叶青花椒叶绿体基因组中的蛋白编码基因共有26 398个密码子(不包括终止密码子),其中,亮氨酸Leu的密码子最丰富(2 821个),占总数的10.69%,编码Leu的6种同义密码子中TTA数量最多;编码半胱氨酸Cys的数量最少(310个),仅占密码子总数的1.17%。通过对密码子使用频率的计算结果表明:编码异亮氨酸Ile的ATT(1 078)使用次数最多,编码甲硫氨酸Met的ATT(1)和GTG(2)的使用次数最少。相对同义密码子使用率值(RSCU)受影响密码子使用模式的突变因子的影响,因此,RSCU<1表示密码子使用率较低,RSCU >1表示密码子使用率较高,RSCU=1表示无偏倚[25]。经计算分析,相对同义密码子使用值(RSCU)的范围为0.005(ATT)到2.986(ATG),分析还发现RSCU>1的密码子有31种,说明这些密码子有一定的偏好性。在这些密码子中,29个以A或T结尾,仅2个以G结尾,这说明九叶青花椒在密码子第三位碱基上有较强的A/T碱基偏好性。由图3可以看出:编码精氨酸Arg、亮氨酸Leu和丝氨酸Ser密码子种类最多,有6种密码子编码。色氨酸Trp不存在密码子偏好性(RSCU=1),只有1个密码子(TGG)编码。
-
以黄檗和川黄檗2个黄檗属植物为外类群,连同花椒属11个植物的全叶绿体基因组序列构建ML和BI系统进化树,2种方法得到的拓扑结构基本一致,仅在个别分支节点支持率上略有差别。从图4可看出:花椒属物种聚为一支,2种方法在分支上的支持率均为100%,为单系类群。Z. paniculatum和 Z. madagascariense 位于分支基部与其他花椒物种构成姊妹群关系,且分支支持率为100%和1(ML和BI)。狭叶花椒、青花椒和Z. pinnatum聚为一个分支与Z. tragodes、胡椒木、花椒、Z. sp. NH-2018、野花椒和九叶青花椒形成的分支构成姊妹群关系,分支支持率均为100%,其中,九叶青花椒与野花椒呈姊妹关系,亲缘关系最近,与花椒(Z. bungeanum)亲缘关系相对较远。
Analysis of Complete Chloroplast Genome Sequences and Phylogenetic Evolution of Zanthoxylum armatum ‘Jiuyeqing’
- Received Date: 2022-05-30
- Accepted Date: 2022-08-29
- Available Online: 2023-02-20
Abstract: