-
无叶假木贼(Anabasis aphylla L.)隶属于藜科(Chenopodiaceae)假木贼属(Anabasis),半灌木,具有强的抗盐碱能力,在我国主要分布于西北地区[1-2]。无叶假木贼是荒漠植被的主要建群种和优势种[3],常作为防风固沙的植物材料,具有很高的生态价值。同时,其植株提取物包含生物碱、萜类、皂苷类等多种生物活性物质[4],有效治疗疥癣、疥疮和湿疹痒痛,还有效防治菜青虫、蚜虫等多种害虫[5-6]。
叶绿体是一种重要的质体,在植物细胞的光合作用等生物过程中起着关键作用[7]。叶绿体基因组通常比核基因更为保守,对植物系统发育和物种鉴定有重要作用[8-9]。在物种进化过程中,叶绿体基因组在序列、组成、大小和基因含量方面高度保守[10],具有2个反向重复区(inverted repeats, IR)、1个小单拷贝区(small single copy, SSC)和1个大单拷贝区组成的四分体结构(large single copy, LSC)[11]。IR区域的收缩和扩张是叶绿体基因含量和基因组大小变化的主要影响因素[12]。叶绿体基因组中存在一些简单重复序列(SSRs)和单核苷酸多态性(SNP)的热点区域,可产生足够的信息用于物种分类和鉴定[13]。此外,植物叶绿体基因组中的密码子偏好性反映其在进化过程中的分子适应程度和受到的进化压力,同时参与基因的表达[14]。目前,叶绿体基因组序列作为超级条形码,已经在藜科中多个物种的系统发育研究中得到应用[15-16]。然而,假木贼属物种的叶绿体基因组尚未被报道,它们的进化特征和遗传多样性尚不清晰。
本研究首次对假木贼属的无叶假木贼的叶绿体基因组进行测序、组装和注释,进一步分析其叶绿体基因组特征和密码子偏好性等;此外,将其与已公布叶绿体基因组的藜科物种构建系统发育树,进一步筛选种间基因组高变区。本研究目的在于:(1)阐明无叶假木贼与其它藜科物种的进化关系及其在系统发育中的地位;(2)筛选有效的候选分子标记序列和最优密码子,以期为无叶假木贼的分子标记开发、系统进化及叶绿体基因工程研究提供参考。
-
无叶假木贼叶绿体基因组呈典型的双链环状四分体结构(图1),全长为154 084 bp,其中,LSC长85 124 bp,SSC长18 934 bp,IRa和IRb长25 013 bp。叶绿体基因组GC含量为36.25%,其中,SSC、LSC、IR区的GC含量分别为29.26%、33.89%、42.85%。
无叶假木贼叶绿体基因组中共注释到132个基因,包含83个蛋白编码基因,8个rRNA基因,37个tRNA基因和4个假基因。其中,75个基因与自我复制功能相关,45个基因与光合作用功能相关,6个基因编码其它蛋白质,6个基因的功能未知(表1)。16个基因存在双份拷贝,包括6个蛋白编码基因(rpl23、rpl2、rps12、rps7、ndhB、ycf2),6个tRNA基因(trnA-UGC、trnI-GAU、trnL-CAA、trnN-GUU、trnR-ACG、trnV-GAC)和4个rRNA基因(rrn4.5S、rrn5S、rrn16S、rrn23S)。此外,1个tRNA基因(trnM-CAU)在无叶假木贼叶绿体基因组中存在3份拷贝。
表 1 无叶假木贼叶绿体基因组基因注释
Table 1. Gene annotation in the chloroplast genome of Anabasis aphylla
基因功能
Gene Function基因分类
Gene group基因
Gene光合作用
Photosynthesis光合系统I
Photosystem IpsaA, psaB, psaC, psaI, psaJ 光合系统II
Photosystem IIpsbA, psbB, psbC, psbD, psbE, psbF, psbH, psbI, psbJ, psbK, psbL, psbM, psbN, psbT, psbZ NADH 脱氢酶
Subunits of NADH dehydrogenasendhA*, ndhB*(2), ndhC, ndhD, ndhE, ndhF, ndhG, ndhH, ndhI, ndhJ, ndhK 细胞色素复合物
Cytochrome b/f complexpetA, petB*, petD*, petG, petL, petN ATP 合成酶
Subunits of ATP synthaseatpA, atpB, atpE, atpF*, atpH, atpI 二磷酸核酮糖羧化酶大亚基
Large subunit of rubiscorbcL 自我复制
Self-replication核糖体大亚基蛋白
Proteins of large ribosomal subunit#rpl23(2), rpl14, rpl16*, rpl2(2), rpl20, rpl22, rpl32, rpl33, rpl36 核糖体小亚基蛋白
Proteins of small ribosomal subunit#rps19, rps11, rps12(2), rps14, rps15, rps16*, rps18, rps19, rps2, rps3, rps4, rps7(2), rps8 RNA 聚合酶亚基
Subunits of RNA polymeraserpoA, rpoB, rpoC1*, rpoC2 核糖体
RNA Ribosomal RNAsrrn16S(2), rrn23S(2), rrn4.5S(2), rrn5S(2) 转运RNA
Transfer RNAstrnA-UGC*(2), trnC-GCA, trnD-GUC, trnE-UUC, trnF-GAA, trnG-GCC, trnG-UCC*, trnH-GUG, trnI-GAU*(2), trnK-UUU*, trnL-CAA(2), trnL-UAA*, trnL-UAG, trnM-CAU(3), trnN-GUU(2), trnP-UGG, trnQ-UUG, trnR-ACG(2), trnR-UCU, trnS-GCU, trnS-GGA, trnS-UGA, trnT-GGU, trnT-UGU, trnV-GAC(2), trnV-UAC*, trnW-CCA, trnY-GUA, trnfM-CAU 其他基因
Other genes成熟酶
MaturasematK 蛋白酶
ProteaseclpP** 膜包被蛋白基因
Envelope membrane proteincemA 乙酰辅酶A羧化酶
Acetyl-CoA carboxylaseaccD c 型细胞色素合成基因
c-type cytochrome synthesis geneccsA 翻译起始因子
Translation initiation factorinfA 未知功能
Unknown function假想叶绿体读码框
Hypothetical chloroplast reading frames#ycf1, ycf1, ycf2(2), ycf3**, ycf4 注:*表示含1个内含子的基因;**表示含有2个内含子的基因;#表示假基因;(n )表示多拷贝基因拷贝数n。
Notes: * indicates the gene containing one intron; ** indicates the gene containing two introns; # indicates the pseudogene; (n) indicates the copy number of the multi-copy gene.无叶假木贼叶绿体基因组中有16个基因包含内含子,12个基因位于LSC区,3个基因位于IR区,1个基因位于SSC区 (表2)。14个基因包含1个内含子(trnK-UUU、rps16、trnG-UCC、atpF、rpoC1、trnL-UAA、trnI-GAU、petB、petD、rpl16、ndhB、trnV-UAC、trnA-UGC、ndhA),2个基因包含2个内含子(ycf3、clpP)。内含子长度在525 bp(trnL)~2 500 bp(trnK)之间。
表 2 无叶假木贼叶绿体基因组中含内含子的基因信息
Table 2. Information of gene introns in the chloroplast genome of Anabasis aphylla
基因
Gene位置
Location外显子I
Exon I/bp内含子I
Intron I/bp外显子II
Exon II/bp内含子II
Intron II/bp外显子III
Exon III/bptrnK-UUU LSC 37 2 500 35 rps16 LSC 40 892 197 trnG-UCC LSC 31 708 60 atpF LSC 145 777 410 rpoC1 LSC 432 789 1 602 ycf3 LSC 126 779 228 790 153 trnL-UAA LSC 35 525 50 trnI-GAU LSC 39 576 56 clpP LSC 71 949 294 605 226 petB LSC 6 797 642 petD LSC 8 744 475 rpl16 LSC 9 1 095 360 ndhB IR 775 673 758 trnV-UAC IR 32 946 42 trnA-UGC IR 37 838 36 ndhA SSC 553 1 101 539 -
无叶假木贼叶绿体基因组中共有41对长序列重复,其中,正向重复21对,回文重复20对,无互补和反向重复(图2A)。其中,重复长度为30 bp的数量最多,分布在IR区的重复长序列数量最多。无叶假木贼叶绿体基因组中,共确定71个SSR位点,属于12种重复类型(图2B)。其中,A/T重复类型的SSR数量最多,且重复次数在10、11、12次最常见。此外,SSR在基因间区的数量最多(70.4%),其次是位于内含子(14.1%)和蛋白编码序列(12.7%),tRNA和rRNA数量最少(1.4%)(图2 C)。
-
为确定无叶假木贼在藜科的系统位置,将其和19个藜科物种的叶绿体基因组进行系统发育分析,并以2种苋科物种为外类群,构建了ML系统发育树(图3)。结果表明:藜科物种系统发育树共分为2个大的分支,聚类的支持率较高,大部分节点的支持率为100%。第一分支包含聚类组1和聚类组2,聚类组1包含:盐爪爪属、盐角草属和碱蓬属的5个物种;聚类组2包含:假木贼属、梭梭属和猪毛菜属的5个物种。第二分支包含聚类组3和聚类组4,聚类组3包含:滨藜属和藜属的6个物种;聚类组4包含:腺毛藜和菠菜属的4个物种。2个苋科的外群物种单独在一个分支。
-
基于聚类分析结果,将无叶假木贼及其9种近缘种叶绿体基因组序列进行突变热点分析。结果表明:LSC和SSC区的核苷酸多态性明显高于IR区(图4)。序列比对总长度为161 920 bp,序列一致位点长度为138 470 bp, 突变位点数为14 021;核苷酸多态性平均值为0.039 18,范围为0~0.143 43。19个突变位点的核苷酸多态性大于0.1,3个在LSC区,16个在SSC区;19个突变位点分别属于trnS-trnG(exon1)、ndhF-rpl32、rpl32-trnL、rps16(exon1)-trnQ基因间区和ycf1基因区。
-
无叶假木贼及其9种近缘种的边界分析显示:IR区长度变化不大(23 701~25 036 bp),但4个边界区的过渡区域存在一定差异(图5)。藜科10个物种的叶绿体基因组在IRb-LSC边界均存在rps19基因,向LSC区扩张长度在148~173 bp之间。在IRb-SSC边界,梭梭属、猪毛菜属和碱蓬属的5个物种ycf1假基因缺失;其它5个物种的ycf1基因均不同程度的扩张到了SSC区域中,扩张长度在18~4 440 bp之间。在IRa-SSC边界,均存在不同程度的ycf1基因扩张,长度在3~5 426 bp之间。在IRa-LSC边界, 盐爪爪属、盐角草属、猪毛菜属和碱蓬属的6个物种IRa区不存在rps19基因,其余4个物种的rps19基因均没有越过IRa-LSC边界。
-
无叶假木贼叶绿体基因组中RSCU值在0.32(CUG)~2.07(UUA)之间,30个密码子为高频密码子(RSCU > 1),除编码亮氨酸的密码子UUG以G结尾外,其它29种密码子均以A/U结尾(表3)。共确定20个最优密码子(UUU、UAU、UGU、CAU、UCU、UCA、UUA、CUU、CCU、AGA、GAA、ACU、ACA、AAU、GAU、AAA、GUU、GCU、GGU、CAA),均以A/U结尾。
表 3 无叶假木贼叶绿体基因组相对同义密码子使用度
Table 3. Relative synonymous codon usage (RSCU) of genes in the chloroplast genome of Anabasis aphylla
氨基酸
Amino acid密码子
CodonRSCU 氨基酸
Amino acid密码子
CodonRSCU 基因组
Genome高表达基因
High expression
gene低表达基因
Low expression
gene基因组
Genome高表达基因
High expression
gene低表达基因
Low expression
gene苯丙氨酸
Phe/FUUU* 1.38 1.56 1.06 谷氨酰胺
Ile/IAUU 1.52 1.46 0.86 UUC 0.62 0.44 0.94 AUC 0.52 0.30 1.50 络氨酸
Tyr/YUAU* 1.64 1.74 0.36 AUA 0.97 1.24 0.64 UAC 0.36 0.26 1.64 苏氨酸
Thr/TACU* 1.63 1.46 0.81 半胱氨酸
Cys/CUGU* 1.55 1.79 0.63 ACC 0.69 0.53 1.18 UGC 0.45 0.21 1.37 ACA* 1.27 1.55 0.91 组氨酸
His/HCAU* 1.50 1.62 1.06 ACG 0.42 0.47 1.11 CAC 0.50 0.38 0.94 天冬酰胺
Asn/NAAU* 1.56 1.61 0.88 丝氨酸
Ser/SUCU* 1.70 1.87 0.58 AAC 0.44 0.39 1.12 UCC 0.91 0.84 0.89 天冬氨酸
Asp/DGAU* 1.59 1.56 1.00 UCA* 1.19 1.36 0.72 GAC 0.41 0.44 1.00 UCG 0.62 0.60 1.27 赖氨酸
Lys/KAAA* 1.55 1.66 0.86 AGU 1.24 1.17 1.10 AAG 0.45 0.34 1.14 AGC 0.34 0.16 1.44 缬氨酸
Val/VGUU* 1.55 1.76 0.79 亮氨酸
Leu/LUUA* 2.07 2.48 0.91 GUC 0.37 0.40 0.59 UUG 1.17 0.99 0.82 GUA 1.56 1.47 1.10 CUU* 1.25 1.21 0.56 GUG 0.52 0.37 1.52 CUC 0.36 0.34 0.99 丙氨酸
Ala/AGCU* 1.81 2.02 0.66 CUA 0.83 0.62 1.25 GCC 0.63 0.67 1.04 CUG 0.32 0.36 1.47 GCA 1.11 1.11 1.21 脯氨酸
Pro/PCCU* 1.62 1.82 0.94 GCG 0.45 0.19 1.10 CCC 0.71 0.58 1.17 甘氨酸
Gly/GGGU* 1.34 1.45 0.64 CCA 1.18 1.24 0.66 GGC 0.39 0.21 0.86 CCG 0.49 0.36 1.23 GGA 1.65 1.72 1.22 精氨酸
Arg/RCGU 1.45 1.16 0.88 GGG 0.62 0.62 1.28 CGC 0.38 0.10 0.54 谷氨酸
Glu/EGAA* 1.55 1.76 0.94 CGA 1.46 1.46 0.85 GAG 0.45 0.24 1.06 CGG 0.38 0.15 1.25 色氨酸
Trp/WUGG 1.00 1.00 1.00 AGA* 1.70 2.62 0.94 甲硫氨酸
Met/MAUG 1.00 1.00 1.00 AGG 0.62 0.50 1.54 终止子
TERUAA 1.58 2.00 0.88 谷氨酰胺
Gln/QGAA* 1.58 1.74 1.08 UAG 0.57 0.00 0.97 GAG 0.42 0.26 0.92 UGA 0.85 1.00 1.15 注:*表示最优密码子,下划线表示叶绿体基因组中密码子RSCU值大于1。
Notes: * indicates the optimal codon, and the underline indicates that the RSCU value of the codon in the chloroplast genome is greater than 1.进一步通过ENC-plot、ENC分布直方图、PR2-plot和中性绘图,分析无叶假木贼叶绿体基因组中密码子偏好性的影响因素(图6)。由图6A可知:大部分基因分布在期望曲线附近。由图6B可知:大部分基因的ENC值小于ENC期望值,且主要分布在直方图的0~0.1区间内。由图6C可知,分布在四个象限点的数量差异不大,但右下角分布点的数量略高于其它三个象限;这表明除了突变因素,自然选择也是无叶假木贼叶绿体基因组密码子偏好性的影响因素。由图6D可知:GC12和GC3之间相关性系数为0.45,线性回归系数为0.343 6,进一步表明突变因素对密码子使用偏好性的影响占34.36%。因此,无叶假木贼叶绿体基因组密码子使用偏好性主要受自然选择影响,突变等影响因素对其影响较弱。
无叶假木贼叶绿体基因组特征系统发育及密码子偏好性分析
Chloroplast Genome Phylogeny and Codon Preference of Anabasis aphylla L.
-
摘要:
目的 分析无叶假木贼叶绿体基因组结构特征,阐明假木贼属在藜科中的分类地位,进一步探究其密码子偏好性和确定最优密码子。 方法 基于CTAB法从无叶假木贼幼嫩同化枝中提取总DNA;通过Illumina Genome Analyzer HiSeq 2000高通量测序平台进行测序;使用GetOrganelle和Plann对叶绿体基因组序列进行组装和注释;利用MISA对叶绿体基因组中简单重复序列(SSR)进行分析;使用MAFFT v. 7. 450和IQ-TREE v. 2. 1. 1软件进行多序列比对、构建最大似然法(Maximum likelihood,ML)系统进化树;使用DnaSP 6. 0软件计算核苷酸多态性值;通过CUSP和Codon W 1. 4. 2软件进行密码子偏好性研究。 结果 无叶假木贼叶绿体基因组全长为154 084 bp,包括1个大单拷贝区(LSC,85 124 bp)、1个小单拷贝区(SSC,18 934 bp)、1对反向重复序列(IRa和IRb,25 013 bp)。共注释到132个基因,包含83个蛋白编码基因,8个rRNA基因,37个tRNA基因和4个假基因。SSR位于基因间区的数量最多(70.4%),单碱基(A/T)重复类型SSR数量最多。系统发育树的最优构树模型为TVM + F + R3,藜科划分为4个聚类组,其中,无叶假木贼与梭梭属和猪毛菜属亲缘关系最近。trnS-trnG(exon1)、ndhF-rpl32、rpl32-trnL、rps16(exon1)-trnQ和ycf1是高核苷酸多态性区域。共确定20个最优密码子(UUU、UAU、UGU、CAU、UCU、UCA、UUA、CUU、CCU、AGA、GAA、ACU、ACA、AAU、GAU、AAA、GUU、GCU、GGU、CAA),均以A/U结尾,密码子使用偏好性主要受自然选择影响,突变等影响因素对其影响较弱。 结论 无叶假木贼叶绿体基因组结构保守,呈典型的四分体结构。在藜科的系统发育中,无叶假木贼与梭梭属和猪毛菜属亲缘关系最近。鉴定的高变区和SSR位点可用于藜科属间物种的分子鉴定。无叶假木贼叶绿体基因组密码子偏好以A/U结尾,确定的20个最优密码子有助于其外源密码子的优化。研究结果可为无叶假木贼分子标记开发、系统进化及叶绿体基因工程研究提供参考。 Abstract:Objective To analyze the structural characteristics of Anabasis aphylla chloroplast genome, clarify the taxonomic status of Anabasis in Chenopodiaceae for further exploring its codon preference and determining the optimal codon. Method Total genomic DNA was extracted from fresh assimilation twigs of A. aphylla based on CTAB method. Sequencing was performed using the Illumina Genome Analyzer HiSeq 2000 high-throughput sequencing platform. The chloroplast genome sequence was assembled and annotated by GetOrganelle and Plann. Simple sequence repeat (SSR) in chloroplast genome was analyzed by MISA. Multiple sequence alignment and ML phylogenetic tree construction were analyzed using MAFFT v.7.450 and IQ-TREE v.2.1.1 software. The nucleotide polymorphism values were calculated using DnaSP 6.0 software. The codon preference was studied by CUSP and Codon W 1.4.2. software. Result The full-length chloroplast genome of A. aphylla was 154 084 bp, including a large single copy region (LSC, 85 124 bp), a small single copy region (SSC, 18 934 bp), and a pair of inverted repeat regions (IRa and IRb, 25 013 bp). A total of 132 genes were annotated, including 83 protein-coding genes, 8 rRNA genes, 37 tRNA genes and 4 pseudogenes. The number of SSRs located in the intergenic region was the largest (70.4%), and the number of single-base (A/T) repeat type SSRs was the largest. The optimal model of phylogenetic tree was TVM + F + R3, and Chenopodiaceae was divided into four clustering groups. Among them, A. aphylla showed the closest relationship with Haloxylon and Salsola. TrnS-trnG(exon1)、ndhF-rpl32、rpl32-trnL、rps16(exon1)-trnQ and ycf1 were high nucleotide polymorphism regions. A total of 20 optimal codons (UUU, UAU, UGU, CAU, UCU, UCA, UUA, CUU, CCU, AGA, GAA, ACU, ACA, AAU, GAU, AAA, GUU, GCU, GGU, CAA) were determined, all ending with A/U. The codon usage preference was mainly affected by natural selection, and the influence of mutation and other influencing factors was weak. Conclusion The chloroplast genome structure of A. aphylla is conservative, showing typical quadripartite structure. In the phylogeny of Chenopodiaceae, A. aphylla has the closest relationship with Haloxylon and Salsola. The identified hypervariable regions and SSR loci can be used for molecular identification of intergeneric species in Chenopodiaceae. The codon of the chloroplast genome of A.aphylla prefer endings with A/U, and the 20 optimal codons determined are useful for the optimization of its exogenous codons. The results can provide a reference for molecular marker development, phylogeny and chloroplast gene engineering of A. aphylla. -
Key words:
- Anabasis aphylla L.
- / chloroplast genome
- / phylogenetic analysis
- / codon
-
表 1 无叶假木贼叶绿体基因组基因注释
Table 1. Gene annotation in the chloroplast genome of Anabasis aphylla
基因功能
Gene Function基因分类
Gene group基因
Gene光合作用
Photosynthesis光合系统I
Photosystem IpsaA, psaB, psaC, psaI, psaJ 光合系统II
Photosystem IIpsbA, psbB, psbC, psbD, psbE, psbF, psbH, psbI, psbJ, psbK, psbL, psbM, psbN, psbT, psbZ NADH 脱氢酶
Subunits of NADH dehydrogenasendhA*, ndhB*(2), ndhC, ndhD, ndhE, ndhF, ndhG, ndhH, ndhI, ndhJ, ndhK 细胞色素复合物
Cytochrome b/f complexpetA, petB*, petD*, petG, petL, petN ATP 合成酶
Subunits of ATP synthaseatpA, atpB, atpE, atpF*, atpH, atpI 二磷酸核酮糖羧化酶大亚基
Large subunit of rubiscorbcL 自我复制
Self-replication核糖体大亚基蛋白
Proteins of large ribosomal subunit#rpl23(2), rpl14, rpl16*, rpl2(2), rpl20, rpl22, rpl32, rpl33, rpl36 核糖体小亚基蛋白
Proteins of small ribosomal subunit#rps19, rps11, rps12(2), rps14, rps15, rps16*, rps18, rps19, rps2, rps3, rps4, rps7(2), rps8 RNA 聚合酶亚基
Subunits of RNA polymeraserpoA, rpoB, rpoC1*, rpoC2 核糖体
RNA Ribosomal RNAsrrn16S(2), rrn23S(2), rrn4.5S(2), rrn5S(2) 转运RNA
Transfer RNAstrnA-UGC*(2), trnC-GCA, trnD-GUC, trnE-UUC, trnF-GAA, trnG-GCC, trnG-UCC*, trnH-GUG, trnI-GAU*(2), trnK-UUU*, trnL-CAA(2), trnL-UAA*, trnL-UAG, trnM-CAU(3), trnN-GUU(2), trnP-UGG, trnQ-UUG, trnR-ACG(2), trnR-UCU, trnS-GCU, trnS-GGA, trnS-UGA, trnT-GGU, trnT-UGU, trnV-GAC(2), trnV-UAC*, trnW-CCA, trnY-GUA, trnfM-CAU 其他基因
Other genes成熟酶
MaturasematK 蛋白酶
ProteaseclpP** 膜包被蛋白基因
Envelope membrane proteincemA 乙酰辅酶A羧化酶
Acetyl-CoA carboxylaseaccD c 型细胞色素合成基因
c-type cytochrome synthesis geneccsA 翻译起始因子
Translation initiation factorinfA 未知功能
Unknown function假想叶绿体读码框
Hypothetical chloroplast reading frames#ycf1, ycf1, ycf2(2), ycf3**, ycf4 注:*表示含1个内含子的基因;**表示含有2个内含子的基因;#表示假基因;(n )表示多拷贝基因拷贝数n。
Notes: * indicates the gene containing one intron; ** indicates the gene containing two introns; # indicates the pseudogene; (n) indicates the copy number of the multi-copy gene.表 2 无叶假木贼叶绿体基因组中含内含子的基因信息
Table 2. Information of gene introns in the chloroplast genome of Anabasis aphylla
基因
Gene位置
Location外显子I
Exon I/bp内含子I
Intron I/bp外显子II
Exon II/bp内含子II
Intron II/bp外显子III
Exon III/bptrnK-UUU LSC 37 2 500 35 rps16 LSC 40 892 197 trnG-UCC LSC 31 708 60 atpF LSC 145 777 410 rpoC1 LSC 432 789 1 602 ycf3 LSC 126 779 228 790 153 trnL-UAA LSC 35 525 50 trnI-GAU LSC 39 576 56 clpP LSC 71 949 294 605 226 petB LSC 6 797 642 petD LSC 8 744 475 rpl16 LSC 9 1 095 360 ndhB IR 775 673 758 trnV-UAC IR 32 946 42 trnA-UGC IR 37 838 36 ndhA SSC 553 1 101 539 表 3 无叶假木贼叶绿体基因组相对同义密码子使用度
Table 3. Relative synonymous codon usage (RSCU) of genes in the chloroplast genome of Anabasis aphylla
氨基酸
Amino acid密码子
CodonRSCU 氨基酸
Amino acid密码子
CodonRSCU 基因组
Genome高表达基因
High expression
gene低表达基因
Low expression
gene基因组
Genome高表达基因
High expression
gene低表达基因
Low expression
gene苯丙氨酸
Phe/FUUU* 1.38 1.56 1.06 谷氨酰胺
Ile/IAUU 1.52 1.46 0.86 UUC 0.62 0.44 0.94 AUC 0.52 0.30 1.50 络氨酸
Tyr/YUAU* 1.64 1.74 0.36 AUA 0.97 1.24 0.64 UAC 0.36 0.26 1.64 苏氨酸
Thr/TACU* 1.63 1.46 0.81 半胱氨酸
Cys/CUGU* 1.55 1.79 0.63 ACC 0.69 0.53 1.18 UGC 0.45 0.21 1.37 ACA* 1.27 1.55 0.91 组氨酸
His/HCAU* 1.50 1.62 1.06 ACG 0.42 0.47 1.11 CAC 0.50 0.38 0.94 天冬酰胺
Asn/NAAU* 1.56 1.61 0.88 丝氨酸
Ser/SUCU* 1.70 1.87 0.58 AAC 0.44 0.39 1.12 UCC 0.91 0.84 0.89 天冬氨酸
Asp/DGAU* 1.59 1.56 1.00 UCA* 1.19 1.36 0.72 GAC 0.41 0.44 1.00 UCG 0.62 0.60 1.27 赖氨酸
Lys/KAAA* 1.55 1.66 0.86 AGU 1.24 1.17 1.10 AAG 0.45 0.34 1.14 AGC 0.34 0.16 1.44 缬氨酸
Val/VGUU* 1.55 1.76 0.79 亮氨酸
Leu/LUUA* 2.07 2.48 0.91 GUC 0.37 0.40 0.59 UUG 1.17 0.99 0.82 GUA 1.56 1.47 1.10 CUU* 1.25 1.21 0.56 GUG 0.52 0.37 1.52 CUC 0.36 0.34 0.99 丙氨酸
Ala/AGCU* 1.81 2.02 0.66 CUA 0.83 0.62 1.25 GCC 0.63 0.67 1.04 CUG 0.32 0.36 1.47 GCA 1.11 1.11 1.21 脯氨酸
Pro/PCCU* 1.62 1.82 0.94 GCG 0.45 0.19 1.10 CCC 0.71 0.58 1.17 甘氨酸
Gly/GGGU* 1.34 1.45 0.64 CCA 1.18 1.24 0.66 GGC 0.39 0.21 0.86 CCG 0.49 0.36 1.23 GGA 1.65 1.72 1.22 精氨酸
Arg/RCGU 1.45 1.16 0.88 GGG 0.62 0.62 1.28 CGC 0.38 0.10 0.54 谷氨酸
Glu/EGAA* 1.55 1.76 0.94 CGA 1.46 1.46 0.85 GAG 0.45 0.24 1.06 CGG 0.38 0.15 1.25 色氨酸
Trp/WUGG 1.00 1.00 1.00 AGA* 1.70 2.62 0.94 甲硫氨酸
Met/MAUG 1.00 1.00 1.00 AGG 0.62 0.50 1.54 终止子
TERUAA 1.58 2.00 0.88 谷氨酰胺
Gln/QGAA* 1.58 1.74 1.08 UAG 0.57 0.00 0.97 GAG 0.42 0.26 0.92 UGA 0.85 1.00 1.15 注:*表示最优密码子,下划线表示叶绿体基因组中密码子RSCU值大于1。
Notes: * indicates the optimal codon, and the underline indicates that the RSCU value of the codon in the chloroplast genome is greater than 1. -
[1] 朱格麟. 藜科植物的起源、分化和地理分布[J]. 植物分类学报, 1995, 34(5):486-504. [2] 楚光明, 王 梅, 张硕新. 准噶尔盆地南缘洪积扇无叶假木贼种群空间点格局[J]. 林业科学, 2014, 50(4):8-14. [3] 王婷婷, 楚光明, 江 萍, 等. 不同处理对无叶假木贼种子萌发的影响[J]. 西北林学院学报, 2017, 32(5):125-129. doi: 10.3969/j.issn.1001-7461.2017.05.22 [4] 陈 华, 李援朝. 假木贼属植物化学成分及生物活性研究进展[J]. 天然产物研究与开发, 2004, 16(6):585-589. doi: 10.3969/j.issn.1001-6880.2004.06.025 [5] 杜 华, 周立刚, 李 春, 等. 藜科植物化学成分与生物活性的研究进展[J]. 天然产物研究与开发, 2007, 19(5):884-889. doi: 10.3969/j.issn.1001-6880.2007.05.038 [6] 孙 艳, 沈庆国, 屈玲霞, 等. 无叶假木贼的化学成分及抗菌活性研究[J]. 中草药, 2022, 53(8):2278-2284. doi: 10.7501/j.issn.0253-2670.2022.08.003 [7] XIAO S Z, XU P, DENG Y T, et al. Comparative analysis of chloroplast genomes of cultivars and wild species of sweetpotato (Ipomoea batatas [L. ] Lam)[J]. BMC Genomics, 2021, 22(1): 262. doi: 10.1186/s12864-021-07544-y [8] MENG J, LI X P, LI H T, et al. Comparative analysis of the complete chloroplast genomes of four Aconitum medicinal species[J]. Molecules., 2018, 23(5): 1015-1017. doi: 10.3390/molecules23051015 [9] LI P, LU R S, XU W Q, et al. Comparative genomics and phylogenomics of East Asian Tulips (Amana, Liliaceae)[J]. Frontiers in Plant Science, 2017, 8: 451. [10] MENEZES A P A, RESENDE-MOREIRA L C, BUZATTI R S O, et al. Chloroplast genomes of Byrsonima species (Malpighiaceae): Comparative analysis and screening of high divergence sequences[J]. Scientific Reports, 2018, 8(1): 2210. doi: 10.1038/s41598-018-20189-4 [11] ZHOU J W, ZHANG S, WANG J, et al. Chloroplast genomes in Populus (Salicaceae): comparisons from an intensively sampled genus reveal dynamic patterns of evolution[J]. Scientific Reports, 2021, 11(1): 9471. doi: 10.1038/s41598-021-88160-4 [12] de SANTANA LOPES, AMANDA, PACHECO, et al. The Linum usitatissimum L. plastome reveals atypical structural evolution, new editing sites, and the phylogenetic position of Linaceae within Malpighiales[J]. Plant Cell Reports, 2018, 37(2): 307-328. doi: 10.1007/s00299-017-2231-z [13] VAUGHN JUSTIN N, CHALUVADI, SRINIVASA R, et al. Whole plastome sequences from five ginger species facilitate marker development and define limits to barcode methodology[J]. PLoS ONE, 2014, 9(10): e108581. doi: 10.1371/journal.pone.0108581 [14] BOEL G, LETSO R, NEELY H, et al. Codon influence on protein expression in E. coli correlates with mRNA levels[J]. Nature, 2016, 529(7586): 358-363. doi: 10.1038/nature16509 [15] CHENG Y, HE X, PRIYADARSHANI S V G N, et al. Assembly and comparative analysis of the complete mitochondrial genome of Suaeda glauca[J]. BMC Genomics, 2021, 22(1): 167. doi: 10.1186/s12864-021-07490-9 [16] SHE H, LIU Z, XU Z, et al. Comparative chloroplast genome analyses of cultivated spinach and two wild progenitors shed light on the phylogenetic relationships and variation[J]. Scientific Reports, 2022, 12(1): 856. doi: 10.1038/s41598-022-04918-4 [17] 张鲁杰, 夏秀英, 徐 娜, 等. 高效提取越橘成熟组织基因组DNA的方法[J]. 华北农学报, 2008, 3(S2):205-208. doi: 10.7668/hbnxb.2008.S2.047 [18] JIN J J, YU W B, YANG J B, et al. GetOrganelle: a fast and versatile toolkit for accurate de novo assembly of organelle genomes[J]. Genome Biology, 2020, 21(1): 241. doi: 10.1186/s13059-020-02154-5 [19] HUANG D I, CRONK Q C B. Plann: a command-line application for annotating plastome sequences[J]. Applications in Plant Sciences, 2015, 3(8): 1500026. doi: 10.3732/apps.1500026 [20] BENSON D A, KARSCH-MIZRACHI I, LIPMAN D J, et al. GenBank[J]. Nucleic Acids Research, 2010, 39(suppl_1): D32. [21] GREINER S, LEHWARK P, BOCK R. Organellar Genome DRAW (OGDRAW) version 1.3. 1: expanded toolkit for the graphical visualization of organellar genomes[J]. Nucleic Acids Research, 2019, 47(W1): W59. doi: 10.1093/nar/gkz238 [22] KURTZ S, CHOUDHURI J V, OHLEBUSCH E, et al. REPuter: the manifold applications of repeat analysis on a genomic scale[J]. Nucleic Acids Research, 2001, 29(22): 4633-4642. doi: 10.1093/nar/29.22.4633 [23] BEIER S, THIEL T, MÜNCH T, et al. MISA-web: a web server for microsatellite prediction[J]. Bioinformatics, 2017, 33(16): 2583-2585. doi: 10.1093/bioinformatics/btx198 [24] KATOH K, STANDLEY D M. MAFFT multiple sequence alignment software version 7: improvements in performance and usability[J]. Molecular Biology and Evolution, 2013, 30(4): 772-780. doi: 10.1093/molbev/mst010 [25] MINH B Q, SCHMIDT H A, CHERNOMOR O, et al. IQ-TREE 2: new models and efficient methods for phylogenetic inference in the genomic era[J]. Molecular Biology and Evolution, 2020, 37(5): 1530-1534. doi: 10.1093/molbev/msaa015 [26] ROZAS J, FERRER-MATA A, SÁNCHEZ-DELBARRIO J C, et al. DnaSP 6: DNA sequence polymorphism analysis of large data sets[J]. Molecular Biology and Evolution, 2017, 34(12): 3299-3302. doi: 10.1093/molbev/msx248 [27] WOLF P G, DER J, DUFFY A, et al. The evolution of chloroplast genes and genomes in ferns[J]. Plant Molecular Biology, 2010, 76(3-5): 251-261. [28] SHINOZAKI K, OHME M, TANAKA M, et al. The complete nucleotide sequence of the tobacco chloroplast genome: its gene organization and expression[J]. The EMBO Journal, 1986, 5(9): 2029-2043. [29] DUGAS D V, HERNANDEZ D, KOENEN E J M, et al. Mimosoid legume plastome evolution: IR expansion, tandem repeat expansions, and accelerated rate of evolution in clpP[J]. Scientific Reports, 2015, 5(1): 16958. doi: 10.1038/srep16958 [30] WANG W B, YU H, WANG J H, et al. The complete chloroplast genome sequences of the medicinal plant Forsythia suspensa (Oleaceae)[J]. International Journal of Molecular Sciences, 2017, 18(11): 2288. doi: 10.3390/ijms18112288 [31] 蒋礼玲, 王琳超, 黄新荣, 等. 藜属植物叶绿体基因组结构与系统进化[J]. 应用与环境生物学报, 2022, 28(5):1255-1261. [32] 李泳潭, 张 军, 黄亚丽, 等. 杜梨叶绿体基因组分析[J]. 园艺学报, 2020, 47(6):1021-1032. [33] 蒋思思, 袁 军, 周文君, 等. 薄壳山核桃(Carya illinoinensis)叶绿体基因组及其特征分析[J]. 园艺学报, 2022, 49(8):1772-1784. [34] GUISINGER M M, CHUMLEY T W, KUEHL J V, et al. Implications of the plastid genome sequence of Typha (Typhaceae, Poales) for understanding genome evolution in Poaceae[J]. Journal of Molecular Evolution, 2010, 70(2): 149-166. doi: 10.1007/s00239-009-9317-3 [35] KRISHNAN J, MISHRA R K. Code in the Non-Coding[J]. Proceedings of the Indian National Science Academy, 2015, 81(3): 609-628. [36] KOROL A B, FAHIMA T, NEVO E. Microsatellites within genes: structure, function, and evolution[J]. Molecular Biology and Evolution, 2004, 21(6): 991-1007. doi: 10.1093/molbev/msh073 [37] 蒋 明, 柯世省, 王军峰. 多脉铁木叶绿体基因组的序列特征和系统发育[J]. 林业科学, 2020, 56(5):60-68. doi: 10.11707/j.1001-7488.20200507 [38] 高鸣泽. 不同品种藜麦叶绿体基因组全序列及其系统发育关系[D]. 太原: 山西大学, 2021. [39] 努尔古丽·阿木提. 新疆藜科植物系统分类学研究[D]. 乌鲁木齐: 新疆大学, 2013. [40] DONG S, YING Z, YU S, et al. Complete chloroplast genome of Stephania tetrandra (Menispermaceae) from Zhejiang Province: insights into molecular structures, comparative genome analysis, mutational hotspots and phylogenetic relationships[J]. BMC Genomics, 2021, 22(1): 880. doi: 10.1186/s12864-021-08193-x [41] HUANG X, JIAO Y, GUO J, et al. Analysis of codon usage patterns in Haloxylon ammodendron based on genomic and transcriptomic data[J]. Gene, 2022, 845: 146842. doi: 10.1016/j.gene.2022.146842 [42] ZHANG Z C, DAI W, WANG Y, et al. Analysis of synonymous codon usage patterns in torque Teno sus virus 1 (TTSuV1)[J]. Archives of Virology, 2013, 158(1): 145-154. doi: 10.1007/s00705-012-1480-y [43] CAMPBELL W H, GOWRI G. Codon usage in higher plants, green algae, and cyanobacteria[J]. Plant Physiology, 1990, 92(1): 1-11. doi: 10.1104/pp.92.1.1