-
微卫星又称为简单序列重复(SSR), 短串联重复(STR), 是以1~个碱基为重复单位组成的短串联重复DNA序列[1]。微卫星分子标记是基于PCR技术发展起来的一种分子遗传标记技术, 具有重复性好、共显性遗传、多态性位点含量高、实验操作简单、检测方法简便、对DNA质量要求不高等优点[2]。在亲本分析, 基因图谱构建, 确立遗传和进化关系, 遗传多样性分析等研究中得到了广泛的应用[3]。微卫星依据其来源分为两类: 基因组微卫星(GenomicSSR)和表达序列标签微卫星(SSR, EST-SSR) [4]。EST-SSR是基于EST序列开发的SSR, 相对于Genomic SSR引物开发过程简单, 成本低, 在物种间通用性较强[5]。随着基因组的发展, EST序列的数目在公共数据库内迅速增长(http://www.ncbi.nlm.Nih.gov), 为SSR标记提供了一个庞大的资源[2, 6]。
沙棘属(Hippophae)属于胡颓子科(Elaeagnaceae), 是多年生落叶灌木、小乔木或乔木, 风媒传粉, 雌雄异株, 具有固氮作用, 适应性极强, 主要分布于中欧和中亚地区[7]。依据Sun等[7]和Bartish等[8]学者的系统分类, 分为7个种和8个亚种。沙棘是集生态效益、经济效益和社会效益为一体的多用途树种, 因其果实富含Vc和沙棘油, 枝叶含高蛋白, 根系有根瘤等特点备受瞩目[9]。近些年, 随着DNA分子标记技术的不断发展与完善, 针对沙棘遗传多样性、亲缘关系和品种鉴定等的研究得到进展[10], 如利用RFLP、ITS、cpDNA等分子标记对沙棘进行了研究[7-8-11], 但利用SSR分子标记对沙棘的研究较少, 同时目前开发可用的沙棘SSR引物较少, 仅有孙燕琳等[12]利用葡萄SSR引物筛选适用于沙棘的SSR引物, Wang等[13]利用磁珠富集法开发的9对SSR引物和Jain等[14]利用EST开发的11对EST-SSR引物。为了丰富沙棘的SSR分子标记, 本研究通过对向阳沙棘转录组序列进行分析, 开发出大量EST-SSR标记, 为沙棘亲本分析、遗传多样性、遗传育种等研究提供支持。
-
对沙棘转录组中的EST序列去冗余后共收集17 383条具有SSR位点的序列, 其中包括复合SSR类型序列828条, 因其特殊性不计入SSR类型分析。在非复合的SSR类型中, 单核苷酸重复类型数量最多, 所占比例达到62.77%(10 392);其次是二核苷酸和三核苷酸重复类型, 所占比例分别为21.82%(3 613)和13.77%(2 279)。四核苷酸、五核苷酸、六核苷酸重复类型较少, 分别仅占1.45%(240)、0.09%(15)、0.10%(16)。
在所检测到的3 613个二核苷酸重复EST-SSR中, AT和AG两种类型的重复基元出现的次数较多, 分别为1 814个(50.21%)和1 521(42.10%)(图 1a)。在检测到的2 279个三核苷酸重复中, AAG为优势类型, 共783个(34.36%), ATC和ATA两种类型次之, 分别为400个(17.55%)和395个(17.33%)(图 1b)。
-
利用Primer 3.0为9 291条EST序列设计了适宜的SSR扩增引物, 剩余的8 092条序列没能得到合适的引物。从设计的引物中随机挑选179对二核苷酸、三核苷酸重复的EST-SSR引物进行PCR扩增检测, 发现142个位点能够在预期片段大小的位置扩增出清晰的条带, 扩增效率为79.33%。
选择92个位点的引物进一步结合M13荧光引物扩增16个蒙古沙棘个体, 并在ABI 3 130测序仪上检测各位点扩增产物(图 3), 发现40个位点在这些个体的扩增产物中找到2个以上的等位基因(表 1), 即呈现出多态, 多态位点比率为43.48%。从这40个多态位点中, 挑选出17个扩增效果稳定、且峰图清晰的EST-SSR位点, 其在所分析的天然蒙古沙棘种群中的等位基因个数为2~6个不等, 观测杂合度(HO)为0.083~0.875, 期望杂合度(HE)在0.180~0.750;分析得到该蒙古沙棘种群各位点平均期望观测杂合度为0.488, 平均期望杂合度为0.514。这17个位点的引物序列信息、扩增结果及多态性等见表 1。
表 1 沙棘17个多态EST-SSR位点的引物信息
Table 1. Information of 17 Hippophae EST-SSR loci in transcriptome sequences and tested with 16 sample
引物编号
Primer pairs引物序列(5'-3')
Primer sequence (5' -3')重复基元
Repeat motif退火温度
Annealing temperatures/℃等位基因数量
Number of alleles等位基因大小
Allele size range/bp观测杂合度
(HO)Observed heterozygosity期望杂合度
(HE) Expected heterozygosityHs008 F: ACTCATGCCCATCACCTTTT (AT) 6 55 3 238 ~242 0.467 0.580 R: GCTCGTTGCCACTGTTACAA Hs032 F: GCAGTCCGGACAGTCAGAAA (GTT)7 55 2 268 ~274 0.800 0.498 R: CCAAAGCAAAACCACGCAGA Hs047 F: GTGCAAAAACCAGGAGTGCC (TAG)6 55 2 184 ~188 0.600 0.491 R: TACAACCCTGCTACCCCCAT HS097 F: CAGCCGCCCTCTGACTAAAA (AT)6 55 4 280 ~294 0.083 0.733 R: GCTTCGAGGAAGAATTACAGGGA Hsl00 F: CTTGGCTGCCCATCTCGATT (TA) 8 55 6 259 ~274 0.875 0.672 R: ACGAATAAACCCCAGAACAGT Hsll1 F: ACAACTCAGTCCGTACATATGGT (AG) 9 55 4 163 ~177 0.818 0.649 R: GCGGCTGGAATCATCTTGGA Hsl46 F: ACAAGCGTGTGAGGATTCTT (CTA)5 55 2 142 ~146 0.500 0.492 R: CGATGAGAGGCCGGCATATT Hsl49 F: ACATTCCCCTTTCACAGACCC (TAT)6 55 2 138 ~142 0.636 0.483 R:CCAGTTGGGATTTTCTTGTTTGAGT Hs177 F: TGCGTCTTGATTTGGCACTTC (AC) 8 55 2 271 ~273 0.286 0.500 R: ACTCCAGGGTTCTCAAAGGA Hs192 F: TCGCTTCAAAAGGGAACAACA (AT)7 55 4 251 ~265 0.500 0.469 R: GCACACATAACACCCGCTTC Hsl95 F: TCCTCCTGACTGTCTCGACC (TA)7 55 2 247 ~249 0.200 0.180 R: CCCTAGTGAAGCTCAGTTTTGC Hs227 F: CCTTAGCATCACCAAAGCGC (ACA)6 55 2 160 ~168 0.273 0.236 R: CCTTGTGTGCACATTTCTGCA Hs278 F: CGCAGCAGGTTGACAGACTA (CT) 9 55 4 170 ~176 0.500 0.451 R: TCAAACAACGCACTTTGGGC Hs282 F: TGTCTTGCTACTCCTCCTGC (CA) 8 55 3 269 ~273 0.556 0.593 R: ACAGCGTGTTAGGAAAGTTGC Hs284 F: CCCATCTTGCCTCATGCTGT (AT) 8 55 5 269 ~285 0.667 0.750 R: ACCACAAGTCACGGAAATCCT Hs296 F: TGAACGCTCATGATCAAAACGT (TGA)5 55 3 225 ~234 0.400 0.515 R: CAGCTGGTGGAAGTTGAGGT Hs297 F: TCATGCTCACTTCCGTTGCT (CAC)6 55 2 156 ~162 0.133 0.444 R: AGGATTGAGCGGCGTGTTAA 平均Mean 3 0.488 0.514
基于沙棘转录组序列开发EST-SSR分子标记
Development of EST-SSR Markers Based on Seabuckthorn Transcriptomic Sequences
-
摘要:
目的 本研究通过对蒙古沙棘“向阳”品种的转录组序列进行SSR引物开发,为沙棘亲本分析、遗传多样性和遗传育种等研究提供支持。 方法 利用已测得的转录组序列进行分析和筛选,整理具有SSR位点的序列,进行引物设计,随机挑选179条引物进行验证。 结果 得到具有SSR位点的EST序列17 383条,其中,单核苷酸、二核苷酸和三核苷酸重复基元分别占62.77%、21.82%和13.77%;二核苷酸重复基元类型以AT和AG为主,三核苷酸重复基元类型以AAG、ATC和ATA为主。9 291条序列设计出扩增EST-SSR位点的引物,随机合成的179对引物中,142对扩增成功,选取其中92个位点的扩增产物上机检测,40个SSR位点(43.48%)呈现多态。对扩增稳定且峰图清晰的17个多态位点的进一步分析, 得到蒙古沙棘天然群体在各位点的观测杂合度(HO)为0.083~0.875,期望杂合度(HE)为0.180~0.750。 结论 本研究开发出的EST-SSR标记,为后期进行沙棘属植物遗传多样性分析、遗传图谱构建及分子育种等研究提供了重要支持。 Abstract:Objective The transcriptomes ofHippophae rhamnoides subsp. mongolica cv'Xiangyang' were analyzed to design primers and develop EST-SSR (Expressed Sequence Tags-Simple Sequence Repeat) markers. Method The primers were designedand the SSR was developed based on the Expressed Sequence. 179 pairs of primers were validated randomly. Result 17 383 SSR-ESTs (SSR-containing EST) were identified. Of the total EST-SSRs, the mononucleotiderepeat was the most dominant type, accounting for 62.77%, followed by dinucleotiderepeats and trinucleotiderepeats, accounting for 21.82% and 13.77%, respectively. AT and AG were the most abundant dinucleotide motifs; AAG, ATC and ATA were repeated dominant motifs in trinucleotide. Based on these SSR-ESTs, 9 291 pairs of EST-SSR primers were designed; 179 pairs of primers were randomly selected and compounded for PCR amplification, among which 142 loci were amplified successfully. Amplificationproductions of 92 loci were genotyped using the DNA analyzer, of which 40 loci (43.48%) were identified as polymorphism. At last, 17 loci that amplified highly successfully and genotyped easily were recommend and analyzed for natural H. rhamnoides subsp. mongolica individuals, with observedheterozygosity (HO) ranged from 0.083 to 0.875 and expected heterozygosity (HE) ranged from 0.180 to 0.750. Conclusion These EST-SSR markers would be valuable for further research on genetic diversity analysis, linkage mapping construction and molecular breeding of the genus Hippophae. -
Key words:
- Hippophae rhamnoides
- / transcriptome
- / EST-SSR
- / primer
-
表 1 沙棘17个多态EST-SSR位点的引物信息
Table 1. Information of 17 Hippophae EST-SSR loci in transcriptome sequences and tested with 16 sample
引物编号
Primer pairs引物序列(5'-3')
Primer sequence (5' -3')重复基元
Repeat motif退火温度
Annealing temperatures/℃等位基因数量
Number of alleles等位基因大小
Allele size range/bp观测杂合度
(HO)Observed heterozygosity期望杂合度
(HE) Expected heterozygosityHs008 F: ACTCATGCCCATCACCTTTT (AT) 6 55 3 238 ~242 0.467 0.580 R: GCTCGTTGCCACTGTTACAA Hs032 F: GCAGTCCGGACAGTCAGAAA (GTT)7 55 2 268 ~274 0.800 0.498 R: CCAAAGCAAAACCACGCAGA Hs047 F: GTGCAAAAACCAGGAGTGCC (TAG)6 55 2 184 ~188 0.600 0.491 R: TACAACCCTGCTACCCCCAT HS097 F: CAGCCGCCCTCTGACTAAAA (AT)6 55 4 280 ~294 0.083 0.733 R: GCTTCGAGGAAGAATTACAGGGA Hsl00 F: CTTGGCTGCCCATCTCGATT (TA) 8 55 6 259 ~274 0.875 0.672 R: ACGAATAAACCCCAGAACAGT Hsll1 F: ACAACTCAGTCCGTACATATGGT (AG) 9 55 4 163 ~177 0.818 0.649 R: GCGGCTGGAATCATCTTGGA Hsl46 F: ACAAGCGTGTGAGGATTCTT (CTA)5 55 2 142 ~146 0.500 0.492 R: CGATGAGAGGCCGGCATATT Hsl49 F: ACATTCCCCTTTCACAGACCC (TAT)6 55 2 138 ~142 0.636 0.483 R:CCAGTTGGGATTTTCTTGTTTGAGT Hs177 F: TGCGTCTTGATTTGGCACTTC (AC) 8 55 2 271 ~273 0.286 0.500 R: ACTCCAGGGTTCTCAAAGGA Hs192 F: TCGCTTCAAAAGGGAACAACA (AT)7 55 4 251 ~265 0.500 0.469 R: GCACACATAACACCCGCTTC Hsl95 F: TCCTCCTGACTGTCTCGACC (TA)7 55 2 247 ~249 0.200 0.180 R: CCCTAGTGAAGCTCAGTTTTGC Hs227 F: CCTTAGCATCACCAAAGCGC (ACA)6 55 2 160 ~168 0.273 0.236 R: CCTTGTGTGCACATTTCTGCA Hs278 F: CGCAGCAGGTTGACAGACTA (CT) 9 55 4 170 ~176 0.500 0.451 R: TCAAACAACGCACTTTGGGC Hs282 F: TGTCTTGCTACTCCTCCTGC (CA) 8 55 3 269 ~273 0.556 0.593 R: ACAGCGTGTTAGGAAAGTTGC Hs284 F: CCCATCTTGCCTCATGCTGT (AT) 8 55 5 269 ~285 0.667 0.750 R: ACCACAAGTCACGGAAATCCT Hs296 F: TGAACGCTCATGATCAAAACGT (TGA)5 55 3 225 ~234 0.400 0.515 R: CAGCTGGTGGAAGTTGAGGT Hs297 F: TCATGCTCACTTCCGTTGCT (CAC)6 55 2 156 ~162 0.133 0.444 R: AGGATTGAGCGGCGTGTTAA 平均Mean 3 0.488 0.514 -
[1] Tautz D. Hypervariabflity of simple sequences as a general source for polymorphic DNA markers[J]. Nucleic acids research, 1989, 17(16): 6463-6471. doi: 10.1093/nar/17.16.6463 [2] 许玉兰, 蔡年辉, 康向阳, 等. EST-SSR标记的开发及其在木本植物中的分布特点[J]. 中国农学通报, 2012, 28(4): 1-7. [3] Kalia R K, Rai M K, Kalia S, et al. Microsatellite markers: an overview of the recent progress in plants[J]. Euphytica, 2011, 177(3): 309-334. doi: 10.1007/s10681-010-0286-9 [4] 程小毛, 黄晓霞. SSR标记开发及其在植物中的应用[J]. 中国农学通报, 2011, 27(5): 304-307. [5] 赵罕, 朱高浦, 刘梦培, 等. 微卫星分子标记及其在林业中的应用[J]. 世界林业研究, 2013, 26(6): 21-26. [6] Ueno S, Moriguchi Y, Uchiyama K, et al. A second generation framework for the analysis of microsatellites in expressed sequence tags and the development of EST-SSR markers for a conifer[J]. Cryptomeria japonica. BMC Genomics, 2012, 13: 136. doi: 10.1186/1471-2164-13-136 [7] Sun K, Chen X, Ma R, et al. Molecular phylogenetics of Hippophae L. (Elaeagnaceae)based on the internal transcribed spacer(ITS)sequences of nrDNA[J]. Plant Systematics and Evolution, 2002, 235(1): 121-134. doi: 10.1007/s00606-002-0206-0 [8] Bartish I V, Jeppsson N, Nybom H, et al. Phylogeny of Hippophae(Elaeagnaceae)inferred from parsimony analysis of chloroplast DNA and morphology[J]. Systematic Botany, 2002, 27(1): 41-54. [9] 齐虹凌, 于泽源, 李兴国. 沙棘研究概述[J]. 沙棘, 2005, 18(2): 37-41. [10] 李蓉, 于永涛. DNA分子标记及在沙棘遗传育种中的应用展望[J]. 国际沙棘研究与开发, 2008, 6(2): 19-25. doi: 10.3969/j.issn.1672-4836.2008.02.007 [11] Wang A, Schluetz F, Liu J. Molecular evidence for double maternal origins of the diploid hybrid Hippophae goniocarpa(Elaeagnaceae)[J]. Botanical Journal of the Linnean Society, 2008, 156(1): 111-118. doi: 10.1111/j.1095-8339.2007.00729.x [12] 孙燕琳, 阮成江, 金华. 沙棘SSR分子标记的开发[J]. 安徽农业科学, 2007, 35(1): 45-46. doi: 10.3969/j.issn.0517-6611.2007.01.023 [13] Wang A, Zhang Q, Wan D, et al. Nine microsatellite DNA primers for Hippophae rhamnoides ssp. sinensis(Elaeagnaceae)[J]. Conservation Genetics, 2008, 9(4): 969-971. doi: 10.1007/s10592-007-9416-x [14] Jain A, Ghangal R, Grover A, et al. Development of EST-based new SSR markers in seabuckthorn[J]. Physiology and Molecular Biology of Plants, 2010, 16(4): 375-378. doi: 10.1007/s12298-010-0037-3 [15] Grabherr M G, Haas B J, Yassour M, et al. Full-length transcriptome assembly from RNA-Seq data without a reference genome[J]. Nature biotechnology, 2011, 29(7): 644-652. doi: 10.1038/nbt.1883 [16] Grabherr M G, Haas B J, Yassour M, et al. Full-length transcriptome assembly from RNA-Seq data without a reference genome[J]. Nature biotechnology, 2011, 29(7): 644-652. doi: 10.1038/nbt.1883 [17] Schuelke M. An economic method for the fluorescent labeling of PCR fragments[J]. Nature biotechnology, 2000, 18(2): 233-234. doi: 10.1038/72708 [18] 贯春雨, 张含国, 张磊, 等. 基于松科树种EST序列的落叶松SSR引物开发[J]. 东北林业大学学报, 2011, 39(1): 20-23. doi: 10.3969/j.issn.1000-5382.2011.01.007 [19] 高丽霞. 桑树EST—SSR引物开发[J]. 南方农业学报, 2013, 44(8): 1254-1257. doi: 10.3969/j:issn.2095-1191.2013.8.1254 [20] Du F K, Xu F, Qu H, et al. Exploiting the transcriptome of Euphrates Poplar, Populus euphratica(Salicaceae)to develop and characterize new EST-SSR markers and construct an EST-SSR database[J]. PloS one, 2013, 8(4): e61337. doi: 10.1371/journal.pone.0061337 [21] 李文娟, 马宏, 李正红, 等. 基于芭蕉属EST序列的地涌金莲SSR引物开发[J]. 林业科学研究, 2012, 25(2): 111-116. doi: 10.3969/j.issn.1001-1498.2012.02.001 [22] 孟蒙, 唐维, 刘嘉, 等. 基于中华猕猴桃"红阳" 转录组序列开发EST-SSR分子标记[J]. 应用与环境生物学报, 2014, 20(4): 564-570. [23] 李广平, 曹福亮. 银杏EST-SSR引物开发[J]. 西北农业学报, 2012, 21(12): 149-152. doi: 10.7606/j.issn.1004-1389.2012.12.029