• 中国中文核心期刊
  • 中国科学引文数据库(CSCD)核心库来源期刊
  • 中国科技论文统计源期刊(CJCR)
  • 第二届国家期刊奖提名奖

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于核桃参考基因组的SSR位点鉴定分析和单态性标记开发

贺君星 马庆国 裴东 张俊佩

引用本文:
Citation:

基于核桃参考基因组的SSR位点鉴定分析和单态性标记开发

    作者简介: 贺君星,在读硕士。主要研究方向:经济林生物技术。E-mail:2648496184@qq.com.
    通讯作者: 马庆国, mqg@caf.ac.cn
  • 中图分类号: S664.1

Genome-Wide Analysis of Microsatellite Loci and Specific Monomorphism SSR Marker Development in Walnut (Juglans regia L.) Reference Genome

    Corresponding author: Ma Qing-guo, mqg@caf.ac.cn ;
  • CLC number: S664.1

  • 摘要: 目的 为了阐明核桃(Juglans regia L.)(2n=2x=32)全基因组不同染色体上SSR位点数量及其分布特征,开发并验证单态性SSR引物。 方法 基于核桃品种‘中牧查一’的高质量参考基因组序列图谱,使用MISA软件筛选并分析SSR位点,利用Primer 3.0进行引物设计,通过电子PCR进行引物多态性分析,筛选并合成单态性SSR引物并通过真实PCR实验验证其有效性。 结果 (1)在全基因组16条染色体上鉴定得到了共计357 629 个SSR位点,分布密度为662.28 SSRs·Mb−1,其中,10~30 bp长度的短序列占95.00%以上,优势重复单元以A/T碱基为主;不同染色体上SSR位点数量差异较大,其中,Chr1染色体上SSR位点数量最多,Chr16染色体上最少,SSR重复单元的数量及种类与染色体长度呈极显著正相关,进一步统计分析获得的644 种稀有SSR单元中六核苷酸重复基元占多数;(2)基于不同染色体上SSR重复单元的类型和数量构建分布矩阵,聚类分析发现以遗传距离0.075为阈值可将所有染色体分为4组,其中第4组中成员最多(11条),而第1组中仅有Chr10染色体,总体来看,Chr10染色体自成一个主枝,显示其可能经历了较为保守的进化过程;(3)利用SSR 位点侧翼的保守序列设计出SSR引物303 009对,通过电子PCR筛选并随机合成了32对单态性引物进行验证,其中30对(93.75%)在6 个核桃品种中扩增出了清晰的目标产物,28对(87.50%)的PCR扩增结果与电子PCR评估结果一致。 结论 本研究鉴定了‘中牧查一’核桃参考基因组不同染色体序列中的SSR位点,发现其数量和重复类型变化较大,且与染色体长度呈极显著正相关,单碱基重复的SSR是最常见的类型。建立了电子PCR与传统方法联用的引物开发流程,同时验证了其有效性,为核桃SSR引物的个性化快速开发提供了有效策略。筛选获得的28对单态性引物可为分子辅助育种中杂交子代“私生检测”等研究提供科学借鉴与参考。
  • 图 1  核桃全基因组SSR位点重复类型的分布特征

    Figure 1.  Genome-wide distribution of SSR repeat types in walnut

    图 2  核桃基因组不同染色体SSR位点分布

    Figure 2.  Distribution of SSR loci in different chromosomes of walnut genome

    图 3  CAF11引物在6个核桃主栽品种中的毛细管电泳图谱

    Figure 3.  The capillary electrophoresis patterns from primer CAF11 in 6 main cultivars of walnut.

    表 1  供试核桃品种

    Table 1.  Walnut cultivars used in this study

    编号
    No.
    名称  
    Name  
    来源地或采样地点
    Origin/Source
    1 ‘强特勒’ ‘Chandler’ 河北省易县
    2 ‘辽宁1号’ ‘Liaoning 1’ 辽宁省大连市
    3 ‘清香’ ‘Qingxiang’ 河北省易县
    4 ‘香玲’ ‘Xiangling’ 山东省泰安市
    5 ‘扎343’ ‘Zha 343’ 新疆阿克苏市
    6 ‘新新2号’ ‘Xinxin 2’ 新疆阿克苏市
    下载: 导出CSV

    表 2  核桃不同重复类型SSR相关性分析

    Table 2.  Correlation coefficient of different SSR repeat types in Walnut

    重复单元
    Repeat units
    单核苷酸
    Mono-nucleotide
    二核苷酸
    Di-nucleotide
    三核苷酸
    Tri-nucleotide
    四核苷酸
    Tetra-nucleotide
    五核苷酸
    Penta-nucleotide
    六核苷酸
    Hexa-nucleotide
    单核苷酸 Mono-nucleotide 1.000 0
    二核苷酸 Di-nucleotide 0.986 3** 1.000 0
    三核苷酸 Tri-nucleotide 0.985 6** 0.969 0** 1.000 0
    四核苷酸 Tetra-nucleotide 0.928 6** 0.938 7** 0.911 8** 1.000 0
    五核苷酸 Penta-nucleotide 0.879 6** 0.850 5** 0.870 2** 0.862 1** 1.000 0
    六核苷酸 Hexa-nucleotide 0.845 6** 0.796 3** 0.822 9** 0.785 4** 0.798 5** 1.000 0
    注:**表示p<0.01。
      Note: **stand for p<0.01.
    下载: 导出CSV

    表 3  核桃参考基因组不同染色体的稀有SSR重复单元

    Table 3.  Rare SSR units of different chromosomes in Walnut reference genome

    染色体
    Chromosome
    四核苷酸重复
    Tetra-nucleotide repeats
    五核苷酸重复
    Penta-nucleotide repeats
    六核苷酸重复
    Hexa-nucleotide repeats
    Chr1 ATCA, CTGA, GTTC AACCC, AATAC, ACTAA, CATAA, CGAGA, CGGGC, CTCGT, GAAAT, GAGAG, GATAT, GATTA, GGAAA, GGCTC, GGTTT, GTTTT AAATTA, ACAGCA, ACCCCT, ACTCCA, AGTGGT, ATTTGG, CCAGGT, CCCTCT, CCGCCC, CCTACC, CGAAGA, CGGCTC, CTCAAA, CTCTGC, CTCTGG, CTGCGT, CTTCCC, CTTCCT, GAAAAA, GAAGCC, GACGCA, GATCGT, GCCAAA, GGAGGT, GGCTTG, GTCGGA, GTGAGA, GTTGGT, TCATCT, TCTCCC, TGGGCA, TTCACT, TTGTTT
    Chr2 CGTT, TGAT ACATG, AGATC, ATTTG, CCACT, CCTTC, CTAGC, GGGTG, GTCGG, TGGTC AATATT, AGGAAG, ATGGAT, CAGCCA, CCATCA, CCCTCA, CCGACT, CGCAGT, CGGGAGT, CGGGTG, GAGAGT, GAGGAA, GAGTTC, GCCTCC, GGTGGA, TCAAAC, TGGGTA, TTGATG
    Chr3 AGCG, CGGA, GTCA, TTCG AACCA, ACAGA, ACATC, ATCCC, CCGAT, CGCCA, CTCTG, GAATT, GATTC, GTGCA, TCTCC, TGAAT, TGATG, TGCTG, TGCTT, TGTGC AAATAT, AATTAA, AATTCA, ACACCC, ACCCTT, AGCAGG, ATATAA, ATCTCT, ATTCCA, CAATCA, CAGCTC, CATCAC, GCACAC, GCAGAG, GGAGAG, GTGAAC, TATCTT, TGCCCC, TGTTGC, TTGAAG, TTTCAT
    Chr4 GCCA, GTCC, TCAA AAGCC, ACCTC, ATACT, CATCA, CCAGC, GCTCG, TGAAG, TTGAT ATAGAT, CATGCA, CATTGC, CCGCCA, CCTCTA, GACAAA, GCCTCA, GGGGCT, TCAAGG, TCTTGG, TTCCTA
    Chr5 AACT, GATT, GCGG, GGGT ATAAG, ATGTG, CAAGC, CATAT, CTGGA, GAAAC, GATTT, GGTGG, TCCCT, TGAGG, TGTTA, TTAAT AAAGGA, AAATAC, AACCCT, AAGGTC, AATTCC, ACACAT, ACATAC, ACTGAT, AGAAGG, AGCCTG, AGGAGA, AGTCGG, ATAAAA, ATGCAT, CCAAAA, CCCCTT, CCTCCC, CGACTC, CTCAAG, CTCATT, CTCCAT, CTCCGA, CTGATA, CTGTCT, GAAATG, GACTCC, GCCACT, GGCGGG, GGGCAG, GGGTGG, GTAGGT, GTTGCT, TACCCC, TATTAG, TATTTC, TCCACC, TCGAAC, TCGGAG, TCTCTG, TGAGAG, TGCTCG, TGGCGA, TGGGCC, TGGTAG, TGGTTC, TTCTTT, TTTGGT, TTTTAT
    Chr6 CCTG, GCTC, GTAG AGTCT, CACCA, CCCCA, CCCGA, CTACC, GCACT, GCCGG, GCTGA, GGGGT, GGTTG, GTGAA, TATTA AATCAG, ACAAAA, AGACAG, AGTAGG, AGTCGG, ATAGGC, ATTTTT, CCAACA, CCTCCG, CCTTTG, CGGAGG, CTCCAT, CTCCGA, CTCCGC, CTCCTA, GACCTC, GCCTCT, GCTTCT, GGATCA, GGGTGT, GGTTAG, GTAGGT, GTTTTT, TATCAT, TCCGAC, TCGGAG, TCTCCA
    Chr7 GGCT, TCGC, TGGG AACAT, AGTAG, CCTAC, CTCAC, GATAA, GCCCG, TGAGC, TTGAA, TTGTT ACCCAC, ACTAAT, ACTCCT, AGAAAC, AGAGAT, ATACAC, ATACTA, ATATAC, ATGTAT, ATTTGA, CAGAAT, CCACAC, CCACCT, CCACGC, CCCAAC, CCCTGT, CCTGAG, CGGTCG, CTCTCC, GACTCC, GAGTGA, GCGTGC, GGAGTG, GGGAGA, GGGTGT, TCTATC, TGGAGG, TGGTTG, TTATTT, TTGGGT
    Chr8 CACT AAGGA, ACAAC, AGATA, ATTTC, CAAAT, GTATA, GTGTG, GTTAG, TAATT, TCTGA, TTTGA AGGCTC, AGGGTT, ATGGCA, ATTGTC, CCCCCA, CCCCTT, CCTCCG, CGGAGT, CTCCGA, CTCTCC, CTCTTG, GAGCTA, GCAAAC, GGCTGT, GGGCTA, GGGTTA, GTGTAT, TAATTA, TCTTCC, TCTTTT, TGAGCA, TGTCCC, TGTCGG, TTCGCC
    Chr9 CCTA, TCCG, TGAC ACCCG, ATGGG, CCAGT, CTAAT, GAGGT, GCAAT, GCCAT, GCCCC, GGCAT, GGGCT,GGGGA, GGTAA, TCCAG, TCGGC, TCTTA ACGAAC, AGAGAC, AGCAGA, AGTCGG, CAACAC, CCCTCC, CTCCAA, CTCCCT, CTCCGA, CTCTAT, CTCTCA, CTTGGT, GAATAT, GACTCC, GAGGGA, GCAAAA, GGCCCA, GGTAGG, GTCGAG, TATATG, TATTAC, TCAGTT, TCGGAG, TCTGTC, TCTTTT, TGGTCC
    Chr10 ACTG, CCCG, CTTG, TGGT AGTCG, CATAG, CGTCC, CTTCC, GATCG, GCCCA, TCATG, TTAGC, TTGTG AAGCCA, AAGTGG, AATTTG, ACACAT, ACCCGC, ACCCTC, AGGGAT, ATACTC, CATATA, CATCGT, CCCCTC, CCCTCC, CCTCCA, CCTCTT, CGACTC, CGGAGG, CTGCTC, GACTCC, GAGGGA, GAGGTG, GCCCCT, GGTTAG, GTGGGC, TAAAAA, TATATG, TATTTG, TCCGGT, TCGGAG, TGATCA, TGGAGG, TGGCAG, TTATTT, TTCTCC, TTGGGG
    Chr11 AGTC, CCGC, GGCC AAGCA, ACCAA, CATCC, CCCGG, CCGCA, CGGGG, CAAGA, GATGT, GGAGG, GTATT, TGCTC AAAGAA, AAATAC, AATACT, AGAGAT, AGAGGG, AGATAG, AGCTTA, ATTAAT, CACATG, CCACCT, CCCCCT, CTCCAT, CTCCCT, CTCCGA, CTGGTG, GACCCA, GATTCG, GATTTT, GGAAGG, GGGTTA, GTAGGG, TATTAG, TCCGAC, TGAGCA, TGGAGG, TGTTTT, TTCCCC, T TCTTT, TTTAAC
    Chr12 GCCC AAACG, AAGTG, AATGC, ATTAC, CAATA, TTCCT AAGAAC, ACCTCC, AGTCGG, ATAAAA, ATCAAC, ATTTTT, CAGGCT, CCAAGC, CCTCCA, CCTCTC, CCTGCA, CCTGTC, CTATTG, CTGGCT, CTTTTA, GAAGGA, GAGATG, GAGCTC, GATGAA, GATGGA, TATTAC, TATTAG, TCCGAC, TCTCAC, TCTGTC, TTACTT, TTCTTT, TTTATT, TTTCTC, TTTGAT
    Chr13 CGTG, GGCA AGAGA, AGCCG, CAGTA, GGCCC, TATTG, TCACC AAATTG, AACCAA, AAGAGA, ACGGCG, AGACAG, AGGGGG, AGTAGG, ATAAAA, ATCTAA, CAACAC, CAGCCC, CCTACA, CGACTC, CGCACA, CGGAGG, CTCCGA, CTTGGG, GAATTT, GCTGTG, GGCACA, GTGCGT, TCAAAA, TGAGCC, TGCATG, TTCATG, TTGATT, TTTAAA
    Chr14 ACTT AGAAG, ATCCG, CACAT, CAGTG, TAGTA AGTTCA, CACACG, CCCTAA, CTACTG, CTCTAT, CTTTTG, GAAGAG, GCACCG, GGGTTA, TAAAAA, TCTTTT, TTATAT
    Chr15 - AACCT, ACACG, ACTAC, ATTGC, CAATC, GAGGA, GAGTT, TGTAA AAGCCC, AATGCC, ACCTCC, ACTACC, ACTCCG, AGGAGT, AGTAGG, AGTCGG, ATACAT, CCTCCG, CGAGCT, CTCCAC, CTCCCT, CTCCGA, CTCTCG, GAGGGG, GCCCAA, GCGAGA, GTAGGA, GTGCTC, GTGTGC, TATTAC, TCCACC, TCCCTC, TCCGAC, TCGGAG, TCTTTT, TGATCG, TGGCTG, TTAGGG, TTTATT, TTTCTT, TTTGTG
    Chr16 CTAC ACTCG, ATAAC, GCATT, GGGTC, TAGTG, TTCAC AAAATT, ACATAT, ATACGA, ATTAGT, ATTTGA, ATTTTT, CACGCA, CCCCGC, CCTTTT, CGGAGG, CTCCGA, CTTTTT, GACTCC, GATTTA, GCTCCG, TATATG, TCATCC, TCATCG, TCCCTG, TCTCTT, TCTTTT, TGGGTG, TTAGTA
    下载: 导出CSV

    表 4  32对核桃单态SSR引物信息

    Table 4.  Information of 32 primers from walnut genome

    引物编号
    Primer ID
    染色体编号
    Chromosome
    重复基序
    Repeat motifs
    上游序列(5’-3’)
    Forward (5’-3’)
    下游序列(5’-3’)
    Reverse (5’-3’)
    退火温度
    Tm/℃
    CAF271 Chr1 (TTC)5 ATCGGATCGGTTCGTCATGG TTTGTGGCTTGGTTTTGGCC 60
    CAF100 Chr1 (GAG)5 GGCCAAGACATAACCCAGCT AGATGGGTAATCAGGGGGCT 60
    CAF364 Chr2 (TCT)6 GACTCCACCCCCTTGTCATG GTGAACAAGACCCGACCCAT 60
    CAF169 Chr2 (ATG)5 GGGTGACGACGGTGACTATC GATGCAGAAAGGCTCCCAGT 60
    CAF36 Chr3 (TTC)5 TGGGTTTGCACTACCTGAGT TGAAACTGATTGCACCCCCA 60
    CAF322 Chr3 (TGC)5 ATACCGCTGCTGTAGATGCC TGGCCCTCATCACCCTCATA 60
    CAF293 Chr4 (AAG)6 GTGTTGAGAGGAAGGGCGAA ACCCATGTGTGAGCATGCTT 60
    CAF359 Chr4 (AGA)5 CTCGTCGTAGAAGTCGGAGC TTGAGTCCGAGCACTTGCAT 60
    CAF1 Chr5 (TCT)6 GCCAATCGGGGTAGAGGATG GCGGAGGAGTTGATAGAGGC 60
    CAF119 Chr5 (AGG)5 GAGAGCGAGAGACGTGATGG CCTTGTGGAATCGTCAGCCT 60
    CAF150 Chr6 (TAA)5 GCATGCAGCAGTCTTGGAAC CTCCTTCTTCACCTGCCCAG 60
    CAF186 Chr6 (TTA)6 ACGGAAACAACGGCCTATGT TTTCTTTTTCGCGGCTTCGG 60
    CAF11 Chr7 (CCA)5 TTCCATCTCCTCTCCCCCAG TTATCTTCGCGATCGGCACA 60
    CAF103 Chr7 (CTT)5 GCGACGGAGATATGCAGGAA CGAGGGCCAAAGTTGACTCT 60
    CAF350 Chr8 (GCT)5 TAAGCTGGAACCCAATGGCC AATCTCAACAGCAGCAGCAG 60
    CAF288 Chr8 (TTC)5 AATGTCGTTCCTGAGCACGT TATCTAACGACCGCCGCTTC 60
    CAF6 Chr9 (GAG)6 GAGGAGGAGGAGGAAGGGAG TCTGCGCTCTCTCGTTTTGT 60
    CAF147 Chr9 (GAA)6 TGCTGGCTCCCTTCCTAGAT CCCCTCACACCTCCATTTCC 60
    CAF16 Chr10 (AGA)6 TATCGCTGGCTTTCCGATCC GCGACATTGCAATCCAGGTC 60
    CAF265 Chr10 (AAG)5 TGACGTCCCTTGAGTTGTCG AGTGCGTACATGACCAAGCA 60
    CAF107 Chr11 (GAG)5 AGAAGCCGTGGAACTTGAGG TTGGACAACGCGATCCAGAA 60
    CAF108 Chr11 (TTA)6 CACACCCTTTCCCGCTTTTG TGTCACCGATCTGTCCGTTG 60
    CAF15 Chr12 (AGA)5 GAGAGCGGCGAGTACTACAC CCCTGCCTCCCTACTCTTCT 60
    CAF208 Chr12 (TGA)5 GTCAGCCACGAACACAACAC GATCCTGGAAGTCGACAGCC 60
    CAF151 Chr13 (AAG)5 AAACAGGGCGAGATTGGAGG CCTTATCGCCATCGTCGTCA 60
    CAF153 Chr13 (TCT)5 AATAGCAGAGCCCGTGATCG CTGCCACAGTTGTAGAGCCA 60
    CAF236 Chr14 (AGT)5 GCTGCAAAGCACACAATCCA GCTTTCTCCGCTGTTCCTCT 60
    CAF246 Chr14 (TAA)5 GCAACAGCAGGATTTTGCCA AGGGGATGGGTCTGTAGCAT 60
    CAF131 Chr15 (TTC)5 TGCTGTCAAAGGGGAATCAA AGCTCTTCCAAGCACCATGT 60
    CAF8 Chr15 (GCT)5 TCGCCAACGACACCATAACA TTTCCAGCTGCTTTTGTCGC 60
    CAF129 Chr16 (CTA)6 TCTCAGGCCCAACAACCATC TAGAGAGAGATCCTCCGGCG 60
    CAF536 Chr16 (CAG)5 TTCTCCACAAGTACCGCACC CCTCTCTCACTACCCCAGCT 60
    下载: 导出CSV
  • [1] 裴 东, 鲁新政. 中国核桃种质资源[M]. 北京: 中国林业出版社, 2011.

    [2] 国家林业和草原局. 中国林业统计年鉴(2020)[M]. 北京: 中国林业出版社, 2020.

    [3] 马庆国, 乐佳兴, 宋晓波, 等. 新中国果树科学研究70年—核桃[J]. 果树学报, 2019, 36(10):1360-1368.

    [4]

    Abd Ei-Moghny A M, Santosh H B, Raghavendra K P, et al. Microsatellite marker based genetic diversity analysis among cotton (Gossypium hirsutum) accessions differing for their response to drought stress[J]. Journal of Plant Biochemistry and Biotechnology, 2017, 26: 366-370. doi: 10.1007/s13562-016-0395-1
    [5]

    Li J, Ye C. Genome-wide analysis of microsatellite and sex-linked marker identification in Gleditsia sinensis[J]. BMC Plant Biology, 2020, 20(1): 338. doi: 10.1186/s12870-020-02551-9
    [6]

    Patil P G, Singh N V, Bohra A, et al. Comprehensive characterization and validation of chromosome-specific highly polymorphic SSR markers from Pomegranate (Punica granatum L.) cv. Tunisia genome[J]. Frontiers in Plant Science, 2021, 12: 645055. doi: 10.3389/fpls.2021.645055
    [7]

    UPOV. Guidelines for DNA-profiling: molecular marker selection and database construction (“BMT guidelines”) [EB/OL]. https://www.upov.int/edocs/mdocs/upov/en/bmt_18/upov_inf_17_2_draft_2.pdf, 2019-10-10.
    [8]

    Mathema V B, Nakeesathit S, White N J, et al. Genome-wide microsatellite characteristics of five human Plasmodium species, focusing on Plasmodium malariae and P. ovale curtisi[J]. Parasite, 2020, 27(7): 34.
    [9]

    Dharajiya D T, Shah A, Galvadiya B P, et al. Genome-wide microsatellite markers in castor (Ricinus communis L. ): Identification, development, characterization, and transferability in Euphorbiaceae[J]. Industrial Crops and Products, 2020, 151: 112461. doi: 10.1016/j.indcrop.2020.112461
    [10]

    Zhu H, Song P, Koo D H, et al. Genome wide characterization of simple sequence repeats in watermelon genome and their application in comparative mapping and genetic diversity analysis[J]. BMC Genomics, 2016, 17(1): 557. doi: 10.1186/s12864-016-2870-4
    [11]

    Manee M M, Algarni A T, Alharbi S N, et al. Genome-wide characterization and analysis of microsatellite sequences in camelid species[J]. Mammal Research, 2019, 65(16): 359-373.
    [12]

    Subramanian S, Mishra R K, Singh L, et al. Genome-wide analysis of microsatellite repeats in humans: their abundance and density in specific genomic regions[J]. Genome Biology, 2003, 4(2): 1-10. doi: 10.1186/gb-2003-4-2-p1
    [13]

    Kelkar Y D, Tyekucheva S, Chiaromonte F, et al. The genome-wide determinants of human and chimpanzee microsatellite evolution[J]. Genome Research, 2008, 18(1): 30-38. doi: 10.1101/gr.7113408
    [14]

    Woeste K, Burns R, Rhodes O, et al. Thirty polymorphic nuclear microsatellite loci from black walnut[J]. Journal of Heredity, 2002, 93(1): 58-60. doi: 10.1093/jhered/93.1.58
    [15]

    Wang H, Pan G, Ma Q G, et al. The genetic diversity and introgression of Juglans regia and J. sigillata in Tibet as revealed by SSR markers[J]. Tree Genetics & Genomes, 2015, 11(1): 804.
    [16]

    Zhang R, Zhu A, Wang X, et al. Development of Juglans regia SSR markers by data mining of the EST database[J]. Plant Molecular Biology Reporter, 2010, 28: 646-653. doi: 10.1007/s11105-010-0192-2
    [17]

    Dang M, Zhang T, Hu Y H, et al. De novo assembly and characterization of bud, leaf and flowers Transcriptome from Juglans regia L. for the identification and characterization of new EST-SSRs[J]. Forests, 2016, 7(10): 247.
    [18] 陈凌娜, 马庆国, 张俊佩, 等. 核桃BES-SSR的开发及在遗传多样性分析中的应用[J]. 北京林业大学学报, 2014, 36(6):24-29.

    [19]

    Ikhsan A S, Topcu H, Sutyemez M, et al. Novel 307 polymorphic SSR markers from BAC-end sequences in walnut (Juglans regia L.): Effects of motif types and repeat lengths on polymorphism and genetic diversity[J]. Scientia Horticulturae, 2016, 213(1): 1-4.
    [20]

    ESE R, Topu H, Kefayati S, et al. Highly polymorphic novel simple sequence repeat markers from Class I repeats in walnut (Juglans regia L. )[J]. Turkish Journal of Agriculture & Forestry, 2019, 43(2): 174-183.
    [21]

    Omer E, Guan S. Using monomorphic microsatellite markers in Oil Palm (Elaeisguineensis Jacq. )[J]. Research & Reviews Journal of Botanicalences, 2014, 3(4): 1-6.
    [22]

    Zhang J P, Zhang W T, Ji F Y, et al. A high‐quality walnut genome assembly reveals extensive gene expression divergences after whole‐genome duplication[J]. Plant Biotechnology Journal, 2020, 18(9): 1848-1850. doi: 10.1111/pbi.13350
    [23]

    Marrano A, Britton M, Zaini P A, et al. High-quality chromosome-scale assembly of the walnut (Juglans regia L) reference genome[J]. GigaScience, 2020, 9(5): giaa050. doi: 10.1093/gigascience/giaa050
    [24]

    Han B, Wang C, Tang Z, et al. Genomewide analysis of microsatellite markers based on sequenced database in Chinese spring wheat (Triticum aestivum L.)[J]. PLoS ONE, 2015, 10: e0141540. doi: 10.1371/journal.pone.0141540
    [25]

    Xue H, Zhang P, Shi T, et al. Genome-wide characterization of simple sequence repeats in Pyrus bretschneideri and their application in an analysis of genetic diversity in pear[J]. BMC Genomics, 2018, 19(1): 473. doi: 10.1186/s12864-018-4822-7
    [26]

    Biswas M K, Xu Q, Mayer C, et al. Genome wide characterization of short tandem repeat markers in sweet orange (Citrus sinensis)[J]. PLoS ONE, 2014, 9(8): e104182. doi: 10.1371/journal.pone.0104182
    [27]

    Chen L N, Dong R Q, Ma Q G, et al. Precocious genotypes and homozygous tendency generated by self-pollination in walnut[J]. BMC Plant Biology, 2018, 18: 323. doi: 10.1186/s12870-018-1549-1
    [28]

    Fu P C, Zhang Y Z, Ya H Y, et al. Characterization of SSR genomic abundance and identification of SSR markers for population genetics in Chinese jujube (Ziziphus jujuba Mill.)[J]. PeerJ, 2016, 4(2): e1735.
    [29]

    Pan G, Chen A, Li J, et al. Genome-wide development of simple sequence repeats database for flax (Linum usitatissimum L.) and its use for genetic diversity assessment[J]. Genetic Resources and Crop Evolution, 2020, 67(4): 865-874. doi: 10.1007/s10722-020-00882-y
    [30]

    Liu S R, An Y L, Li F D, et al. Genome-wide identification of simple sequence repeats and development of polymorphic SSR markers for genetic studies in tea plant (Camellia sinensis)[J]. Molecular Breeding, 2018, 38(5): 59. doi: 10.1007/s11032-018-0824-z
    [31]

    Lu Q, Hong Y, Li S, et al. Genome-wide identification of microsatellite markers from cultivated peanut (Arachis hypogaea L.)[J]. BMC Genomics, 2019, 20: 799. doi: 10.1186/s12864-019-6148-5
    [32]

    Sonah H, Deshmukh R K, Sharma A, et al. Genome-wide distribution and organization of microsatellites in plants: an insight into marker development in Brachypodium[J]. PLoS ONE, 2011, 6: e21298. doi: 10.1371/journal.pone.0021298
    [33]

    Qi W H, Jiang X M, Du L M, et al. Genome-wide survey and analysis of microsatellite sequences in bovid species[J]. PLoS ONE, 2015, 10(7): e0133667. doi: 10.1371/journal.pone.0133667
    [34]

    Park S, Son S, Shin M, et al. Transcriptome-wide mining, characterization, and development of microsatellite markers in Lychnis kiusiana (Caryophyllaceae)[J]. BMC Plant Biology, 2019, 19(1): 1-12. doi: 10.1186/s12870-018-1600-2
    [35] 童治军, 焦芳婵, 肖炳光. 普通烟草及其祖先种基因组SSR位点分析[J]. 中国农业科学, 2015, 48:2108-2117. doi: 10.3864/j.issn.0578-1752.2015.11.003

    [36] 王玉龙, 黄冰艳, 王思雨, 等. 四倍体野生种花生A. monticola全基因组SSR的开发与特征分析[J]. 中国农业科学, 2019, 52(15):2567-2580. doi: 10.3864/j.issn.0578-1752.2019.15.002

    [37]

    Tóth G, Gáspári Z, Jurka J. Microsatellites in different eukaryotic genomes: surveys and analysis[J]. Genome Research., 2000, 10(7): 967-981. doi: 10.1101/gr.10.7.967
    [38]

    Haydar K, Ying L C M, Wieland M. Survey of simple sequence repeats in completed fungal genomes[J]. Molecular Biology and Evolution, 2005, 2(3): 639-649.
    [39]

    Song X M, Yang Q H, Bai Y, et al. Comprehensive analysis of SSRs and database construction using all complete gene-coding sequences in major horticultural and representative plants[J]. Horticulture Research, 2021, 8(1): 122. doi: 10.1038/s41438-021-00562-7
    [40]

    Portis E, Lanteri S, Barchi L, et al. Comprehensive characterization of simple sequence repeats in eggplant (Solanum melongena L.) genome and construction of a web resource[J]. Frontiers in Plant Science, 2018, 9: 401. doi: 10.3389/fpls.2018.00401
    [41]

    Temnykh S. Computational and experimental analysis of microsatellites in Rice (Oryza sativa L.): frequency, length variation, transposon associations, and genetic marker potential[J]. Genome Research, 2001, 11(8): 1441-1452. doi: 10.1101/gr.184001
    [42]

    Cavagnaro P F, Senalik D A, Yang L, et al. Genome-wide characterization of simple sequence repeats in cucumber (Cucumis sativus L.)[J]. BMC Genomics, 2010, 11: 569. doi: 10.1186/1471-2164-11-569
    [43]

    Nazareno A G, dos Reis MS. The same but different: monomorphic microsatellite markers as a new tool for genetic analysis[J]. American Journal of Botany, 2011, 98: e265-e267. doi: 10.3732/ajb.1100163
    [44]

    Ince A G, Karaca M, Onus A N. CAPS-microsatellites: use of CAPS method to convert non-polymorphic microsatellites into useful markers[J]. Molecular Breeding, 2010, 25(3): 491-499. doi: 10.1007/s11032-009-9347-y
    [45]

    Karaca M, Ince A G. New non-redundant microsatellite and CAPS-microsatellite markers for cotton (Gossypium L.)[J]. Turkish Journal of Field Crops, 2011, 16: 172-178.
  • [1] 杨莉杨双昱麻文建周建华 . 核桃褐斑病病原菌的分离鉴定和发病规律的调查. 林业科学研究, doi: 10.13275/j.cnki.lykxyj.2017.06.017
    [2] 何春霞孟平张劲松陈平孙守家高峻 . 华北低丘山区核桃-决明子复合模式的根系分布. 林业科学研究,
    [3] 王书珍张羽佳黄诗颖罗炎炎金正强李志良金卫斌 . 基于锦绣杜鹃花蕾转录组的SSR标记开发及应用. 林业科学研究, doi: 10.13275/j.cnki.lykxyj.2019.03.013
    [4] 甘四明施季森白嘉雨徐建民 . 林木分子标记研究进展. 林业科学研究,
    [5] 孙宝刚陈飞王健敏陈晓鸣杨子祥蔡学勇李彬 . 不同径级云南松各部位生物量及其分布规律. 林业科学研究,
    [6] 高尚坤唐艳龙张彦龙杨忠岐王小艺路纪芳王健司徒春南付甫永 . 松褐天牛在马尾松树干上的分布规律. 林业科学研究,
    [7] 张国武钟文斌乌云塔娜谭晓风杜天真 . 油茶优良无性系ISSR分子鉴别. 林业科学研究,
    [8] 奚声珂杨彬 . 核桃微枝嫁接技术的研究*. 林业科学研究,
    [9] 黄昕蕾王雁 . 石斛属分子生物学研究进展. 林业科学研究, doi: 10.13275/j.cnki.lykxyj.2018.03.020
    [10] 朱丽华李明亮曹庆昌 . 多效唑在核桃上的应用效果研究*. 林业科学研究,
    [11] 周贝贝陈凌娜张俊佩裴东 . 适合MSAP分析的核桃子叶DNA提取方法. 林业科学研究,
    [12] 宋晓波陈凌娜王红霞裴东 . '辽宁2号'核桃品种矮化机制初探. 林业科学研究,
    [13] 刘昊马庆国张继勇文明宋晓波张俊佩裴东 . 凉山州核桃坚果表型多样性研究. 林业科学研究, doi: 10.13275/j.cnki.lykxyj.2017.05.010
    [14] 裴东奚声珂董凤祥 . 核桃砧穗生理状态对微枝嫁接成活的影响. 林业科学研究,
    [15] 朱丽华曹庆昌李明亮 . 多效唑对核桃生长发育的影响及其生理基础*. 林业科学研究,
    [16] 张川红沈应柏尹伟伦 . 盐胁迫对国槐和核桃幼苗光合作用的影响. 林业科学研究,
    [17] 马长明翟明普 . 干季核桃树干液流特征及其与气象因子的关系. 林业科学研究,
    [18] 马庆国齐静裴东 . 16个早实核桃良种遗传多样性的FISH-AFLP分析. 林业科学研究,
    [19] 何健马庆国雪来提·牙生孙东孙世国裴东 . FISH-AFLP分析新疆核桃品种遗传多样性. 林业科学研究,
    [20] 周贝贝文明马庆国裴东 . 核桃基因组DNA甲基化修饰位点的MSAP分析. 林业科学研究,
  • 加载中
图(3) / 表(4)
计量
  • 文章访问数:  1223
  • HTML全文浏览量:  420
  • PDF下载量:  19
  • 被引次数: 0
出版历程
  • 收稿日期:  2022-04-15
  • 录用日期:  2022-05-26
  • 网络出版日期:  2022-06-17

基于核桃参考基因组的SSR位点鉴定分析和单态性标记开发

    通讯作者: 马庆国, mqg@caf.ac.cn
    作者简介: 贺君星,在读硕士。主要研究方向:经济林生物技术。E-mail:2648496184@qq.com
  • 林木遗传育种国家重点实验室,国家林业和草原局林木培育重点实验室,中国林业科学研究院林业研究所,北京 100091

摘要:  目的 为了阐明核桃(Juglans regia L.)(2n=2x=32)全基因组不同染色体上SSR位点数量及其分布特征,开发并验证单态性SSR引物。 方法 基于核桃品种‘中牧查一’的高质量参考基因组序列图谱,使用MISA软件筛选并分析SSR位点,利用Primer 3.0进行引物设计,通过电子PCR进行引物多态性分析,筛选并合成单态性SSR引物并通过真实PCR实验验证其有效性。 结果 (1)在全基因组16条染色体上鉴定得到了共计357 629 个SSR位点,分布密度为662.28 SSRs·Mb−1,其中,10~30 bp长度的短序列占95.00%以上,优势重复单元以A/T碱基为主;不同染色体上SSR位点数量差异较大,其中,Chr1染色体上SSR位点数量最多,Chr16染色体上最少,SSR重复单元的数量及种类与染色体长度呈极显著正相关,进一步统计分析获得的644 种稀有SSR单元中六核苷酸重复基元占多数;(2)基于不同染色体上SSR重复单元的类型和数量构建分布矩阵,聚类分析发现以遗传距离0.075为阈值可将所有染色体分为4组,其中第4组中成员最多(11条),而第1组中仅有Chr10染色体,总体来看,Chr10染色体自成一个主枝,显示其可能经历了较为保守的进化过程;(3)利用SSR 位点侧翼的保守序列设计出SSR引物303 009对,通过电子PCR筛选并随机合成了32对单态性引物进行验证,其中30对(93.75%)在6 个核桃品种中扩增出了清晰的目标产物,28对(87.50%)的PCR扩增结果与电子PCR评估结果一致。 结论 本研究鉴定了‘中牧查一’核桃参考基因组不同染色体序列中的SSR位点,发现其数量和重复类型变化较大,且与染色体长度呈极显著正相关,单碱基重复的SSR是最常见的类型。建立了电子PCR与传统方法联用的引物开发流程,同时验证了其有效性,为核桃SSR引物的个性化快速开发提供了有效策略。筛选获得的28对单态性引物可为分子辅助育种中杂交子代“私生检测”等研究提供科学借鉴与参考。

English Abstract

  • 核桃(Juglans regia L.)是在全世界范围内广泛栽培利用的重要经济树种,中国是核桃的原产地之一。核桃种质资源极为丰富,在我国华北、西北、中南、华东、四川以及西藏东南等地区均有分布,种植历史达3 000余年[1],截至2019年底,我国核桃种植面积达1.21亿亩,总产量468.92万t,居世界首位[2]。核桃雌雄同株异形异花,育种周期长,多数品种亲和力很强。20世纪60年代以来,我国的引种和杂交育种工作不断推进,涌现了大量的自主知识产权品种,现有的国家审、认定良种17个,生产中使用较多的省审定良种和有效期内的认定良种约计239个,遍布全国各地[3],丰富的品种资源有力地支撑了我国核桃产业发展。

    微卫星(Microsatellites)或简单重复序列(Simple Repeat Sequence, SSR)标记以其数量丰富、多态性高、重复性好、对基因组覆盖度广、易于扩增以及共显性等显著特点,成为目前遗传学研究和植物品种鉴定中使用最为便捷、应用最为广泛的标记系统之一[4-6],国际植物新品种保护联盟(UPOV)生化和分子生物技术工作组(BMT)也将其作为用于品种鉴定和分子身份证构建的最佳分子标记[7]。SSR通常是以1~6个核苷酸为重复单位的串联重复序列,在基因组中广泛分布。在微生物[8]、植物[9-10]、动物[11]和人类[12-13]等不同物种中都开展过全基因组范围内的SSR引物开发工作。Woeste等[14]首次基于美国东部黑核桃基因组DNA开发了SSR标记,这些引物在后续核桃属植物的遗传研究中也得到了应用[15]。Zhang等[16]、Dang等[17]基于核桃EST序列各开发了41和39对EST-SSR引物。陈凌娜等[18]、Ikhsan等[19]和Eser[20]等基于细菌人工染色体(Bacterial artificial chromosome,BAC)序列分别开发了19、307和20对BES-SSR引物。据不完全统计,目前大约已开发出770对SSR引物,多数是从J. regia这个种开发的,为核桃的分子标记研究奠定了一定的基础[20]。但是,由于核桃基因组的复杂性和越来越深入的研究工作对分子标记产生新的需求,这些引物已经不能满足相关工作的需要,而可用于子代纯度检测等分子辅助育种研究的核桃单态性SSR位点则未见报道[21]

    随着核桃基因组测序的开展和完善,本课题组已组装完成并发表了一套染色体水平的高质量参考基因组[22],本研究基于该参考基因组序列分析其不同染色体上SSR位点的分布、重复单元数量及长度、稀有SSR碱基分布情况等特征,利用电子PCR技术分析SSR引物的多态性,并随机选取部分单态性SSR引物进行PCR实验验证,旨在明确电子PCR方法在核桃SSR引物分析中的有效性,有助于核桃SSR引物的快速批量化开发,进而为核桃种质资源保护及开发利用、遗传研究提供支撑。

    • 选取6个核桃主栽品种用于PCR实验验证,其名称和来源地等信息见表1,于生长季采其健康、无病虫害、中等成熟度的叶片,低温带回实验室,立即提取其基因组DNA。

      表 1  供试核桃品种

      Table 1.  Walnut cultivars used in this study

      编号
      No.
      名称  
      Name  
      来源地或采样地点
      Origin/Source
      1 ‘强特勒’ ‘Chandler’ 河北省易县
      2 ‘辽宁1号’ ‘Liaoning 1’ 辽宁省大连市
      3 ‘清香’ ‘Qingxiang’ 河北省易县
      4 ‘香玲’ ‘Xiangling’ 山东省泰安市
      5 ‘扎343’ ‘Zha 343’ 新疆阿克苏市
      6 ‘新新2号’ ‘Xinxin 2’ 新疆阿克苏市
    • FASTA格式的核桃品种‘中牧查一’的染色体水平参考基因组序列下载自国家基因组科学数据中心(CNCB-NGDC,网址https://ngdc.cncb.ac.cn/bioproject/browse/PRJCA002070),编号PRJCA002070,共包含16条染色体,全长为540 Mb,Contig N50为3.34 Mb[22];核桃品种‘Chandler’[23]的染色体水平全基因组序列下载自GigaDB(http://gigadb.org/dataset/100735)。使用famap和fahash软件将两套基因组数据转换为hash数据库,以备引物多态性电子PCR模拟评估使用。

    • 利用MIcroSAtellite(MISA, http://pgrc.ipkgatersleben.de/misa/)程序对核桃全基因组不同染色体中的SSR位点进行搜索和统计,设定单核苷酸(Mono-)、二核苷酸(Di-)、三核苷酸(Tri-)、四核苷酸(Tetra-)、五核苷酸(Penta-)和六核苷酸(Hexa-)的最少重复分别为10、6、5、5、5和5次,统计SSR位点的数量、长度和重复单元类型等信息,分析不同染色体上各种类型SSR位点的频率分布。

      利用Primer 3.0设计SSR引物,采用的参数及筛选标准主要有:引物长度为18~28 bp,20 bp为佳;产物长度100~500 bp;引物退火温度为55~65 ℃,以60 ℃为佳;引物序列GC含量为40%~60%,以50%为佳;避免引物二聚体、发夹结构及错配[6, 24-25]

    • 利用电子PCR程序中的re-PCR模块将筛选出的SSR标记在1.2中构建的基因组数据库中进行模拟扩增,主要参数为:re-PCR -S <hashfile> -n 0 -g 0 100-1000,根据模拟扩增结果将引物分为单态和多态两类,其中单态引物在基因组数据库中只能扩增出一个位点,而多态引物可以扩增得到多个位点,即如果扩增产物大小相差≥2 bp,则SSR被归类为多态性引物,扩增产物大小相同则被视为单态,而仅有1 bp差异的SSR位点则认为是不明确的,并从分析中删除[26]

    • 从每条染色体上随机选择单态性SSR引物各2对,合成TP-M13引物(上海生工),M13尾巴序列为TGTAAAACGACGGCCAGT。采用改良的CTAB法[15]提取核桃叶片的基因组DNA,参照Chen等[27]的方法进行扩增和毛细管电泳检测,利用GeneMarker v2.2.0读取电泳条带,然后使用Excel 2016软件进行数据统计和分析。

    • 利用MISA v2.1软件对全长540 Mb的核桃全基因组序列中的SSR位点进行鉴定,共得到357 629个SSR位点,平均每1.51 kb出现一个SSR位点,SSR序列总长度为8 019 209 bp,占到基因组全长的1.49%,包括4 005种重复单元。其中,单核苷酸重复单元占比最高,达58.93%;二核苷酸到四核苷酸重复单元占比分别为34.00%、5.19%、1.03%;五核苷酸和六核苷酸重复单元的占比则不足1.00%,但碱基组合可选择性和随机性更强,种类更加丰富,且重复单元占自身核苷酸重复类型的比例分布更加均匀。例如ACTCCG/AGTCGG占六核苷酸重复的比例为8.96%,AAAAAT/ATTTTT占比为8.46%(图1 a)。单核苷酸重复类型中(A)n最为丰富,接近所有核苷酸重复比例的一半,二核苷酸重复类型中(AT)n最多(32.10%),三核苷酸类型中(AAT)n最多(16.50%),而四核苷酸类型中(AAAT)n(9.00%)占比最高(图1 b)。无论是单碱基还是多碱基重复,占比居前四位的重复基序中,仅有A、T碱基出现,说明核桃全基因组微卫星具有A/T丰富的特性。AGG、AAC、AGC、ACT、ACG和CCG占比不足1.00%,可能属于稀有SSR单元的主要基序组成成员。核桃SSR序列长度在10~297 bp间变化,平均为73.30 bp,以10~30 bp长度的短重复序列为主(95.93%),而长度大于30 bp的仅占4.07%,不同长度的SSR序列所占比例存在较大差异,其中,10 bp长度的SSR所占比例最大(18.09%),随着SSR序列长度的增加,其占比呈下降趋势(图1 c)。

      图  1  核桃全基因组SSR位点重复类型的分布特征

      Figure 1.  Genome-wide distribution of SSR repeat types in walnut

    • 核桃参考基因组包含16条染色体,即Chr1~Chr16。不同染色体上SSR位点数量差异较大(图2 a),其Chr1上数量最多(34 749,9.72%),Chr16上数量最少(13 666,3.82%)。采用一元线性回归分析拟合发现,SSR位点数量与染色体长度间的线性关系明显,得到回归方程y=1 437x + 1 679 338,决定系数为0.96,拟合效果较好,即染色体长度越大,相应的SSR位点数量越多(图2 b)。各染色体上SSR位点的分布密度相对稳定,数量变化幅度在1 427~1 685个范围内,其中Chr9最低,Chr15最高。同时,进一步对SSR的数量、种类与染色体长度间的相关分析表明,染色体长度与SSR数量(r=0.982 0,p<0.01)、种类(r=0.900 3,p<0.01)间均达到极显著正相关水平,表明随着染色体长度的增加,其SSR的种类与数量均呈增加趋势。

      图  2  核桃基因组不同染色体SSR位点分布

      Figure 2.  Distribution of SSR loci in different chromosomes of walnut genome

      对16条染色体上不同重复类型的SSR位点数量进行相关性分析发现,不同重复类型SSR位点间均呈极显著相关关系(p<0.01),其中,单核苷酸与二核苷酸位点数的相关系数(r)最大,达到0.986 3,四核苷酸和六核苷酸的相关系数最小,仅为0.785 4(表2)。单核苷酸到四核苷酸间联系极紧密(r>0.90);而5~6核苷酸重复类型的数量和其它重复类型间相关系数较低,最大为0.879 6,最小仅为0.785 4。

      表 2  核桃不同重复类型SSR相关性分析

      Table 2.  Correlation coefficient of different SSR repeat types in Walnut

      重复单元
      Repeat units
      单核苷酸
      Mono-nucleotide
      二核苷酸
      Di-nucleotide
      三核苷酸
      Tri-nucleotide
      四核苷酸
      Tetra-nucleotide
      五核苷酸
      Penta-nucleotide
      六核苷酸
      Hexa-nucleotide
      单核苷酸 Mono-nucleotide 1.000 0
      二核苷酸 Di-nucleotide 0.986 3** 1.000 0
      三核苷酸 Tri-nucleotide 0.985 6** 0.969 0** 1.000 0
      四核苷酸 Tetra-nucleotide 0.928 6** 0.938 7** 0.911 8** 1.000 0
      五核苷酸 Penta-nucleotide 0.879 6** 0.850 5** 0.870 2** 0.862 1** 1.000 0
      六核苷酸 Hexa-nucleotide 0.845 6** 0.796 3** 0.822 9** 0.785 4** 0.798 5** 1.000 0
      注:**表示p<0.01。
        Note: **stand for p<0.01.

      根据SSR位点不同重复类型和重复次数等,构建不同染色体SSR位点280 × 16阶分布矩阵,并进行相关性分析建立相关系数矩阵,通过相关系数矩阵,对染色体进行聚类分析(图2 d)。以遗传距离0.075为阈值可将核桃16条染色体分为4组(Ⅰ~Ⅳ),其中,第Ⅰ组只有1条染色体,即Chr10;第Ⅱ组包括两个成员,它们是Chr1和Chr3;第Ⅲ组包括Chr14和Chr16这2条染色体;第Ⅳ组则囊括了其余11条染色体,这个组又可分为2个亚组,第1个亚组中有Chr4、Chr7、Chr5和Chr11这4条染色体,第2个亚组包括Chr6、Chr13、Chr2、Chr9、Chr15、Chr8和Chr12这7条染色体,这2个亚组中的成员也是SSR分布模式最相似的染色体。总体上,第Ⅱ组与Ⅲ、Ⅳ和Ⅴ组回溯到同一个主枝,而第Ⅰ组则归类于单独的一个主枝,表明Chr10上SSR位点的数量、分布和频率等与其他15条染色体相比差异较大。

    • 不同染色体间重复单元数及重复碱基的种类存在一定的差异(图2 c),Chr1染色体上最多(406 种),其次为Chr3、Chr5和Chr11,而Chr16染色体上最少(188 种)。其中,单核苷酸重复SSR序列均以A/T重复单元为主,其含量在不同染色体上相对稳定,其中,Chr4上最低(93.76%),Chr12上最高(95.05%);二核苷酸重复SSR序列均以AT/TA重复单元为主,所占比例在53.61%(Chr12)~59.43%(Chr9)间变化;三核苷酸重复SSR序列的重复单元不同染色体均为10 种重复单元类型,主导单元均为AAT/ATT,其所占百分比在48.34%(Chr16)~55.35%(Chr12)间变化;四核苷酸SSR序列的主要重复单元是AAAT/ATTT,其所占百分比在30.52%(Chr13)~52.29%(Chr14)间变化;五核苷酸重复SSR序列在不同染色体上的重复单元类型数量为18(Chr12、13、16)~36(Chr3)种,其中,Chr3(22.73%)和Chr14(29.29%)上的SSR主导单元为AAAAG/CTTTT,Chr6(23.91%)、Chr13(29.32%)和Chr15(25.47%)染色体上为AAAAG/CTTTT和AGATG/ATCTC且占比相同,其余11 条染色体的SSR主导单元均为AGATG/ATCTC,所占百分比为27.52%(Chr4)~34.17%(Chr8);六核苷酸重复单元的类型为13(Chr14)~43(Chr1)种,且大部分染色体都以AAAAAT/ATTTTT或AAAAAG/CTTTTT单元为主,所占比例在8.32%(Chr2)~22.73%(Chr11)间变化。

      核桃基因组中存在644种稀有SSR单元(即该重复单元仅在单一染色体中存在),不同染色体上存在的SSR稀有单元数存在较大差异,其中,Chr4中最少,为22 种,Chr5中最多,达64 种(表3)。稀有SSR单元为4~6核苷酸重复,其中以六核苷酸最多(426 种),四核苷酸最少(38 种),说明SSR单元组成的核苷酸越多,其所占比例越低,成为稀有SSR单元的概率越大。

      表 3  核桃参考基因组不同染色体的稀有SSR重复单元

      Table 3.  Rare SSR units of different chromosomes in Walnut reference genome

      染色体
      Chromosome
      四核苷酸重复
      Tetra-nucleotide repeats
      五核苷酸重复
      Penta-nucleotide repeats
      六核苷酸重复
      Hexa-nucleotide repeats
      Chr1 ATCA, CTGA, GTTC AACCC, AATAC, ACTAA, CATAA, CGAGA, CGGGC, CTCGT, GAAAT, GAGAG, GATAT, GATTA, GGAAA, GGCTC, GGTTT, GTTTT AAATTA, ACAGCA, ACCCCT, ACTCCA, AGTGGT, ATTTGG, CCAGGT, CCCTCT, CCGCCC, CCTACC, CGAAGA, CGGCTC, CTCAAA, CTCTGC, CTCTGG, CTGCGT, CTTCCC, CTTCCT, GAAAAA, GAAGCC, GACGCA, GATCGT, GCCAAA, GGAGGT, GGCTTG, GTCGGA, GTGAGA, GTTGGT, TCATCT, TCTCCC, TGGGCA, TTCACT, TTGTTT
      Chr2 CGTT, TGAT ACATG, AGATC, ATTTG, CCACT, CCTTC, CTAGC, GGGTG, GTCGG, TGGTC AATATT, AGGAAG, ATGGAT, CAGCCA, CCATCA, CCCTCA, CCGACT, CGCAGT, CGGGAGT, CGGGTG, GAGAGT, GAGGAA, GAGTTC, GCCTCC, GGTGGA, TCAAAC, TGGGTA, TTGATG
      Chr3 AGCG, CGGA, GTCA, TTCG AACCA, ACAGA, ACATC, ATCCC, CCGAT, CGCCA, CTCTG, GAATT, GATTC, GTGCA, TCTCC, TGAAT, TGATG, TGCTG, TGCTT, TGTGC AAATAT, AATTAA, AATTCA, ACACCC, ACCCTT, AGCAGG, ATATAA, ATCTCT, ATTCCA, CAATCA, CAGCTC, CATCAC, GCACAC, GCAGAG, GGAGAG, GTGAAC, TATCTT, TGCCCC, TGTTGC, TTGAAG, TTTCAT
      Chr4 GCCA, GTCC, TCAA AAGCC, ACCTC, ATACT, CATCA, CCAGC, GCTCG, TGAAG, TTGAT ATAGAT, CATGCA, CATTGC, CCGCCA, CCTCTA, GACAAA, GCCTCA, GGGGCT, TCAAGG, TCTTGG, TTCCTA
      Chr5 AACT, GATT, GCGG, GGGT ATAAG, ATGTG, CAAGC, CATAT, CTGGA, GAAAC, GATTT, GGTGG, TCCCT, TGAGG, TGTTA, TTAAT AAAGGA, AAATAC, AACCCT, AAGGTC, AATTCC, ACACAT, ACATAC, ACTGAT, AGAAGG, AGCCTG, AGGAGA, AGTCGG, ATAAAA, ATGCAT, CCAAAA, CCCCTT, CCTCCC, CGACTC, CTCAAG, CTCATT, CTCCAT, CTCCGA, CTGATA, CTGTCT, GAAATG, GACTCC, GCCACT, GGCGGG, GGGCAG, GGGTGG, GTAGGT, GTTGCT, TACCCC, TATTAG, TATTTC, TCCACC, TCGAAC, TCGGAG, TCTCTG, TGAGAG, TGCTCG, TGGCGA, TGGGCC, TGGTAG, TGGTTC, TTCTTT, TTTGGT, TTTTAT
      Chr6 CCTG, GCTC, GTAG AGTCT, CACCA, CCCCA, CCCGA, CTACC, GCACT, GCCGG, GCTGA, GGGGT, GGTTG, GTGAA, TATTA AATCAG, ACAAAA, AGACAG, AGTAGG, AGTCGG, ATAGGC, ATTTTT, CCAACA, CCTCCG, CCTTTG, CGGAGG, CTCCAT, CTCCGA, CTCCGC, CTCCTA, GACCTC, GCCTCT, GCTTCT, GGATCA, GGGTGT, GGTTAG, GTAGGT, GTTTTT, TATCAT, TCCGAC, TCGGAG, TCTCCA
      Chr7 GGCT, TCGC, TGGG AACAT, AGTAG, CCTAC, CTCAC, GATAA, GCCCG, TGAGC, TTGAA, TTGTT ACCCAC, ACTAAT, ACTCCT, AGAAAC, AGAGAT, ATACAC, ATACTA, ATATAC, ATGTAT, ATTTGA, CAGAAT, CCACAC, CCACCT, CCACGC, CCCAAC, CCCTGT, CCTGAG, CGGTCG, CTCTCC, GACTCC, GAGTGA, GCGTGC, GGAGTG, GGGAGA, GGGTGT, TCTATC, TGGAGG, TGGTTG, TTATTT, TTGGGT
      Chr8 CACT AAGGA, ACAAC, AGATA, ATTTC, CAAAT, GTATA, GTGTG, GTTAG, TAATT, TCTGA, TTTGA AGGCTC, AGGGTT, ATGGCA, ATTGTC, CCCCCA, CCCCTT, CCTCCG, CGGAGT, CTCCGA, CTCTCC, CTCTTG, GAGCTA, GCAAAC, GGCTGT, GGGCTA, GGGTTA, GTGTAT, TAATTA, TCTTCC, TCTTTT, TGAGCA, TGTCCC, TGTCGG, TTCGCC
      Chr9 CCTA, TCCG, TGAC ACCCG, ATGGG, CCAGT, CTAAT, GAGGT, GCAAT, GCCAT, GCCCC, GGCAT, GGGCT,GGGGA, GGTAA, TCCAG, TCGGC, TCTTA ACGAAC, AGAGAC, AGCAGA, AGTCGG, CAACAC, CCCTCC, CTCCAA, CTCCCT, CTCCGA, CTCTAT, CTCTCA, CTTGGT, GAATAT, GACTCC, GAGGGA, GCAAAA, GGCCCA, GGTAGG, GTCGAG, TATATG, TATTAC, TCAGTT, TCGGAG, TCTGTC, TCTTTT, TGGTCC
      Chr10 ACTG, CCCG, CTTG, TGGT AGTCG, CATAG, CGTCC, CTTCC, GATCG, GCCCA, TCATG, TTAGC, TTGTG AAGCCA, AAGTGG, AATTTG, ACACAT, ACCCGC, ACCCTC, AGGGAT, ATACTC, CATATA, CATCGT, CCCCTC, CCCTCC, CCTCCA, CCTCTT, CGACTC, CGGAGG, CTGCTC, GACTCC, GAGGGA, GAGGTG, GCCCCT, GGTTAG, GTGGGC, TAAAAA, TATATG, TATTTG, TCCGGT, TCGGAG, TGATCA, TGGAGG, TGGCAG, TTATTT, TTCTCC, TTGGGG
      Chr11 AGTC, CCGC, GGCC AAGCA, ACCAA, CATCC, CCCGG, CCGCA, CGGGG, CAAGA, GATGT, GGAGG, GTATT, TGCTC AAAGAA, AAATAC, AATACT, AGAGAT, AGAGGG, AGATAG, AGCTTA, ATTAAT, CACATG, CCACCT, CCCCCT, CTCCAT, CTCCCT, CTCCGA, CTGGTG, GACCCA, GATTCG, GATTTT, GGAAGG, GGGTTA, GTAGGG, TATTAG, TCCGAC, TGAGCA, TGGAGG, TGTTTT, TTCCCC, T TCTTT, TTTAAC
      Chr12 GCCC AAACG, AAGTG, AATGC, ATTAC, CAATA, TTCCT AAGAAC, ACCTCC, AGTCGG, ATAAAA, ATCAAC, ATTTTT, CAGGCT, CCAAGC, CCTCCA, CCTCTC, CCTGCA, CCTGTC, CTATTG, CTGGCT, CTTTTA, GAAGGA, GAGATG, GAGCTC, GATGAA, GATGGA, TATTAC, TATTAG, TCCGAC, TCTCAC, TCTGTC, TTACTT, TTCTTT, TTTATT, TTTCTC, TTTGAT
      Chr13 CGTG, GGCA AGAGA, AGCCG, CAGTA, GGCCC, TATTG, TCACC AAATTG, AACCAA, AAGAGA, ACGGCG, AGACAG, AGGGGG, AGTAGG, ATAAAA, ATCTAA, CAACAC, CAGCCC, CCTACA, CGACTC, CGCACA, CGGAGG, CTCCGA, CTTGGG, GAATTT, GCTGTG, GGCACA, GTGCGT, TCAAAA, TGAGCC, TGCATG, TTCATG, TTGATT, TTTAAA
      Chr14 ACTT AGAAG, ATCCG, CACAT, CAGTG, TAGTA AGTTCA, CACACG, CCCTAA, CTACTG, CTCTAT, CTTTTG, GAAGAG, GCACCG, GGGTTA, TAAAAA, TCTTTT, TTATAT
      Chr15 - AACCT, ACACG, ACTAC, ATTGC, CAATC, GAGGA, GAGTT, TGTAA AAGCCC, AATGCC, ACCTCC, ACTACC, ACTCCG, AGGAGT, AGTAGG, AGTCGG, ATACAT, CCTCCG, CGAGCT, CTCCAC, CTCCCT, CTCCGA, CTCTCG, GAGGGG, GCCCAA, GCGAGA, GTAGGA, GTGCTC, GTGTGC, TATTAC, TCCACC, TCCCTC, TCCGAC, TCGGAG, TCTTTT, TGATCG, TGGCTG, TTAGGG, TTTATT, TTTCTT, TTTGTG
      Chr16 CTAC ACTCG, ATAAC, GCATT, GGGTC, TAGTG, TTCAC AAAATT, ACATAT, ATACGA, ATTAGT, ATTTGA, ATTTTT, CACGCA, CCCCGC, CCTTTT, CGGAGG, CTCCGA, CTTTTT, GACTCC, GATTTA, GCTCCG, TATATG, TCATCC, TCATCG, TCCCTG, TCTCTT, TCTTTT, TGGGTG, TTAGTA
    • 利用Primer 3.0软件根据SSR位点侧翼的保守序列,从357 629个SSR位点中共设计出303 009对(91.51%)SSR引物,包括6种完全微卫星(258 024, 85.15%)、不完全微卫星(1 688, 0.56%)和复合型微卫星(43 297, 14.29%)等3种类型。然后,利用re-PCR将2~6核苷酸重复的完全型SSR引物比对到基因组hash数据库,通过电子模拟扩增评价其多态性,根据在不同基因组中的电子模拟扩增条带将其分为单态和多态两类,条带大小差异仅1 bp的引物将被弃用。电子模拟扩增分析发现,不同染色体上的单态性标记最少为2 295个(Chr16),最多为10 881个(Chr3),长重复单元(>30 nt)的引物中多态性引物的比例要高于短重复单元的引物,这与Biswas等[26]在甜橙基因组中的研究结果类似。

      为了验证电子模拟扩增结果的可靠性和新开发的SSR标记的有效性,从经re-PCR评估的单态引物中随机均匀地选择三碱基重复引物32对(表4),合成TP-M13引物在‘强特勒(Chandler)’等6 个品种中扩增,并利用毛细管电泳技术进行检测(图3)。所选32对引物中除CAF36和CAF350以外,其余30对SSR引物(93.75%)均可以在供试样品中扩增出清晰的目标产物,PCR扩增结果与电子模拟评估结果一致性较好。此外,30对SSR引物中有4对(CAF11、CAF129、CAF271和CAF364)在供试样品之间表现出多态性。

      图  3  CAF11引物在6个核桃主栽品种中的毛细管电泳图谱

      Figure 3.  The capillary electrophoresis patterns from primer CAF11 in 6 main cultivars of walnut.

      表 4  32对核桃单态SSR引物信息

      Table 4.  Information of 32 primers from walnut genome

      引物编号
      Primer ID
      染色体编号
      Chromosome
      重复基序
      Repeat motifs
      上游序列(5’-3’)
      Forward (5’-3’)
      下游序列(5’-3’)
      Reverse (5’-3’)
      退火温度
      Tm/℃
      CAF271 Chr1 (TTC)5 ATCGGATCGGTTCGTCATGG TTTGTGGCTTGGTTTTGGCC 60
      CAF100 Chr1 (GAG)5 GGCCAAGACATAACCCAGCT AGATGGGTAATCAGGGGGCT 60
      CAF364 Chr2 (TCT)6 GACTCCACCCCCTTGTCATG GTGAACAAGACCCGACCCAT 60
      CAF169 Chr2 (ATG)5 GGGTGACGACGGTGACTATC GATGCAGAAAGGCTCCCAGT 60
      CAF36 Chr3 (TTC)5 TGGGTTTGCACTACCTGAGT TGAAACTGATTGCACCCCCA 60
      CAF322 Chr3 (TGC)5 ATACCGCTGCTGTAGATGCC TGGCCCTCATCACCCTCATA 60
      CAF293 Chr4 (AAG)6 GTGTTGAGAGGAAGGGCGAA ACCCATGTGTGAGCATGCTT 60
      CAF359 Chr4 (AGA)5 CTCGTCGTAGAAGTCGGAGC TTGAGTCCGAGCACTTGCAT 60
      CAF1 Chr5 (TCT)6 GCCAATCGGGGTAGAGGATG GCGGAGGAGTTGATAGAGGC 60
      CAF119 Chr5 (AGG)5 GAGAGCGAGAGACGTGATGG CCTTGTGGAATCGTCAGCCT 60
      CAF150 Chr6 (TAA)5 GCATGCAGCAGTCTTGGAAC CTCCTTCTTCACCTGCCCAG 60
      CAF186 Chr6 (TTA)6 ACGGAAACAACGGCCTATGT TTTCTTTTTCGCGGCTTCGG 60
      CAF11 Chr7 (CCA)5 TTCCATCTCCTCTCCCCCAG TTATCTTCGCGATCGGCACA 60
      CAF103 Chr7 (CTT)5 GCGACGGAGATATGCAGGAA CGAGGGCCAAAGTTGACTCT 60
      CAF350 Chr8 (GCT)5 TAAGCTGGAACCCAATGGCC AATCTCAACAGCAGCAGCAG 60
      CAF288 Chr8 (TTC)5 AATGTCGTTCCTGAGCACGT TATCTAACGACCGCCGCTTC 60
      CAF6 Chr9 (GAG)6 GAGGAGGAGGAGGAAGGGAG TCTGCGCTCTCTCGTTTTGT 60
      CAF147 Chr9 (GAA)6 TGCTGGCTCCCTTCCTAGAT CCCCTCACACCTCCATTTCC 60
      CAF16 Chr10 (AGA)6 TATCGCTGGCTTTCCGATCC GCGACATTGCAATCCAGGTC 60
      CAF265 Chr10 (AAG)5 TGACGTCCCTTGAGTTGTCG AGTGCGTACATGACCAAGCA 60
      CAF107 Chr11 (GAG)5 AGAAGCCGTGGAACTTGAGG TTGGACAACGCGATCCAGAA 60
      CAF108 Chr11 (TTA)6 CACACCCTTTCCCGCTTTTG TGTCACCGATCTGTCCGTTG 60
      CAF15 Chr12 (AGA)5 GAGAGCGGCGAGTACTACAC CCCTGCCTCCCTACTCTTCT 60
      CAF208 Chr12 (TGA)5 GTCAGCCACGAACACAACAC GATCCTGGAAGTCGACAGCC 60
      CAF151 Chr13 (AAG)5 AAACAGGGCGAGATTGGAGG CCTTATCGCCATCGTCGTCA 60
      CAF153 Chr13 (TCT)5 AATAGCAGAGCCCGTGATCG CTGCCACAGTTGTAGAGCCA 60
      CAF236 Chr14 (AGT)5 GCTGCAAAGCACACAATCCA GCTTTCTCCGCTGTTCCTCT 60
      CAF246 Chr14 (TAA)5 GCAACAGCAGGATTTTGCCA AGGGGATGGGTCTGTAGCAT 60
      CAF131 Chr15 (TTC)5 TGCTGTCAAAGGGGAATCAA AGCTCTTCCAAGCACCATGT 60
      CAF8 Chr15 (GCT)5 TCGCCAACGACACCATAACA TTTCCAGCTGCTTTTGTCGC 60
      CAF129 Chr16 (CTA)6 TCTCAGGCCCAACAACCATC TAGAGAGAGATCCTCCGGCG 60
      CAF536 Chr16 (CAG)5 TTCTCCACAAGTACCGCACC CCTCTCTCACTACCCCAGCT 60
    • SSR在基因组中的出现主要源于进化过程中的突变,如滑链错配、一个或多个重复基序的插入缺失等,因此,特定数量和长度的SSR可以作为进化过程中遗传变异的指标[24]。本研究从‘中牧查一’核桃参考基因组16条染色体中共鉴定出了357 629 个SSR位点,其密度为662.28 SSRs·Mb−1,低于石榴(1 294.62 SSRs·Mb−1[6]和枣(872.60 SSRs·Mb−1[28]等树种,高于亚麻(225.3 SSRs·Mb−1[29]、茶树(216.88 SSRs·Mb−1[30]和花生(392.45 SSRs·Mb−1[31]等植物,而与杨树(667.9 SSRs·Mb−1[32]在基因组上的研究结果相当。这些数据可能反映了不同物种本身基因组大小的差异以及基因组序列中碱基排列组合方式的随机性和变异性,以往研究表明基因组大小会影响SSR的密度,但并不是所有物种中二者之间都具有显著相关性[33-34],而本研究中核桃基因组SSR的数量、种类与染色体序列长度则均呈极显著正相关。同时,SSR的分布和密度变化很大,也可能是由于搜索标准和数据库挖掘工具的不同导致的。

      单碱基重复的SSR是核桃基因组每条染色体上最常见的类型,2~3碱基重复次之,4~6碱基重复则较少,这在小麦[24]和甜橙[26]等物种的基因组中也有报道,但与烟草[35]中以二碱基重复类型为主的情况不同。核桃的SSR基本组成在所有重复类型中以A和T为主,而CG/CG在二核苷酸重复序列中密度最低,这与烟草[35]和四倍体野花生[36]等物种相似,核桃SSR中最多的二核苷酸重复是AT/AT,其次是AC/GT和AC/GT,王玉龙等[36]报道,四倍体野花生基因组中数量最多的重复单元依次是A/T、AT/AT、AAT/ATT,AAAT/ATTT、AAAAT/ATTTT和AAAAAT/ATTTTT。Lu等[31]对栽培花生的研究结果与此类似。尽管分布模式有所差异,但对许多植物基因组而言,AAN、AAAN、AAAAN和AAAAN比其他重复基序更为常见。

      研究指出,单碱基或二碱基重复单元大量发生则表明该物种的进化水平较高[37],而核桃单核苷酸与二核苷酸数量的总和占所有微卫星位点的92.80%,这可能说明核桃起源相对较晚同时容易发生SSR变异,从而产生更多的碱基重复类型。其中,单碱基重复占58.85%,有研究表明单碱基重复的数量随物种基因组大小不同而产生差异,相比而言物种基因组增大,其单碱基相对丰富增加[38]。Song等[39]分析了112种植物3 951 919条基因序列中SSR的分布情况,发现三碱基重复SSR数量超过50%,与核桃SSR数量分布比例有所不同,这可能与密码子以3个碱基为组成单位有关。近期的一项研究将石榴基因组中的SSR分为三大类,即class I(> 30 nt), class II(20~30 nt)和class III(< 20 nt),其中第一类SSR可能更易发生突变呈现不稳定状态[6],更早的研究中Portis等[40]、陈凌娜等[18]和Temnykh等[41]也强调了SSR片段长度在标记开发和育种中的重要性。本研究发现核桃SSR序列主要是以10~30 bp的短重复序列为主,SSR序列的出现频率呈现一定的规律性变化,重复长度越长,出现频率则越低。

    • 以往研究表明单核苷酸重复的SSR并不适宜于开发SSR引物[26, 42],因此本文在引物设计和开发时仅使用了2~6核苷酸重复的类型,以往研究表明单态SSR标记可作为遗传分析和育种子代群体“私生检测”的有力工具[21, 43],也有将单态性标记转换为多态性标记的报道[44-45]。在re-PCR检测到的单态性标记中,二核苷酸基序(77.28%)最为常见,其中Chr3染色体含有最多的单态性标记,其可能是核桃分子标记辅助育种的较好选择。随机选择32对单态性SSR引物在6个不同核桃主栽品种中进行PCR验证,其中,4对预测为单态的引物扩增出了多个基因座,这可能是由于电子PCR分析仅采用了2套基因组所致,也有可能是核桃的全基因组尚有未完全揭示的序列,而多达28对引物获得了与电子PCR分析相一致的PCR实验扩增结果。由此可见,基于全基因组序列采用电子PCR结合传统分子标记筛选策略的方法进行SSR标记开发效果较好。

    • 核桃是世界范围广泛栽培的重要经济树种,本研究从‘中牧查一’核桃参考基因组中鉴定了357 629个SSR位点,这些位点在不同染色体上的数量和重复类型具有明显差异,其中,单碱基重复占比较高,A/T碱基重复是其优势重复单元。在此基础上,建立了联合应用电子PCR和传统引物筛选方法进行引物开发的新策略,每条染色体上随机选取2对共计32对引物以6个核桃主栽品种为试材进行扩增,结果显示其中30对引物的扩增效果较好,28对(87.50%)引物的扩增结果与电子PCR分析结果相一致,从而验证了这一引物开发策略的有效性,为核桃SSR引物的个性化快速开发提供了有效策略,筛选获得的28对单态性引物可为分子辅助育种中杂交子代“私生检测”等研究提供科学借鉴与参考。

参考文献 (45)

目录

    /

    返回文章
    返回