-
MYB蛋白是植物体内最大的转录因子家族之一,几乎存在于所有植物中,参与调控植物体内众多基因的转录[1]。依据MYB基序重复种类和数目的不同,将植物MYB转录因子家族分为四类:4R-MYB、3R-MYB、1R-MYB/MYB-related、R2R3-MYB。4R-MYB由4个R1/R2重复组成,它是植物MYB转录因子中最小的一类,仅在拟南芥(Arabidopsis thaliana)、杨树(Populus trichocarpa)等模式植物中有所发现,且编码的蛋白质很少;3R-MYB,由R1、R2、R3组成,普遍存在于大多数的真核生物中;1R-MYB/MYB-related,含有单个重复的或不完整的MYB基序[1-3]。在植物MYB家族中,R2R3-MYB是最重要的亚家族,其成员数最多。在模式植物拟南芥中,R2R3-MYB类转录因子数目约占整个MYB转录因子家族的64.3%。基于DNA结合区域和转录调控区域的特异性和多样性,R2R3-MYB类转录因子的功能具有多样化[4],成为当前研究最广泛的MYB蛋白。
近年来,R2R3-MYB在植物发育、代谢以及抗逆等方面的作用引起了广泛关注,如细胞形态的建成和分化、植物生长发育的信号转导、次级代谢的调控、生物和非生物胁迫的应答以及细胞周期的调控等[1, 4-9],还参与植物合成和储存花青素的过程[5, 10]。AtMYB2基因可以被脱水素和盐胁迫诱导表达[11],AtMYB62基因参与磷胁迫应答[12],AtMYB96基因通过ABA信号途径参与干旱胁迫应答[13],AtMYB41、102基因参与机械损伤和渗透胁迫应答[14-15],水稻(Oryza sativa)OsMYB3R-2转基因植株可以提高对低温、干旱和高盐的耐受性[16-17],大豆(Glycine max)GmMYB72、96、117基因在ABA、盐、干旱和低温胁迫下被诱导表达[18],麻风树(Jatropha curcas)JcMYB2基因在低温、盐和茉莉酸胁迫条件下可以被明显地诱导表达,转基因烟草(Nitotiana tobacum)的低温和干旱耐受性明显提高[9],52个棉花(Gossypium raimondii)GrMYB基因在干旱和盐胁迫条件下在叶子和根中差异表达明显[7],大白菜(Brassica rapa ssp. pekinensis)BrMYB210、137、88、154、222基因在低温和渗透胁迫条件下明显上调表达[19],AtMYB12、111基因参与黄酮醇的生物合成[20],AtMYB3、4、7、32基因的表达使拟南芥中花青素的合成受到抑制[21]。AtMYB123、21、24基因表达可促进拟南芥中花青素的积累[22],且在蔷薇(Rosa)、百合(Lilium brownii)、西红柿(Lycopersicon esculentum)等植物中都发现了MYB基因参与次生代谢调控[23]。
关于兰科植物R2R3-MYB转录因子对兰花花色的调控研究已经开展[10, 24-25]。许传俊等发现,白色蝴蝶兰花(Phalaenopsis)品种‘空港枫叶’和黄色花品种‘富乐夕阳’的花中花色素苷含量较低,MYB基因表达量也较低[26]。Wu等从杂交石斛兰(Dendrobium)‘Woo Leng’花组织的cDNA文库中,筛选到6个DwMYBs全长cDNA克隆,其中,4个是典型的R2R3-MYB类转录因子(DwMYB1、2、8、10)。DwMYB4基因仅在花中特异性表达,DwMYB9基因在成熟花和花序中高表达,在发育的花芽中表达量较低[27]。
全基因组分析是鉴定基因家族成员、阐明其生物学作用的首要步骤和有效途径,借助于该分析手段,已在多种植物中开展基因组范围内MYB转录因子家族预测与潜在功能分析[4-5],但关于蝴蝶兰MYB转录因子家族的全基因组分析尚未见报道。蝴蝶兰属植物小兰屿蝴蝶兰(P. equestris)基因组测序的完成[11]为该物种MYB类转录因子家族(PeMYBs)的全基因组预测和生物信息学分析提供了宝贵资源。鉴于R2R3-MYB转录因子在植物中生命调控功能的多样性及其研究的广泛性,本研究在小兰屿蝴蝶兰全基因组范围内开展MYB转录因子家族预测的基础上重点对R2R3-MYB转录因子亚家族成员进行生物信息学及表达分析,以期为蝴蝶兰属R2R3-MYB类转录因子家族功能验证提供数据基础,将有助于蝴蝶兰的分子育种和种质创新。
HTML
-
分别以已报道的蝴蝶兰PeMYB1-16(GenBank登录号KF769466- KF769481)和拟南芥AtMYBs氨基酸序列为query序列,利用BLASTP软件从小兰屿蝴蝶兰的蛋白库中搜索相似度较高的PeMYBs序列(E-value<0.001)。利用Pfam数据库进行保守结构域检测,综合已报道的16条PeMYBs基因共获得125条含有MYB保守结构域的PeMYBs氨基酸序列,其中,27条含有R1-MYB保守结构域,96条含有R2R3-MYB保守结构域,2条含有R1R2R3-MYB保守结构域,未发现含有4R-MYB保守结构域的PeMYBs氨基酸序列。已知拟南芥含有196条AtMYBs氨基酸序列[2],水稻含有201条OsMYBs [12],毛果杨含有207条PtMYBs[4],大约是小兰屿蝴蝶兰PeMYBs数量的1.5倍;葡萄含有114条VvMYBs序列[5],和小兰屿蝴蝶兰PeMYBs数量相近;而在小立碗藓(Physcomitrella patens)中检测到95条PpMYBs序列,略少于小兰屿蝴蝶兰PeMYBs数量(表 1)。
Species物种 MYB protein classes MYB蛋白亚家族 1R-MYB R2R3-MYB 3R-MYB 4R-MYB Eudicot Arabidopsis thaliana[2] 64 126 5 1 Populus trichocarpa[3-4] n.d 202 5 - Vitis vinifera[5] n.d 108 5 1 Monocot Oryza sativa[4] 70 125 5 1 Phalaenopsis equestris 27 96 2 - Moss Physcomitrella patens# 31 61 2 1 注:n.d未检测到(not determined)。
#:the Moss Transcription Factor Database (http://planttfdb.cbi.pku.edu.cn).Table 1. MYB transcription factors in six plant species
-
本研究重点对小兰屿蝴蝶兰R2R3-MYB类转录因子进行生物信息学分析。利用ClustalW 2.1软件将预测获得的小兰屿蝴蝶兰R2R3-MYB类转录因子编码氨基酸序列保守结构域进行多重序列比对,结果显示:预测获得的小兰屿蝴蝶兰R2R3-MYB类转录因子均含有保守的色氨酸残基和2个MYB基序R2和R3,每个MYB基序分别形成三段螺旋结构的MYB转录因子特有的结构特征(图 1),与所报道的植物R2R3-MYB类转录因子保守结构域特点相一致。有研究认为,R2和R3是MYB识别DNA序列所必需的,其中,R3亚基C端上的螺旋(Helix)能与顺式作用元件中的核心序列特异结合[1-3]。植物MYB基序的Helix2和Helix3形成“螺旋-转角-螺旋”(helix-turn-helix,HTH)结构,与Helix1形成一个具有疏水核心的三维HTH结构域,其中,Helix3能精确地与特定DNA序列结合,从而体现出较高的特异性[1-3]。小兰屿蝴蝶兰R2R3-MYB类转录因子R3基序中保守的Helix3也可能精确地与特定DNA序列结合,从而体现出较高的调控特异性。
Figure 1. R2-and R3-MYB repeats are highly conserved across all R2R3-MYB proteins in the P. equestris
对小兰屿蝴蝶兰R2R3-MYB类转录因子基因编码的氨基酸序列长度进行了统计,结果详见表 2。编码氨基酸序列长度由129 aa (PeMYB85)-563 aa (PeMYB 42),平均长度为275 aa。在基因家族扩张的过程中,复制事件的发生及其平常而有效。综合分析小兰屿蝴蝶兰基因组注释结果和ClustalW 2.1软件对R2R3-MYB类转录因子编码的氨基酸序列进行比对结果发现:小兰屿蝴蝶兰R2R3-MYB类转录因子间存在基因片段复制现象,例如PeMYB81与PeMYB87序列分别位于不同的scaffolds序列,但序列之间存在重复片段,类似的片段复制现象还发生在PeMYB62与PeMYB94,PeMYB64与PeMYB97,PeMYB77、78与PeMYB79,PeMYB17与PeMYB95等序列间。
基因名称
Gene name基因ID
Gene ID长度
Length/aa内含子数量
IntronsPeMYB01 KF769466 269 - PeMYB02 PEQU_10971 303 2 PeMYB03 PEQU_30611 294 2 PeMYB04 PEQU_23598 211 1 PeMYB05 KF769470 169 - PeMYB06 PEQU_22029 262 1 PeMYB07* PEQU_03393 249 1 PeMYB08 PEQU_10762 219 2 PeMYB09 PEQU_20333 409 2 PeMYB10 PEQU_05119 353 2 PeMYB11 PEQU_09551 238 2 PeMYB12 PEQU_19346 245 3 PeMYB13 PEQU_14300 220 2 PeMYB14 KF769479 220 - PeMYB16 PEQU_09064 377 3 PeMYB17 PEQU_00368 324 2 PeMYB18 PEQU_00728 234 2 PeMYB19 PEQU_02109 198 1 PeMYB20 PEQU_02591 303 2 PeMYB21 PEQU_03213 267 2 PeMYB22 PEQU_04692 322 2 PeMYB23 PEQU_04858 288 2 PeMYB24 PEQU_05034 325 1 PeMYB25 PEQU_05643 295 2 PeMYB26 PEQU_05683 292 2 PeMYB27 PEQU_05903 288 2 PeMYB28 PEQU_05918 312 1 PeMYB29* PEQU_06231 344 1 PeMYB30 PEQU_06488 201 2 PeMYB 31 PEQU_06600 286 2 PeMYB32 PEQU_06922 241 3 PeMYB33 PEQU_07074 313 2 PeMYB34 PEQU_07150 303 2 PeMYB35 PEQU_07382 338 2 PeMYB36 PEQU_07503 326 1 PeMYB37 PEQU_07637 347 2 PeMYB38 PEQU_08801 287 2 PeMYB39 PEQU_09074 229 1 PeMYB40* PEQU_09152 172 1 PeMYB41 PEQU_09363 304 2 PeMYB42 PEQU_09491 563 2 PeMYB43* PEQU_09503 289 11 PeMYB44 PEQU_10362 247 2 PeMYB45* PEQU_10550 287 0 PeMYB46* PEQU_10664 251 2 PeMYB47 PEQU_10683 225 2 PeMYB48* PEQU_10866 237 1 PeMYB49 PEQU_11292 315 3 PeMYB50 PEQU_12592* 271 0 PeMYB51 PEQU_12801* 204 2 PeMYB52 PEQU_13544* 239 2 PeMYB53 PEQU_14547 294 1 PeMYB54 PEQU_14880 245 2 PeMYB55 PEQU_14919 221 2 PeMYB56 PEQU_15257 233 0 PeMYB57 PEQU_15899 180 2 PeMYB58 PEQU_16171 258 1 PeMYB59 PEQU_16389* 231 2 PeMYB60 PEQU_17021* 207 1 PeMYB61 PEQU_17178* 227 1 PeMYB62 PEQU_17258* 239 2 PeMYB63 PEQU_18431 233 2 PeMYB64 PEQU_18783 232 2 PeMYB65 PEQU_18879 358 2 PeMYB66 PEQU_19266 345 2 PeMYB67 PEQU_20514 320 2 PeMYB68 PEQU_21248* 309 2 PeMYB69 PEQU_21694 320 1 PeMYB70 PEQU_23041* 333 1 PeMYB71 PEQU_23940* 312 1 PeMYB72 PEQU_24421 244 2 PeMYB73 PEQU_25920 260 1 PeMYB74 PEQU_29058 310 2 PeMYB75 PEQU_29143 244 1 PeMYB76 PEQU_29475 250 2 PeMYB77 PEQU_30835 302 2 PeMYB78 PEQU_30836 307 2 PeMYB79 PEQU_30837 313 2 PeMYB80 PEQU_30955 322 2 PeMYB81 PEQU_31568 340 2 PeMYB82 PEQU_32696 380 1 PeMYB83 PEQU_32963 250 2 PeMYB84 PEQU_33555* 188 2 PeMYB85 PEQU_33827 129 2 PeMYB86 PEQU_33908* 310 2 PeMYB87 PEQU_34202 340 2 PeMYB88 PEQU_34697 255 2 PeMYB89 PEQU_36816 290 2 PeMYB90 PEQU_36904 276 1 PeMYB91 PEQU_37625 278 1 PeMYB92 PEQU_39789 270 2 PeMYB93 PEQU_40332 260 1 PeMYB94 PEQU_40608 209 1 PeMYB95 PEQU_40802 214 1 PeMYB96 PEQU_41555 239 2 PeMYB97 PEQU_42161 260 2 注:*氨基酸序列中包含保守的EAR-motif. * There is conserved EAR-motif in the amino acid sequence. Table 2. R2R3-MYB sequence characteristics of Phalaenopsis equestris
本文还对其内含子的数量进行了统计和简要的分析。由于PeMYB02-04、06-13、16基因序列及其详细的基因结构注释信息在小兰屿蝴蝶兰基因组数据库中均可检索到,在表 2中对其内含子数量进行了标注,但PeMYB01、05、14基因序列在小兰屿蝴蝶兰基因组数据库中暂未检索到,只在NCBI中检索到其基因序列,所以,在表 2中未对其内含子数量进行统计。表 2表明:3个R2R3-MYB转录因子不含内含子,26个含有1个内含子,59个含有2个内含子,4个含有3个内含子,而PeMYB43(PEQU_09503)基因含有11个内含子,数量最多,结构最复杂。
-
利用邻接法分析小兰屿蝴蝶兰R2R3-MYB转录因子之间的系统发育,并按类别将其分别与拟南芥R2R3-MYB转录因子进行聚类,依据拟南芥的分类标准[2]将小兰屿蝴蝶兰R2R3-MYB类转录因子划分为20个亚群,命名为S1-S20(图 2),分别对应拟南芥中相应类群,其中,S5、S11、S12、S13、S19亚群成员数较多,分别为9、13、10、10、12个。除S14外,其它19个亚群同时包含小兰屿蝴蝶兰与拟南芥R2R3-MYB类转录因子,表明这些亚群的基本特征在小兰屿蝴蝶兰与拟南芥分离之前就已经形成,每个亚群成员数目不同也许是由于基因复制或基因丢失的结果。未被划分亚群的拟南芥R2R3-MYB类转录因子有16个,这些AtMYBs在杨树中能检测到划分为同一亚群的同源基因[4],这可能是这些基因亚群在小兰屿蝴蝶兰中发生了基因丢失现象。大部分小兰屿蝴蝶兰R2R3-MYB类转录因子亚群分类与拟南芥的R2R3-MYB相应亚群分类情况吻合,有几个亚群把拟南芥中的2或多个亚群合在了1个小兰屿蝴蝶兰亚群里(如S13),这表明在拟南芥与小兰屿蝴蝶兰R2R3-MYB类转录因子之间有较高的保守性,也稍有差异。在其他植物R2R3-MYB类转录因子家族中也检测到类似现象[3-4]。
基因系统进化树上位于同一分支的序列往往具有较近的亲缘关系。小兰屿蝴蝶兰R2R3-MYB转录因子内部存在同源性较高的旁系同源序列(自展值>95%),如PeMYB01/PeMYB13/PeMYB14,PeMYB25/ PeMYB26,PeMYB81/PeMYB87,PeMYB56/PeMYB18,PeMYB62/PeMYB94和PeMYB01/PeMYB91等。小兰屿蝴蝶兰基因组中也存在一些R2R3-MYB类转录因子与拟南芥同源性较高的直系同源序列(自展值>95%),如PeMYB56/AtMYB16/AtMYB106,PeMYB38/AtMYB35,PeMYB29/AtMYB67,PeMYB68/AtMYB91和PeMYB42/AtMYB88/AtMYB124等。不同兰科植物之间同源性较高的序列有PeMYB16/PeMYB65/DwMYB1,PeMYB11/OgMYB1/PsMYB(P.schilleriana MYB),PeMYB08/DwMYB8,等。研究发现,同源性较高的基因具有很高的序列相似性,并可能具有类似的功能[4, 10],本文通过对PeMYBs亚家族内及与AtMYBs亚家族间序列同源性的分析可以为预测PeMYBs的潜在功能提供潜在数据基础。
-
为了解小兰屿蝴蝶兰R2R3-MYB家族基因在不同器官中的表达情况,笔者利用小兰屿蝴蝶兰4种器官(花、叶、根、茎)的转录组数据标准化值进行比较分析,检测到88个PeMYBs基因在4种器官中表达,图 3表明:各基因在不同器官中的表达情况各异。各器官中表达量相对较高的基因有:PeMYB30、48、69、66、50、86等基因在花中表达量相对较高,PeMYB16、33、34、42、48、50、69、86等基因在叶中表达量相对较高,PeMYB08、10、33、48、50、52、69、84、86等基因在茎中表达量相对较高,PeMYB33、35、48、50、70、71、78、79、86等基因在根中表达量相对较高,推测它们可能在小兰屿蝴蝶兰的生长发育过程中有着某些重要作用。39个PeMYBs基因在所有4种器官中均表达,其它48个基因在不同器官中有特异性不表达现象,其中,20个基因只在叶组织中未检测到表达,2个基因(PeMYB53、57)只在花组织中未检测到表达,7个PeMYBs基因(PeMYB16-19、24、90、93)只在根组织中未检测到表达,茎中未出现PeMYB基因特异性不表达现象;还有一些基因呈现组织器官特异性表达特点,如PeMYB09、30、38、54、72五个基因只在花中检测到表达,而且PeMYB09、30两个基因在花中特异性高表达,PeMYB07、17-19、21、22、25、26、31基因只在茎组织中检测到低量表达,PeMYB41只在根组织中检测到低量表达,在其它3种组织中均未检测到表达。研究发现,在某些组织中高表达或者特异性表达的基因可能参与相应组织特定发育时期的调控[4-6, 10]。在各亚群中均检测到相对高或低或未表达的PeMYBs基因,且未呈现亚群特异性表达现象。