山麦冬叶绿体基因组,其密码子偏好性是由什么决定的?

文|胡一舸

编辑|胡一舸

前言

叶绿体是植物完成光合作用主要器官,其基因组是一个与细胞核不同的、相对自成系统的分子系统。

利用叶绿体作为受体的转基因系统,在基因表达效率、安全性、无位置效应、可实现多个基因的共表达等方面,与常规的转基因系统相比,该系统更具优越性。

但是,在对异源基因的选择上存在差异,导致异源基因的转录率较低。密码子被称为“第二类基因密码”。

在不同的生物中对其的选择存在很大的差别,其选择受基因表达水平、基因长度、基因翻译起始信号、蛋白质氨基酸组成与结构、tRNA丰度、突变方式与频率、GC含量等多个因子的影响。

所以,通过对叶绿体基因组中密码子利用偏好的分析,可以更有效地提高异源基因的表达效率。

近年来,在甜荞苦荞黄芩刺五加等药材中,人们对其叶绿体基因组中的密码子选择问题进行了深入的探讨。

山麦冬百合科山麦冬属多年生草本植物,主要生长在秦岭以南各省区及华北等地。

山麦冬为中国名贵中药材,其干块根为药用植物,其主要作用为滋阴生津,润肺清心,可用于肺燥干咳,阴虚痨咳,津消渴,内热消渴,心烦失眠,肠燥便秘。

山麦冬在治疗心血管、免疫、神经系统等多种疾病方面也有较好的临床应用价值。而山麦冬因其生态适应性广,抗逆性强,绿化效果好而被广泛应用于园林绿化。

目前对其理化特征、化学成分及药理活性已有大量报道,但对其生物学特性、栽培育种、环境适应性及相关功能的认识尚不深入。

目前国内外还没有对其进行过系统的研究,该项目的完成将为进一步利用该基因进行叶绿体遗传改造打下坚实的理论基础,也将为进一步探讨叶绿体的分子演化及叶绿体蛋白质的功能等问题提供借鉴。

山麦冬叶绿体基因组密码子偏好性相关

通过CodonW软件,对各条基因的核苷酸组成进行了分析,具体的指标是:在密码子的第3位上,T,C,A,G的含量,将其表示为T3,C3,A3,G3;每个基因的蛋白质编码长度;密码子适应性指标;二是与密码子相关的概率。

笔者拟在前期工作基础上,首先通过对其全基因组序列的解析,测定不同密码子的RSCU,并选择RSCU大于1的密码子作为频率较高的密码子。

选择RSCU>0.08者,作为高表达密码子,在此基础上,选取频率较高、表现力较强的密码子,将其作为最佳密码子。

山麦冬叶绿体基因组密码子核苷酸组成及RSCU分析

通过对49个候选基因的基因片段的核酸成分进行了比较,得出了相应的结论,结果如表1所示。结果表明,49个蛋白质的编码序列中,La的数量达到了1002247个,其平均水平是371个。

这表明该植物在其叶绿体内的编码序列中,以A/T为末尾。以ENC=35为基准,发现所有的山麦冬叶绿体基因都具有更高的ENC,表明它们对密码子的利用偏好程度很低。

CAI在0.11000.3280的区间内,平均为0.1689的区间内,该区间内CAI在口令选择上的相对偏爱度也很低。

核苷酸组成相关的各参数的相关分析结果显示(见表2),GC3与GC1、GC2之间的相关系数分别为0.106、0.080,相关性较低且差异不明显,但与C3、G3的相关性较强,相关系数分别为0.715、0.509,并且差异极显著(P<0.01)。

RSCU分析(如表3)表明,UUA具有最高的RSCU,为1.93;密码子AGC模型的RSCU为0.31,是所有模型中RSCU最少的一个。以上研究还表明,在该植物中,其编码方式更倾向于以A/U为末尾的编码方式。

如果在一个基因的密码子的利用上,变异与自然选择是同等重要的,那么这个基因就会出现在PR2plot地图的0.5中间。

在图1中显示了利用PR2plot对扁豆叶绿体基因组密码子进行的研究的结果。从图1可以看到,大多数的基因都在距离中心点较远的地方,只有极少的几个基因靠近中心点。

从垂直轴上看,位于中心点下侧的基因数明显多于中心点上侧的基因数。说明山麦冬叶绿体基因组密码子第3位上C的使用频率高于G,U的使用频率高于A。即山麦冬叶绿体基因组密码子第3位上的嘧啶核苷酸多于嘌呤核苷酸

因此,我们认为,除碱基组分之外,天择与变异压也是决定其应用偏好的关键因子,但二者的强弱并不相等。

利用中立映射对山麦冬叶绿体基因组的密码子进行了分析,其结果显示在图2中。

从图2可以看到,GC12与GC3的相关度很低,且其线性关系的坡度只有0.1445,这表明,变异压强对其影响的程度仅为14.45%,而对其影响的程度为85.55%。

很明显,在红花属植物中,天择是导致红花属植物对红花属植物应用偏爱的重要因素。

图3是利用ENCplot对红花叶绿体内的密码子进行的研究。研究表明,若仅由GC3密码子构成而不是被选择作用所决定,则全部的遗传因子都将沿预期的曲线分布。

如从图3中所见,大多数的基因与标准曲线背离,只有一些基因的分布在或接近于标准曲线上。

由此推测,山麦冬在叶绿体中的应用可能与其它一些因子有关,而不是只与碱基构成有关。

各基因的GC_3浓度均为020.4,且GC_3浓度区间较小,表明其对黑麦草的利用偏好很大程度上是受到了自然选择的作用,这一点与中性分析的结果一致。

二个轴线与其它有关的参数之间的相关性分析见下表4。由表4可知,axis1与各参量之间没有明显的相关,axis2与ENC之间的相关系数为0.304,具有极高的显著性而axis1与其它参量之间没有明显的相关。

因此,本项目拟在前期工作基础上,深入研究红花叶绿体内密码子利用偏好的机制,揭示红花叶绿体碱基变异、自然选择及基因表达调控机制。

分别以axis1和axis2为横轴,分别构建了一个散点图(如图4所示)。由图4可见,与其它若干种基因相比较,与遗传体系有关的基因在空间上更集中。这表明,在遗传体系中,有关基因的选择具有比较稳定的趋势。

以各CDS的ENC值的大小为依据,对它们进行了排名,分别选取位于前、后各5条序列,来构建高RSCU库和低RSCU库,并对两库的RSCU值进行计算;

同时计算高、低库之间的△RSCU值(表5)。结果表明,最好的密码子都是以A/U为结束,5个以A为结束,6个以U为结束。

讨论

山麦冬全基因组的ENC平均为47.94,这是一个很大的数字,79.59%以上的基因ENC超过44,表明对该基因的利用偏好度不高。

我们前期对甜荞、苦荞、油茶酸枣、刺五加、籽粒苋文心兰等多种植物进行了比较,结果表明,这些植物对不同类型的叶绿体基因组具有不同程度的亲和力。

在植物叶绿体内,蛋白质基因以与光合有关的基因为主,例如:Rubisco大亚基基因,电子传递链上各个蛋白质复合物;

与叶绿体基因表达相关的基因包括:核糖体RNA转运RNARNA聚合酶三个亚基、核蛋白体蛋白及翻译初始蛋白等,还有一些还没有被研究清楚的基因。

由于其在大小、结构及种类等方面高度保守,使得其在植物分类及系统演化研究中具有重要作用。

在漫长的演化历程中,基因变异与物竞天择被视为两种主要驱动因素。结果表明,GC12与GC3的相关系数均不高,且呈极小的坡度,表明其可能受自然选择的影响。

同时,我们还发现,在其编码序列中,编码序列中G/C、A/U的不平衡分布,暗示着自然选择可能对其产生影响。

菊科植物甜荞,苦荞,枣等植物的营养价值也较高。近年来,人们在对植物核基因组中利用密码子的偏爱进行了大量的调查,结果表明,在某些物种中,突变体的压强是导致其偏爱的重要因素。

在某些植物中,天择起到了主导作用,比如小米中含有一种甜菜碱而石榴中含有一种甜菜碱;然而,对actin基因编码区的偏爱程度既受到变异的影响,也受到了选择压的影响。

因此,我们认为,在叶绿体内的遗传密码子偏爱作用是一个普遍性的现象,但对于细胞核内的遗传密码子偏爱作用则因种间的差异而异。这也从另一个角度解释了为什么选择会是一个复杂的问题。

这一类同的优化利用方式,可能是从内生蓝细菌演化而来的一个重要原因。根据最优密码子的特点,对其进行改造,可以有效地改善异源基因的表达率,为利用遗传技术进行遗传育种提供理论依据。

结语

红花叶绿体内存在着对A/U型密码子的偏爱,这可能是由于受自然选择的限制,而受环境因素的影响。上述研究成果将为进一步进行异源高效率的遗传转化提供理论依据。

参考文献:

[1]李宏韬,赵淑青,赵彦修,等《叶绿体基因工程简介》

[2]刘庆坡,薛庆中《粳稻叶绿体基因组的密码子用法》

[3]罗洪,胡莎莎,吴琦,等《甜荞叶绿体基因密码子偏爱性分析》

[4]胡莎莎,罗洪,吴琦,等《苦荞叶绿体基因组密码子偏爱性分析》