山麥冬葉綠體基因組,其密碼子偏好性是由什麼決定的?

文|胡一舸

編輯|胡一舸

前言

葉綠體是植物完成光合作用主要器官,其基因組是一個與細胞核不同的、相對自成系統的分子系統。

利用葉綠體作為受體的轉基因系統,在基因表達效率、安全性、無位置效應、可實現多個基因的共表達等方面,與常規的轉基因系統相比,該系統更具優越性。

但是,在對異源基因的選擇上存在差異,導致異源基因的轉錄率較低。密碼子被稱為“第二類基因密碼”。

在不同的生物中對其的選擇存在很大的差別,其選擇受基因表達水平、基因長度、基因翻譯起始信號、蛋白質氨基酸組成與結構、tRNA丰度、突變方式與頻率、GC含量等多個因子的影響。

所以,通過對葉綠體基因組中密碼子利用偏好的分析,可以更有效地提高異源基因的表達效率。

近年來,在甜蕎苦蕎黃芩刺五加等藥材中,人們對其葉綠體基因組中的密碼子選擇問題進行了深入的探討。

山麥冬百合科山麥冬屬多年生草本植物,主要生長在秦嶺以南各省區及華北等地。

山麥冬為中國名貴中藥材,其干塊根為藥用植物,其主要作用為滋陰生津,潤肺清心,可用於肺燥乾咳,陰虛癆咳,津消渴,內熱消渴,心煩失眠,腸燥便秘。

山麥冬在治療心血管、免疫、神經系統等多種疾病方面也有較好的臨床應用價值。而山麥冬因其生態適應性廣,抗逆性強,綠化效果好而被廣泛應用於園林綠化。

目前對其理化特徵、化學成分及藥理活性已有大量報道,但對其生物學特性、栽培育種、環境適應性及相關功能的認識尚不深入。

目前國內外還沒有對其進行過系統的研究,該項目的完成將為進一步利用該基因進行葉綠體遺傳改造打下堅實的理論基礎,也將為進一步探討葉綠體的分子演化及葉綠體蛋白質的功能等問題提供借鑒。

山麥冬葉綠體基因組密碼子偏好性相關

通過CodonW軟件,對各條基因的核苷酸組成進行了分析,具體的指標是:在密碼子的第3位上,T,C,A,G的含量,將其表示為T3,C3,A3,G3;每個基因的蛋白質編碼長度;密碼子適應性指標;二是與密碼子相關的概率。

筆者擬在前期工作基礎上,首先通過對其全基因組序列的解析,測定不同密碼子的RSCU,並選擇RSCU大於1的密碼子作為頻率較高的密碼子。

選擇RSCU>0.08者,作為高表達密碼子,在此基礎上,選取頻率較高、表現力較強的密碼子,將其作為最佳密碼子。

山麥冬葉綠體基因組密碼子核苷酸組成及RSCU分析

通過對49個候選基因的基因片段的核酸成分進行了比較,得出了相應的結論,結果如表1所示。結果表明,49個蛋白質的編碼序列中,La的數量達到了1002247個,其平均水平是371個。

這表明該植物在其葉綠體內的編碼序列中,以A/T為末尾。以ENC=35為基準,發現所有的山麥冬葉綠體基因都具有更高的ENC,表明它們對密碼子的利用偏好程度很低。

CAI在0.11000.3280的區間內,平均為0.1689的區間內,該區間內CAI在口令選擇上的相對偏愛度也很低。

核苷酸組成相關的各參數的相關分析結果顯示(見表2),GC3與GC1、GC2之間的相關係數分別為0.106、0.080,相關性較低且差異不明顯,但與C3、G3的相關性較強,相關係數分別為0.715、0.509,並且差異極顯著(P<0.01)。

RSCU分析(如表3)表明,UUA具有最高的RSCU,為1.93;密碼子AGC模型的RSCU為0.31,是所有模型中RSCU最少的一個。以上研究還表明,在該植物中,其編碼方式更傾向於以A/U為末尾的編碼方式。

如果在一個基因的密碼子的利用上,變異與自然選擇是同等重要的,那麼這個基因就會出現在PR2plot地圖的0.5中間。

在圖1中顯示了利用PR2plot對扁豆葉綠體基因組密碼子進行的研究的結果。從圖1可以看到,大多數的基因都在距離中心點較遠的地方,只有極少的幾個基因靠近中心點。

從垂直軸上看,位於中心點下側的基因數明顯多於中心點上側的基因數。說明山麥冬葉綠體基因組密碼子第3位上C的使用頻率高於G,U的使用頻率高於A。即山麥冬葉綠體基因組密碼子第3位上的嘧啶核苷酸多於嘌呤核苷酸

因此,我們認為,除鹼基組分之外,天擇與變異壓也是決定其應用偏好的關鍵因子,但二者的強弱並不相等。

利用中立映射對山麥冬葉綠體基因組的密碼子進行了分析,其結果顯示在圖2中。

從圖2可以看到,GC12與GC3的相關度很低,且其線性關係的坡度只有0.1445,這表明,變異壓強對其影響的程度僅為14.45%,而對其影響的程度為85.55%。

很明顯,在紅花屬植物中,天擇是導致紅花屬植物對紅花屬植物應用偏愛的重要因素。

圖3是利用ENCplot對紅花葉綠體內的密碼子進行的研究。研究表明,若僅由GC3密碼子構成而不是被選擇作用所決定,則全部的遺傳因子都將沿預期的曲線分布。

如從圖3中所見,大多數的基因與標準曲線背離,只有一些基因的分布在或接近於標準曲線上。

由此推測,山麥冬在葉綠體中的應用可能與其它一些因子有關,而不是只與鹼基構成有關。

各基因的GC_3濃度均為020.4,且GC_3濃度區間較小,表明其對黑麥草的利用偏好很大程度上是受到了自然選擇的作用,這一點與中性分析的結果一致。

二個軸線與其它有關的參數之間的相關性分析見下表4。由表4可知,axis1與各參量之間沒有明顯的相關,axis2與ENC之間的相關係數為0.304,具有極高的顯著性而axis1與其它參量之間沒有明顯的相關。

因此,本項目擬在前期工作基礎上,深入研究紅花葉綠體內密碼子利用偏好的機制,揭示紅花葉綠體鹼基變異、自然選擇及基因表達調控機制。

分別以axis1和axis2為橫軸,分別構建了一個散點圖(如圖4所示)。由圖4可見,與其它若干種基因相比較,與遺傳體系有關的基因在空間上更集中。這表明,在遺傳體系中,有關基因的選擇具有比較穩定的趨勢。

以各CDS的ENC值的大小為依據,對它們進行了排名,分別選取位於前、後各5條序列,來構建高RSCU庫和低RSCU庫,並對兩庫的RSCU值進行計算;

同時計算高、低庫之間的△RSCU值(表5)。結果表明,最好的密碼子都是以A/U為結束,5個以A為結束,6個以U為結束。

討論

山麥冬全基因組的ENC平均為47.94,這是一個很大的數字,79.59%以上的基因ENC超過44,表明對該基因的利用偏好度不高。

我們前期對甜蕎、苦蕎、油茶酸棗、刺五加、籽粒莧文心蘭等多種植物進行了比較,結果表明,這些植物對不同類型的葉綠體基因組具有不同程度的親和力。

在植物葉綠體內,蛋白質基因以與光合有關的基因為主,例如:Rubisco大亞基基因,電子傳遞鏈上各個蛋白質複合物;

與葉綠體基因表達相關的基因包括:核糖體RNA轉運RNARNA聚合酶三個亞基、核蛋白體蛋白及翻譯初始蛋白等,還有一些還沒有被研究清楚的基因。

由於其在大小、結構及種類等方面高度保守,使得其在植物分類及系統演化研究中具有重要作用。

在漫長的演化歷程中,基因變異與物競天擇被視為兩種主要驅動因素。結果表明,GC12與GC3的相關係數均不高,且呈極小的坡度,表明其可能受自然選擇的影響。

同時,我們還發現,在其編碼序列中,編碼序列中G/C、A/U的不平衡分布,暗示着自然選擇可能對其產生影響。

菊科植物甜蕎,苦蕎,棗等植物的營養價值也較高。近年來,人們在對植物核基因組中利用密碼子的偏愛進行了大量的調查,結果表明,在某些物種中,突變體的壓強是導致其偏愛的重要因素。

在某些植物中,天擇起到了主導作用,比如小米中含有一種甜菜鹼而石榴中含有一種甜菜鹼;然而,對actin基因編碼區的偏愛程度既受到變異的影響,也受到了選擇壓的影響。

因此,我們認為,在葉綠體內的遺傳密碼子偏愛作用是一個普遍性的現象,但對於細胞核內的遺傳密碼子偏愛作用則因種間的差異而異。這也從另一個角度解釋了為什麼選擇會是一個複雜的問題。

這一類同的優化利用方式,可能是從內生藍細菌演化而來的一個重要原因。根據最優密碼子的特點,對其進行改造,可以有效地改善異源基因的表達率,為利用遺傳技術進行遺傳育種提供理論依據。

結語

紅花葉綠體內存在着對A/U型密碼子的偏愛,這可能是由於受自然選擇的限制,而受環境因素的影響。上述研究成果將為進一步進行異源高效率的遺傳轉化提供理論依據。

參考文獻:

[1]李宏韜,趙淑青,趙彥修,等《葉綠體基因工程簡介》

[2]劉慶坡,薛慶中《粳稻葉綠體基因組的密碼子用法》

[3]羅洪,胡莎莎,吳琦,等《甜蕎葉綠體基因密碼子偏愛性分析》

[4]胡莎莎,羅洪,吳琦,等《苦蕎葉綠體基因組密碼子偏愛性分析》