今天,科學界已知 300 多個基因的致癌突變,因此通常有必要對它們進行排序,以確定治療中主要作用的目標。但在大多數情況下,突變按發生頻率排序,這不一定與它們在疾病中的重要性相對應。MIPT 科學家建議以突變的強度為基礎。利用最大的致癌突變資料庫 TCGA 的生物信息學分析,他們開發了一種對觸發疾病的驅動基因進行排序的新方法。
研究結果發表在科學期刊 PeerJ Life & Environment 上。按照當今流行的觀點,癌症是由所謂的「驅動」基因突變引發和刺激的,而「乘客」基因的突變則沒有影響,只是隨著驅動基因「旅行」。體細胞進化。有幾種方法可以識別癌症起始突變並對其進行排序,主要的方法是基於發生頻率、對蛋白質三維結構的影響以及對蛋白質相互作用的影響。這些方法各有利弊。
一種方法是使用特定類型癌症患者的突變頻率,通常根據基因背景突變的頻率進行調整。這種方法確實揭示了最常見的突變,但這並不意味著它們會自行導致癌症。同時,這種突變可能很少見,但足以引發癌症。第一種情況是常見但弱驅動的示例,而第二種情況是罕見但強驅動的示例。因此,基於突變率的演算法不能可靠地確定驅動基因的強度。
有一大組演算法旨在根據突變對蛋白質結構和活性的影響來預測和排列驅動基因。這些方法可以確定蛋白質的結構和功能是否受損以及受損程度如何,但它們不太適合確定特定蛋白質在其他細胞蛋白質及其微環境中的作用。也就是說,這對於確定它是否會導致癌症至關重要。因此,突變對蛋白質結構的影響程度並不能決定該蛋白質是否致癌。
第三種方法通過識別與細胞中其他蛋白質相互作用最多的關鍵分子來確定突變對蛋白質相互作用的影響。據了解,此類蛋白質的突變將對細胞產生最嚴重的後果。這通常會證明是這種情況,但更多情況下這會導致細胞死亡而不是致癌轉化。因此,這種方法也不適合按強度對突變進行排序。
「我們之前對驅動突變進行了量化,發現即使在患有相同類型癌症的患者中,突變數量的變異性也非常大。所以我們問自己:為什麼在一些患者中一個驅動突變就足夠了,而在另一些患者中,癌症直到數十個突變積累後才會發展?我們假設主要原因是它們的強度:一個強大的驅動器在其腫瘤誘導活性方面可以與幾個弱驅動器相當。
因此,在突變數量較少的患者中,強驅動基因更有可能在統計學上更為常見,因為一些強驅動基因突變足以引發癌症。相反,弱驅動因素在具有大量驅動突變的患者中更為常見,因為需要許多弱驅動因素來引發癌症。基於這一原則,我們開發了數學公式,使我們能夠創建生物信息學演算法,根據驅動突變在不同數量驅動突變患者中的分布,自動計算任何驅動突變強度的數值當量。」研究。
科學家們使用了駕駛員強度指數(DSI)和標準化駕駛員強度指數(NDSI)的公式。他們對最大的 TCGA PanCanAtlas 資料庫中的突變進行了大規模篩選,並確定了它們的強度。在分析數據時,科學家們發現最強的驅動因素通常屬於幾個已知的基因家族,並構成某些在腫瘤中經常發生突變的信號級聯。
「我們的研究表明,所提出的排序方法確實揭示了驅動基因中一些傳統方法無法檢測到的生物實體,我們相信這個實體是驅動突變的真正力量。因此,我們的評級可用於選擇腫瘤治療的最高優先順序目標,以及從科學的角度選擇基因進行更深入的研究。MIPT 創新藥物和農業生物技術開發實驗室負責人 Sergey Leonov 總結說,優先考慮的基因和信號通路可能對癌症的發生和進展做出最大貢獻,並可能成為未來的治療靶點。制定和實施。