今天,科学界已知 300 多个基因的致癌突变,因此通常有必要对它们进行排序,以确定治疗中主要作用的目标。但在大多数情况下,突变按发生频率排序,这不一定与它们在疾病中的重要性相对应。MIPT 科学家建议以突变的强度为基础。利用最大的致癌突变数据库 TCGA 的生物信息学分析,他们开发了一种对触发疾病的驱动基因进行排序的新方法。
研究结果发表在科学期刊 PeerJ Life & Environment 上。按照当今流行的观点,癌症是由所谓的“驱动”基因突变引发和刺激的,而“乘客”基因的突变则没有影响,只是随着驱动基因“旅行”。体细胞进化。有几种方法可以识别癌症起始突变并对其进行排序,主要的方法是基于发生频率、对蛋白质三维结构的影响以及对蛋白质相互作用的影响。这些方法各有利弊。
一种方法是使用特定类型癌症患者的突变频率,通常根据基因背景突变的频率进行调整。这种方法确实揭示了最常见的突变,但这并不意味着它们会自行导致癌症。同时,这种突变可能很少见,但足以引发癌症。第一种情况是常见但弱驱动的示例,而第二种情况是罕见但强驱动的示例。因此,基于突变率的算法不能可靠地确定驱动基因的强度。
有一大组算法旨在根据突变对蛋白质结构和活性的影响来预测和排列驱动基因。这些方法可以确定蛋白质的结构和功能是否受损以及受损程度如何,但它们不太适合确定特定蛋白质在其他细胞蛋白质及其微环境中的作用。也就是说,这对于确定它是否会导致癌症至关重要。因此,突变对蛋白质结构的影响程度并不能决定该蛋白质是否致癌。
第三种方法通过识别与细胞中其他蛋白质相互作用最多的关键分子来确定突变对蛋白质相互作用的影响。据了解,此类蛋白质的突变将对细胞产生最严重的后果。这通常会证明是这种情况,但更多情况下这会导致细胞死亡而不是致癌转化。因此,这种方法也不适合按强度对突变进行排序。
“我们之前对驱动突变进行了量化,发现即使在患有相同类型癌症的患者中,突变数量的变异性也非常大。所以我们问自己:为什么在一些患者中一个驱动突变就足够了,而在另一些患者中,癌症直到数十个突变积累后才会发展?我们假设主要原因是它们的强度:一个强大的驱动器在其肿瘤诱导活性方面可以与几个弱驱动器相当。
因此,在突变数量较少的患者中,强驱动基因更有可能在统计学上更为常见,因为一些强驱动基因突变足以引发癌症。相反,弱驱动因素在具有大量驱动突变的患者中更为常见,因为需要许多弱驱动因素来引发癌症。基于这一原则,我们开发了数学公式,使我们能够创建生物信息学算法,根据驱动突变在不同数量驱动突变患者中的分布,自动计算任何驱动突变强度的数值当量。”研究。
科学家们使用了驾驶员强度指数(DSI)和标准化驾驶员强度指数(NDSI)的公式。他们对最大的 TCGA PanCanAtlas 数据库中的突变进行了大规模筛选,并确定了它们的强度。在分析数据时,科学家们发现最强的驱动因素通常属于几个已知的基因家族,并构成某些在肿瘤中经常发生突变的信号级联。
“我们的研究表明,所提出的排序方法确实揭示了驱动基因中一些传统方法无法检测到的生物实体,我们相信这个实体是驱动突变的真正力量。因此,我们的评级可用于选择肿瘤治疗的最高优先级目标,以及从科学的角度选择基因进行更深入的研究。MIPT 创新药物和农业生物技术开发实验室负责人 Sergey Leonov 总结说,优先考虑的基因和信号通路可能对癌症的发生和进展做出最大贡献,并可能成为未来的治疗靶点。制定和实施。