蛋白質摺疊預測問題,生物學領域的明珠

AlphaFold如此成功,我們也有必要在歷史背景下看一看為什麼蛋白質摺疊的巨大挑戰如此重要。

估計大家都記得中學時接觸過的「中心法則」。

所謂的「分子生物學中心法則」最初是在 1957 年由英國物理學家出身的生物學家弗朗西斯·克里克(Francis Crick)在一次會議演講中提出的。在那次演講中,克里克進行了令人難忘的描述「DNA→RNA→蛋白質」,其中箭頭表示「信息流」。

克里克後來與吉姆·沃森(以及莫里斯·威爾金斯和當時不幸去世的羅莎琳德·富蘭克林做出了重大貢獻)一起獲得了諾貝爾獎,因為他們在 1953 年發表文章,解決了 DNA 的雙螺旋結構——並揭示了關於如何精確複製由雙螺旋中的鹼基對序列編碼的遺傳信息的解釋。

同樣重要的是,克里克對生命的基本分子信息流的非凡洞察,從廣義上正確地提出了:如何將 DNA 中鹼基的一維線性序列(構成遺傳密碼),通過相應的一維信使 RNA 序列,翻譯成一維構成蛋白質多肽鏈的氨基酸結構單元的序列。

然而儘管很精彩,中心法則根本沒有解釋線性氨基酸鏈如何摺疊成構成生命 3D 分子機器的蛋白質的正確結構。

十二年後,在 1969 年發表的另一場重要會議演講中,美國分子生物學家賽勒斯·萊文塔爾 (Cyrus Levinthal) 估計,一條具有代表性的多肽鏈在理論上可能採用的構型數量可能高達令人震驚的 10300 種——這意味著蛋白質正確摺疊需要比當時已知宇宙的年齡更長的時間。這與觀察到的蛋白質在短短几秒鐘內實現其正確 3D 形狀的能力形成鮮明對比。這個難題被稱為蛋白質摺疊的「萊文塔爾悖論」。

又過了三年,即 1972 年,美國生物化學家克里斯蒂安·阿芬森 (Christian Afinson) 因「熱力學假說」獲得諾貝爾獎——基於他對稱為核糖核酸酶的蛋白質的研究,以及「特別是氨基酸序列與生物活性物質之間的關係構象」。阿芬森在他的諾貝爾獎演講論文的結尾展望了未來,他認為屆時人們可以預測蛋白質結構的 3D 形狀如何與其相應的遺傳密碼和氨基酸序列相關。

儘管取得了初步進展,但在 1994 年,由於從組成氨基酸序列正確預測蛋白質 3D 構象的能力有限,這促使一群結構生物學家發起了「蛋白質結構預測(CASP)競賽」。尤其有意思的是,組織者並不喜歡「比賽」一詞,更喜歡「實驗」,但在外人看來,這確實是一場比賽!

這項兩年一度的活動旨在加快該領域的研究進展。之後每隔兩年,有大約 100 個研究團隊努力探索他們的計算方法可以多麼準確地預測蛋白質的 3D 結構,並通過艱苦的經驗結構確定(通常通過 X 射線晶體學或冷凍電子顯微鏡進行)。

因為蛋白質結構預測競賽(CASP)的參賽者被要求「盲」預測一百種蛋白質的結構,可以說CASP 挑戰了每個團隊做出準確估計的能力。