來源:中國新聞網

中新網北京6月28日電 (記者 孫自法)記者28日從中國科學院遺傳與發育生物學研究所(中科院遺傳發育所)獲悉,該所高彩霞研究團隊聯合中國科研同行和相關企業,最近創新性運用人工智能(AI)輔助的蛋白結構預測,建立起全新的基於三級結構的高通量蛋白聚類方法,實現脫氨酶功能結構的深入挖掘,鑒定到完全區別於已知脫氨工具酶的全新底盤元件,並成功開發一系列具有中國自主知識產權的新型鹼基編輯工具。
這項為蛋白功能分析、新功能元件挖掘提供全新策略的精準基因編輯技術成果論文,於北京時間6月27日深夜在國際著名學術期刊《細胞》(Cell)在線發表。
論文共同通訊作者高彩霞研究員表示,該研究通過創新蛋白聚類方法成功開發出一系列新型鹼基編輯工具,突破了現有脫氨酶的應用瓶頸,展現出新型鹼基編輯系統在醫學和農業方面廣泛的應用前景,有望打破鹼基編輯底層國外專利壟斷,並將幫助中國在未來的生物技術產業競爭中處於有利地位。
她介紹說,蛋白質是生命活動的主要承擔者。通過對蛋白質進行功能聚類,是理解其參與的生理過程、設計新型蛋白質等的重要手段。現有的方法主要基於氨基酸一級序列的相似性對蛋白質進行聚類分析,並以此推斷其功能和演化關係。然而,蛋白質功能由其三維空間結構所決定,開發基於三維結構的高通量蛋白質聚類方法,將為蛋白質功能研究提供更直接、可靠的手段,並推動未知蛋白質的功能挖掘。
鹼基編輯系統可以實現單核苷酸精度的DNA(脫氧核糖核酸)或RNA(核糖核酸)精準編輯,是基因功能研究、疾病治療、生物育種的變革性技術。然而,現有鹼基編輯系統的核心元件脫氨酶來源於單一家族,導致鹼基編輯仍有諸多局限,編輯尚難以滿足多元化的應用需求。而且,現有鹼基編輯系統的底層專利由國外持有,中國亟需擁有具自主知識產權的鹼基編輯系統。因此,創新地挖掘新型脫氨酶,開發適用於不同應用場景的新型鹼基編輯工具顯得尤為重要。
在本項研究中,研究團隊首先通過蛋白質結構預測模型AlphaFold2對具有代表性的脫氨功能序列進行批量三維結構預測,隨後創新性開展基於三維結構的蛋白質多重比對與聚類,成功將潛在的脫氨酶劃分為20個不同的分支。除已報道的APOBEC/AID胞嘧啶脫氨酶外,研究團隊又檢測到5個結構、序列全新的具有活性的胞嘧啶脫氨酶分支。在這些分支中,研究團隊對具有類DddA脫氨結構域的蛋白進行進一步結構聚類和功能驗證,發現除以前推測的具有雙鏈DNA脫氨活性的蛋白外,該分支還包含大量只具有單鏈DNA脫氨活性的蛋白,這一結果顛覆了之前對該類蛋白功能的認知。
這次研究表明,當蛋白集合的序列同源性較低且功能多樣時,相比於傳統的基於氨基酸一級序列的聚類方法,通過人工智能輔助的蛋白質結構聚類能夠得到更準確的結果。因此,該方法為蛋白質功能分析和挖掘提供一個高效、可靠的新策略。
在此基礎上,研究團隊全新鑒定到45個單鏈胞嘧啶脫氨酶(Sdd)和13個雙鏈胞嘧啶脫氨酶(Ddd),開發出一系列新型鹼基編輯系統,並在動、植物細胞中進行測試。結果表明,新開發的基於Ddd1和Ddd9脫氨酶的雙鏈鹼基編輯系統克服常規編輯器對GC序列編輯效率明顯降低的缺陷;基於Sdd7和Sdd3的單鏈鹼基編輯系統展現出非常高的編輯活性,在GC序列同樣具有可觀的鹼基編輯能力;基於Sdd6的單鏈鹼基編輯系統則展現出極高的特異性,幾乎檢測不到脫靶事件。
研究團隊進一步通過蛋白理性設計和功能驗證,開發出新型的可被單個腺相關病毒(AAV)包被的Sdd6-CBE鹼基編輯器,在小鼠細胞系中成功獲得高達43.1%的編輯效率,解決了常規鹼基編輯器過大而無法被腺病毒顆包被遞送的難題。此外,針對大豆中長期存在鹼基編輯效率低下的問題,研究團隊新開發了Sdd7-CBE系統,在154株大豆陽性苗中獲得34株穩定編輯的植株,相比之下,常規的鹼基編輯技術獲得編輯大豆植株的效率為零。