中國科學家創新DNA存儲演算法 讓敦煌壁畫再「活」兩萬年

2022年10月10日07:43:13 科學 1552
中國科學家創新DNA存儲演算法 讓敦煌壁畫再「活」兩萬年 - 天天要聞

DNA存儲的敦煌壁畫。天津大學供圖

中國科學家創新DNA存儲演算法 讓敦煌壁畫再「活」兩萬年 - 天天要聞

DNA存儲技術概念圖。天津大學供圖

中國科學家創新DNA存儲演算法 讓敦煌壁畫再「活」兩萬年 - 天天要聞

基於德布萊英圖理論設計的序列重建演算法高效解決DNA斷裂、降解問題。天津大學供圖

科幻大片《侏羅紀公園》里講述了這樣一個故事:科學家找到一塊有史前蚊子的琥珀,從蚊子血中獲得了恐龍的基因,從而讓已滅絕了6000多萬年的恐龍復活。

恐龍的生物信息存儲在DNA中,若干年後被提取並還原出來。這聽上去似乎有些道理,卻也讓人倒吸一口涼氣。

最近,天津大學一項研究成果讓人們離想像又近了一些。該校合成生物學團隊將10幅精選敦煌壁畫存入DNA中,並通過加速老化等實驗,發現這些壁畫信息在常溫下可保存千年,在9.4℃下可保存兩萬年。

「如果在合適的溫度等條件下,保存千萬年也是可以的。」中國科學院院士、天津大學副校長元英進說。

小小的DNA卻擁有驚人的存儲容量

人類文明進化史,也是一部信息存儲技術發展史。

從結繩記事、倉頡造字到磁帶、硬碟等現代磁光電存儲技術,數據存儲幫助人類延續了思想,記錄下燦爛文明。造紙與印刷術的發明,讓人類能夠存儲的數據量在幾百年內獲得了大約5個數量級的提升。到了計算機時代,人類產生的數據呈爆髮式增長。

「全世界都在建數據中心,而數據中心的能耗是驚人的。」元英進說。人們一直在不斷尋找更海量、更穩定、更安全的存儲方式。

大自然鬼斧神工的絕妙之處就在於此——最好的存儲器或許就藏身於生命體之中。

自地球上出現生命以來,大自然一直用DNA來存儲信息,至今已有30多億年。人類的五官在臉上如何擺放,體內的蛋白怎樣合成,眼睛是什麼顏色……諸如此類紛繁複雜的人類基因組信息,都記錄在比細胞還小得多的DNA上,一代代沿用至今。

不同於各種人造存儲設備,DNA極其精巧卻又如此經久耐用,它存儲了億萬年來無數生物的遺傳信息,造就生命繁衍、進化演化及生物多樣性

那麼,假如把海量的信息,像存入U盤、硬碟一樣,「寫」到小小的DNA上,豈不是一舉多得?事實上,當人類發現DNA的雙螺旋結構後,美俄科學家就先後提出了用DNA存儲數字信息的概念。

元英進解釋說,DNA存儲相較於磁、光、電等常規的信息存儲介質有3個最顯著的優勢。其中最大的優勢在於存儲密度高。目前,天津大學研究團隊將部分經典視頻片段存儲在DNA中,已實現了體積存儲密度比普通硬碟高出6個數量級。

與此同時,存儲的信息可用時間非常長。此次研究者將10幅敦煌壁畫信息存儲在DNA中,結合創新的演算法,可以實現DNA分子在室溫下保存超過千年,在9.4℃條件下保存兩萬年。

這樣的長期保存需要的能耗卻很低。元英進認為,DNA存儲被視為一種極具潛力的存儲技術,已經成為應對數據存儲增長挑戰的新機遇。

壁畫「變身」DNA需要幾步

DNA信息存儲的原理共分兩步——信息寫入和信息讀取。

這個過程實際上跨越了極難逾越的鴻溝:它打破了有機與無機的界限,連起生命和信息兩大系統。

DNA是脫氧核糖核酸的縮寫,含有「A」「T」「C」「G」四種鹼基。如果用數字中的0、1、2、3分別代表一個鹼基,就組成了一個四進位的存儲方式,類似於計算機採用的0和1二進位代碼。

通過編碼轉化,「鹼基四進位」和「計算機二進位」就可以實現「對話」。天津大學合成生物學前沿科學中心博士生韓明哲解釋說,壁畫的數字圖像本質上就是二進位的比特串,「我們通過編碼將這些二進位的比特串,轉化為四進位的ATGC鹼基序列,再通過DNA合成技術將鹼基序列寫入DNA中,壁畫的數據圖像就『變』為DNA了。」

此前,該團隊成功在釀酒酵母中合成了一條額外的人工染色體,並在上面存儲了兩張圖片及一段視頻信息,將其稱之為「酵母CD」。隨著酵母的不斷繁殖擴增,數字信息也隨之廉價且穩定地複製。

「我們傳代培養酵母到100代,依然可以完美地恢復出原始數據。」元英進說,假如腦洞更大一點,將信息存儲到一棵樹中,隨著樹生長千百年,人類的子孫後代都可以隨時從這棵樹中讀取到千百年前存儲的信息。

這一次,這支年輕團隊的創新之處在於,能實現更惡劣條件下可靠讀取信息。韓明哲說,存了壁畫信息的DNA,本質上其實跟天然的DNA沒有什麼不同,同樣也存在長時間存放而產生的斷裂和降解等問題,影響信息存儲的長期可靠性,這也成為亟待解決的關鍵科學問題。

於是,他們設計了基於德布萊英圖理論的序列重建演算法來解決DNA斷裂等問題,可以從嚴重降解的DNA樣本中,恢復原始的信息。

為了驗證數據的長期可靠性,團隊製備了一個沒有任何特殊保護的DNA水溶液樣本,隨後在70℃的溫度下加速樣本斷裂、降解長達十周。韓明哲說:「這個過程使得DNA片段80%以上都發生了斷裂錯誤,模擬了DNA在自然環境下千年萬年的降解情形。」

隨後,團隊依靠設計的序列重建演算法,依然可以準確組裝並解碼96.4%以上的片段,再通過一種編碼方式解決了少量片段丟失的問題,使原始的敦煌壁畫圖片能夠完美恢復。

DNA存儲走向實用化還有多遠

儘管DNA存儲還不被大眾所熟知,但它正在努力走出實驗室,「距離實用化並不遙遠。」元英進說,驚人的數據存儲需求是新技術走向市場的最大推動力。

據國際數據公司估計,到2025年全球數據總量將達到175ZB(1ZB為十萬億億位元組)。到2024年,全球將有30%的數字業務進行DNA存儲試驗。然而從目前來看,DNA存儲想要大規模應用,尤其是在中國實用化還需要突破幾個關鍵瓶頸。

團隊分析了當前DNA信息存儲面臨的主要挑戰。信息存儲成本高、信息讀寫速度慢,以及無法高效對接現有信息系統是三大主要限制因素。

根據測算,目前DNA存儲寫入成本相當於20世紀80年代內存的存儲成本,而要達到當前數據存儲成本還需要降低7-8個數量級。

「DNA信息存儲成本在未來有很大下降的潛力。」韓明哲認為,今後可以從優化合成反應、改良晶元結構、替換廉價耗材、優化試劑分配量等方面著手,大幅降低合成成本。

與此同時,由於信息存儲領域市場規模巨大,隨著半導體器件、微納加工在DNA信息存儲領域的應用,該領域的巨大投入將對DNA合成技術產生重大影響,DNA合成技術與裝備快速迭代升級,也有望使成本快速下降。

DNA信息存儲的讀取依賴測序技術,與磁、光、電等存儲相比,讀取速度較慢。目前DNA測序儀的讀取速度與硬碟相比,還存在3-4個數量級的差距——現有電、磁存儲技術通常每秒可讀取幾十到幾百兆位元組數據。此外,DNA存儲的標準尚待建立,面臨與現有數字存儲系統兼容的問題。

「DNA信息存儲是一個新興的、多學科深度交叉融合的研究方向。」元英進認為,DNA存儲在未來極有可能成為龐大冷數據存儲的主要存儲介質。

所謂冷數據,就如同檔案館的歷史資料,需要把海量信息保存好,但平時又很少去使用。因為這些數據需要長期存儲、耗能又大,而電子存儲設備的壽命往往只有十年到幾十年,並需要不斷更新迭代,難以滿足冷數據存儲的需要。

DNA存儲走向實用化仍面臨很多挑戰。元英進認為,眼下的突破可能還只是冰山一角,「技術進步需要十年磨一劍的耐心,還需要一點運氣。」

中青報·中青網記者 胡春艷 通訊員 趙暉 來源:中國青年報

來源:中國青年報

科學分類資訊推薦

光博會將於5月15日在光谷啟幕,全球近百項最前沿技術創新成果集中亮相 - 天天要聞

光博會將於5月15日在光谷啟幕,全球近百項最前沿技術創新成果集中亮相

5月9日,湖北省人民政府召開「第二十屆『中國光谷』國際光電子博覽會」新聞發布會。會上宣布,第二十屆「中國光谷」國際光電子博覽會(以下簡稱光博會)將於5月15日至17日在中國光谷科技會展中心舉行。這是國內光電子信息產業領域專業化程度高、行業地位高、國際化水平高、觀展人數多的頂級盛會之一。大會首次規模化引入境...
科普大篷車進校園 點燃學生科學熱情​ - 天天要聞

科普大篷車進校園 點燃學生科學熱情​

科普大篷車進校園 點燃學生科學熱情通訊員:羅曉萍、徐玲玲 審核:大慶、彥平為普及科學知識,弘揚科學精神,培養學生的科學探索與創新能力,5月8日,武漢市江夏區科學技術協會、江夏區教育局、武漢科技館聯合開展的科普大篷車進校園活動,來到了江夏區金
杜克大學研究:若在工作中使用生成式AI,同事可能會質疑你的能力 - 天天要聞

杜克大學研究:若在工作中使用生成式AI,同事可能會質疑你的能力

IT之家 5 月 9 日消息,據外媒 Neowin 今日報道,美國杜克大學的最新研究指出,儘管 AI 工具能提高工作效率,但像 ChatGPT、Claude 和 Gemini 等工具的使用可能會讓同事和經理認為你的能力不足。這項研究題為《使用 AI 工具會遭遇社交評價懲罰》,已在《美國國家科學院院刊》上刊登(IT之家附鏈接:點此前往)。研究通過四...
Nature Biotechnology | 小身材,大作為:研究人員如何「煉」出超強迷你基因編輯器NovaIscB? - 天天要聞

Nature Biotechnology | 小身材,大作為:研究人員如何「煉」出超強迷你基因編輯器NovaIscB?

引言如果我們可以精確地改寫生命的藍圖,糾正那些導致遺傳疾病的微小錯誤,或者巧妙地調控基因的表達,讓細胞按照我們的意願行事。這不是遙遠的幻想,而是基因編輯技術正在開啟的未來。長期以來,CRISPR-Cas9系統一直是這場革命中最閃耀的明星,它像一把精確的分子剪刀,為研究人員提供了前所未有的力量。然而,就像任何強...
寧波食品接觸材料測試怎麼辦理? - 天天要聞

寧波食品接觸材料測試怎麼辦理?

現代餐飲業和家庭生活中,食品接觸材料作為直接接觸食物的器具,其材質安全性直接影響消費者健康。根據國際食品安全標準,所有可能與食品接觸的材料都必須經過嚴格檢測,以確保不會向食品遷移有害物質。
「太空鯊魚」黑洞被發現:距地球 6 億光年,偏離星系中心 - 天天要聞

「太空鯊魚」黑洞被發現:距地球 6 億光年,偏離星系中心

IT之家 5 月 9 日消息,美國宇航局(NASA)昨日(5 月 8 日)發布博文,報道稱天文學家藉助哈勃太空望遠鏡,發現了一個隱藏在 6 億光年之外的「太空鯊魚」,一個隱秘的超大質量黑洞,質量約為太陽的 100 萬倍。IT之家援引博文介紹,該黑洞不像典型的超大質量黑洞那樣位於星系中心,而是遊盪在星系內部,吞噬任何靠近的恆星...
推進新型研發機構發展 提升創新人才培養效能 - 天天要聞

推進新型研發機構發展 提升創新人才培養效能

研發人員在實驗室研發產品。文丨羅嘉文新質生產力代表先進生產力的演進方向,是由技術革命性突破、生產要素創新性配置、產業深度轉型升級而催生的先進生產力質態。人才既是創新的發起者,也是技術應用的實踐者,是形成新質生產力最活躍的主體。