人類的基因,可以被「申請專利」嗎?

Hello 大家好,今天的文字來自 B 站主頁「微基因の人類觀察社」社員傑夫!

相信不少人都聽過人類基因組計劃——畢竟這可是與曼哈頓原子彈計劃、阿波羅登月計劃,並稱為人類科學史上的三大工程之一,我們中國也曾參與其中 1% 的基因組測序工作。

當年的人類基因組測序,舉全球 6 個國家20 個研究所之力,耗資超 30 億美元,足足花了13 年才完成;而現在你只用花個千來塊、不出半月,就能得到自己的全基因組測序報告。

那麼你或許會好奇:在這一切的背後,有什麼秘密?

等不及的朋友,點擊下面小程序卡片,可直接跳轉觀看視頻👇

下面是本期視頻的圖文稿,不方便/不想看視頻的朋友,歡迎繼續往下解密~

1953 年,DNA 雙螺旋結構的發現,將基因組學的研究深入到了分子層面。

雖然在你每個直徑為幾微米的細胞核中,只有 46 條染色體;但組成染色體的、這些間距僅 0.34 納米的鹼基對,卻足足有超 30 億個

如此龐大的數量和微小的尺寸,使得想一睹基因組全貌的科學家們,在很長一段時間裏都無從下手。

直到二十年後,生化學家弗雷德里克·桑格,開創性地發明出了第一代基因組測序技術,即「雙脫氧鏈終止法核酸測序技術」,又稱「Sanger 測序」

弗雷德里克·桑格

這是一種構思堪稱絕妙的測序方法。

眾所周知,在 DNA 自我複製的過程中,DNA 解旋酶會解開 DNA 雙螺旋結構,使之成為單鏈 DNA。

以單鏈 DNA 為模版,DNA 聚合酶會將 4 種類型的遊離脫氧核苷酸(dNTP):A、T、C、G,按照鹼基互補配對原則進行拼接,形成一條全新的單鏈 DNA。

桑格巧妙地利用了這一過程,將與脫氧核苷酸(dNTP)僅有一個羥基區別的雙脫氧核苷酸(ddNTP),加入到了 DNA 合成的反應中。

一旦這些有「缺陷」的 ddNTP 被結合到 DNA 新鏈中,後續的鹼基拼接就會被終止。

而這些 ddNTP 被結合到 DNA 新鏈的位置是隨機的, 也就是說,如果我們加入的 ddNTP 都只攜帶同一種鹼基(如 A),那麼就會得到許多長短不一,但起始位置相同,且最後一個鹼基(A)已知的 DNA 片段。

而通過類似的含不同鹼基的 ddNTP 的實驗,我們還能得到其它分別以不同鹼基結尾的 DNA 片段,利用凝膠電泳和放射自顯影技術,就能將這些片段按大小分離出來,並逆向組裝出完整的目標 DNA 序列。

這一巧妙的構思,不僅大幅降低了基因組測序的難度,且組裝出來 DNA 序列準確性還極高。

所以,第一代測序技術不僅沒有隨着技術進步被淘汰,反而至今仍是基因變異驗證的金標準。

美國能源部(DOE)意識到了第一代測序技術的潛力,在 1984 年提出了人類基因組計劃。

但以當時的科研和技術,測定 30 億個鹼基對所需要的資源和人才,顯然不是一個小小的能源部能負擔得起的;甚至單個國家都很難給出這麼多資源在這一件事上,所以很長一段時間都沒什麼實質性進展。

時間來到 1987 年,世界上第一台商用熒光自動測序儀 ABI 370A 問世。

它在 Sanger 測序法和熒光標記法的基礎上,用不同顏色的熒光,標記含 4 種不同鹼基的 ddNTP,來配合毛細管電泳,提高了測序速度。

這台機器的出現,迅速成為了行業的標杆,並推動了測序效率更高的高通量測序儀的開發。

次年,大名鼎鼎的沃森被美國國家衛生研究院(NIH)委任為人類基因組計劃的副主任。

有了市場的刺激,和「DNA 之父」的背書,NIH 和 DOE 終於成功爭取到了 30 億美元的資金支持。

1990 年,人類基因組計劃正式啟動英、法、德、日、中各國隨後也加入了這項龐大的計劃。

我們微基因的股東華大基因,當時就曾代表國家出席了這場盛會。

可誰也沒想到,這場集結了 6 國頂級科學家、耗資巨大的的人類基因組計劃,卻差點被一個只有他們十分之一預算的科學鬼才狠狠打臉。

就在人類基因組計劃正式開始沒多久的 1992 年,原本被用來當招牌的沃森卻被 NIH 踢出了局。

原因是 NIH 想要將他們測定出來的一段 cDNA 申請專利,卻遭到了沃森的強烈反對,他認為所有跟人類基因有關的知識,都應該跟全人類共享。

儘管最後 NIH 申請專利失敗,但這卻給了當時負責專利申請案的克雷格·文特爾很大啟發。

如果他能成功將人類基因組成果變為專利,那麼以後所有跟人類基因組有關的研究、應用都要給他交一筆專利費,「錢途」簡直一片光明。

於是,有了明確目標的文特爾,就把「批判」的目光投向了當時進展緩慢的測序工作。

當時,人類基因組計劃是基於「克隆重疊群法」策略進行的。

簡單來說,就是要先將人全基因組劃分為大片段,並標記其在染色體上的位置、順序。

各國科學家們拿到這些大片段後,需要先用細菌人工染色體(BAC)構築出足夠數量的克隆群,再分別對這些克隆群隨機打碎、測序、組裝回完整序列。

最後,還得等所有大片段都測序、組裝完成後,才能按照一開始的分段順序,將它們拼接成完整的基因組。

因此,這樣一套流程下來,又是各種標記、又是細菌培養,還得分門別類的測序,花費的時間不長就怪了。

文特爾向 NIH 建議,改用他發明的鳥槍法」測序,可以更快。

簡單來說,他將整個基因組直接隨機打碎成大量小片段,再進行測序。測得的序列叫做讀段(reads),根據這些讀段之間重疊的部分,將其正確地拼接起來,重建原始的 DNA 序列。

為了確保有足夠的讀段能正好能覆蓋你的全基因組,就需要儘可能地增加你每個基因被檢測到的次數。

而你每個基因平均被測序的次數,就叫做測序深度,一般用 x(乘數)來表示。

根據大家小學二年級都會(?)的 Lander-Waterman 公式,如果想要確保這些讀段能覆蓋目標 DNA 序列的 99.99%以上,測序深度起碼要在 9.21x 以上。

但可惜,當時 NIH 的科學家們並沒有接納文特爾的建議,氣的他直接炒了領導魷魚出來單幹。

1998 年,文特爾創辦了塞雷拉基因組公司(Celera Genomics),決定以一己之力挑戰 6 國的人類基因組計劃。

為了兌現給投資人的承諾,他甚至在企業創辦的第二年,就想將已完成測序的 6500 個人類基因申請專利。

不過,這樣肆意妄為的舉動也引起了全球的輿論,「嚇得」時任美國總統的克林頓趕緊出來聲明:

「人類基因組數據不允許專利保護,且必須對所有研究者公開。」

因此,文特爾不僅沒能成功申請到專利,還讓當時剛成為資本寵兒的塞雷拉的股價應聲暴跌。

然而,就算掙錢無望,文特爾還是成功為自己掙下了一口氣。

因為他的測序速度實在是太快了。

6 國花了 8 年時間才完成了 5% 的測序任務,但在克林頓的撮合下,重新參與了人類基因組計劃的文特爾,卻在短短 3 年時間裏,就將人類基因組計劃完成了 90%。