
引言
大腦是最複雜的器官之一,其功能的調控深受基因和環境的影響。然而,疾病如何影響基因表達,基因表達又如何與大腦疾病的發生髮展相關,至今仍是神經科學領域的核心問題。傳統的基因組研究往往基於整塊腦組織,忽視了不同細胞類型在疾病中的獨特角色,這種「整體視角」可能掩蓋了細胞特異性基因表達的細微變化和關鍵機制。1月10日Nature Genetics的研究報道「Cell state-dependent allelic effects and contextual Mendelian randomization analysis for human brain phenotypes」,研究人員首次從單細胞層面對基因調控與腦疾病的關聯進行了深入剖析,試圖揭示疾病背景下基因表達的動態變化及其對腦部健康的影響。
該研究通過對391名捐獻者(包括208名腦病患者和183名健康對照者)的腦組織樣本進行單核RNA測序(snRNA-seq),共檢測了234萬餘個細胞的基因表達特徵,發現了與基因變異相關的13,939個基因表達調控位點(eQTLs)。研究揭示了這些基因調控作用在不同疾病狀態和細胞類型中的顯著差異性。例如,有些基因在阿爾茨海默病(AD)或帕金森病(PD)患者的特定細胞類型中表達顯著變化,這種「疾病依賴性基因效應」為理解腦疾病的致病機制提供了新的線索。此外,該研究進一步採用孟德爾隨機化分析(Mendelian Randomization, MR),在未受疾病影響的健康大腦樣本中,確定了140個可能與腦疾病相關的因果性基因,為未來藥物靶點開發和診斷標誌物研究奠定了基礎。
該研究不僅提出了更精準解讀基因變異與腦疾病關聯的策略,還為探索大腦疾病的早期干預和精準治療提供了啟發。通過將單細胞技術與遺傳學分析相結合,研究人員正在逐步揭開基因、細胞與疾病之間的複雜網路,助力破解腦疾病這一醫學難題。

探索大腦與基因的複雜關係
大腦疾病研究的現狀:從整體視角到單細胞解析的轉變
大腦是最複雜的器官,其結構與功能的異常直接導致多種神經系統疾病,如阿爾茨海默病(Alzheimer's Disease, AD)、帕金森病(Parkinson's Disease, PD)以及多發性硬化(Multiple Sclerosis, MS)。長期以來,研究人員致力於探索這些疾病的遺傳基礎。然而,傳統方法多基於「整體組織」層面的分析,這種視角雖然揭示了一些重要的基因和通路,卻無法反映不同細胞類型在疾病發生中的特異性作用。例如,神經元與小膠質細胞在阿爾茨海默病中可能扮演截然不同的角色,但整體組織分析會將這些信號「稀釋」,無法精確定位關鍵的致病機制。
近年來,單細胞RNA測序(scRNA-seq)技術的興起為這一難題提供了全新解決方案。通過解析單個細胞的基因表達,研究人員得以捕捉不同細胞類型的獨特基因調控模式,為理解大腦疾病提供了前所未有的細膩視角。該研究正是基於這一技術,從391名捐獻者的腦組織樣本中,分析了超過234萬個單細胞的基因表達,為破解疾病背後的遺傳機制打開了新的大門。
基因調控的關鍵作用:eQTL(表達數量性狀位點)的重要性
基因調控是決定細胞功能的核心,而eQTL(表達數量性狀位點)是揭示基因調控的重要工具。eQTL指的是單核苷酸多態性(SNP)與基因表達水平之間的關聯,它能夠幫助研究人員定位哪些基因受到遺傳變異的影響。在大腦疾病中,eQTL的作用尤為突出,因為這些遺傳變異往往通過影響特定基因的表達,進而改變大腦的結構和功能。
該研究中,通過分析八種大腦細胞類型(包括興奮性神經元、抑制性神經元、小膠質細胞和星形膠質細胞等),研究人員發現了13,939個eQTL位點,並進一步證明了這些位點中16.7%至40.8%存在疾病依賴性效應。換句話說,這些位點的調控作用在特定疾病狀態下會發生顯著變化。這樣的發現不僅凸顯了eQTL在揭示基因調控與疾病關聯中的重要性,也進一步表明,僅依賴整體組織數據可能導致對病因機制的誤判。
為什麼需要健康大腦樣本?:疾病樣本中反向因果關聯的挑戰
儘管分析疾病樣本能夠提供重要線索,但疾病狀態本身會對基因表達產生深遠影響。這種影響可能掩蓋真正的因果關係,甚至導致「反向因果」的錯覺。例如,阿爾茨海默病患者大腦中某些基因的表達可能是疾病的結果,而非致病原因。這種現象使得通過分析疾病樣本來識別因果基因充滿挑戰。
為了克服這一問題,該研究引入了183例完全健康、無腦疾病病史的對照樣本,這些樣本在死亡後經神經病理學檢查證實為正常。這一策略的獨特性在於,通過排除疾病干擾,研究人員能夠更精準地捕捉基因與腦功能的真實關聯。例如,在健康樣本中,研究人員發現了91個在混合數據集中無法檢測到的eQTL位點,為探索因果性基因提供了寶貴的資源。
單細胞RNA測序:揭示細胞特異性基因調控
該研究以391名捐獻者的大腦組織為基礎,其中包括208名有神經系統疾病病史的患者和183名完全健康的對照樣本。所有樣本均經過嚴格的神經病理學檢查,以確保數據的準確性和可靠性。
研究團隊對這些樣本進行了單核RNA測序(snRNA-seq)分析,共獲取了234萬多個單細胞的基因表達數據。這一龐大的數據集包含了從神經元到非神經元細胞的多種細胞類型,其獨特性在於能將基因表達的變化精確定位到具體細胞類型中。此外,研究使用了嚴格的質量控制方法,包括去除低質量細胞、標準化數據和細胞類型注釋,從而確保分析結果的可靠性。

研究設計與eQTL分析(Credit:Nature Genetics)
a. 研究設計的概述(Overview of study workflow)
樣本收集與測序:從391名捐獻者中獲取腦組織樣本,包括208名患有神經系統疾病的患者(如阿爾茨海默病、帕金森病)和183名健康對照者。對這些樣本進行了單核RNA測序(snRNA-seq),涵蓋多種腦細胞類型。
eQTL分析:通過基因型和基因表達數據的結合,識別每種細胞類型的cis-eQTL(表達數量性狀位點),以揭示遺傳變異如何調控基因表達。
數據驗證與整合:通過MetaBrain(人類腦組織RNA測序數據集)驗證單細胞cis-eQTL,並將結果與偽散裝組織(pseudobulk)數據進行比較,分析單細胞數據的獨特性和優勢。
b. 每種細胞類型的總eGenes與特異性eGenes
總eGenes數量(深色柱狀圖):興奮性神經元(excitatory neurons)和星形膠質細胞(astrocytes)擁有最多的eGenes,分別超過5,000和4,000個,而小膠質細胞和少突膠質細胞的總eGenes數量相對較少。
細胞類型特異性eGenes(淺色柱狀圖):某些細胞類型(如小膠質細胞)具有較高比例的特異性eGenes,表明其基因調控具有較強的細胞類型依賴性。
c. 單細胞cis-eQTL的驗證(與MetaBrain數據的對比)
研究將單細胞cis-eQTL結果與MetaBrain數據進行驗證,以評估重複性(replication)和方向一致性(directionality):
重複性(x軸):反映了在MetaBrain中能夠檢測到的單細胞cis-eQTL比例,不同細胞類型的重複性差異顯著。
方向一致性(y軸):指相同cis-eQTL在MetaBrain中的調控方向是否與單細胞數據一致(例如,正相關或負相關)。
d. 單細胞eGenes與pseudobulk eGenes的重疊
通過將單細胞數據的基因表達計數聚合,模擬出pseudobulk數據,研究比較了單細胞eGenes與pseudobulk eGenes的重疊:
單細胞特異性:許多eGenes僅在單細胞分析中可檢測到,這種特異性在小膠質細胞和星形膠質細胞中尤為顯著。
重疊部分:儘管單細胞分析能夠捕獲更多特異性信號,但部分eGenes在單細胞與pseudobulk數據中均可檢測到,表明pseudobulk分析對某些常見調控信號仍有一定捕獲能力。
這一比較強調了單細胞分析在解析細胞特異性調控網路中的獨特價值,同時也表明pseudobulk組織分析在某些場景下的補充作用。
細胞類型的多樣性:從興奮性神經元到少突膠質細胞
大腦由多種類型的細胞組成,各自扮演著不可或缺的角色。該研究覆蓋了八種主要的細胞類型,包括興奮性神經元、抑制性神經元、星形膠質細胞、小膠質細胞、少突膠質細胞(Oligodendrocytes)、少突膠質前體細胞(OPCs)、內皮細胞和周細胞(Pericytes)。這種細胞類型的多樣性使得研究能夠捕捉到不同細胞在基因調控上的差異性。
例如,興奮性神經元和抑制性神經元分別在大腦信號傳遞中發揮著激發和抑制作用,而星形膠質細胞則負責提供能量支持和維持神經元的功能環境。此外,小膠質細胞作為大腦的「免疫衛士」,在神經炎症和疾病過程中具有關鍵作用。通過對這些細胞類型的單獨分析,研究發現,不同細胞類型中的基因調控模式具有顯著差異,這種差異為理解大腦疾病的多維機制提供了重要線索。
亮點:從500萬SNP到13,939個基因調控位點的發現
該研究使用了超過500萬個單核苷酸多態性(SNP)位點的數據,以探索基因調控與表達水平之間的關聯。在八種細胞類型中,研究共發現了13,939個基因調控位點(eQTL),涵蓋了30,027個eGenes(調控基因)。其中,約39%的基因僅在一種細胞類型中展示出調控作用,這進一步說明了單細胞解析的必要性。
研究還發現,eQTL的分布與基因轉錄起始位點(TSS)呈顯著富集關係,特別是在小膠質細胞和星形膠質細胞中,這種富集現象尤為明顯。此外,通過與大規模的腦皮層組織數據進行比較,單細胞數據額外識別出了4,898個新的eGenes,顯示了單細胞技術在解析複雜基因調控關係中的獨特優勢。
值得注意的是,這些發現並不僅僅依賴於龐大的樣本量。研究團隊應用了線性混合效應模型(Linear Mixed Effects Model),在剔除疾病狀態和其他臨床變數的干擾後,確保了基因表達與調控關係的真實可靠性。例如,某些與神經退行性疾病密切相關的基因,僅在特定細胞類型中展現了調控作用,這為進一步探索疾病機制和靶向治療提供了關鍵依據。
疾病如何改變基因調控?
疾病依賴性基因效應的揭示:阿爾茨海默病、帕金森病和多發性硬化的例子
基因表達的調控不僅由遺傳因素決定,還深受疾病狀態的影響。該研究發現,不同大腦疾病對基因調控的影響存在顯著的細胞特異性。例如,研究識別出高達40.8%的表達數量性狀位點(eQTLs)在疾病狀態下表現出顯著的疾病依賴性效應。這意味著,同一基因的調控作用可能因患者是否患有某種疾病而截然不同。
以阿爾茨海默病(Alzheimer』s Disease, AD)為例,rs117934759這一單核苷酸多態性(SNP)在小膠質細胞中調控PTPN12基因的表達。在健康樣本中,PTPN12的表達較為平穩,但在AD患者中,其調控效應顯著增強(P值=1.11×10⁻¹⁰)。類似地,在帕金森病(Parkinson』s Disease, PD)和多發性硬化(Multiple Sclerosis, MS)中,也觀察到了獨特的疾病依賴性調控模式。例如,rs7932358位點在少突膠質細胞中調控ARHGAP20基因的表達,在PD和MS患者中均表現出顯著的調控增強效應。這些發現表明,大腦疾病不僅改變了基因的表達水平,還顯著改變了遺傳變異對基因表達的調控方式。
細胞類型與疾病的特殊關係:小膠質細胞在阿爾茨海默病中的重要性
不同細胞類型在疾病中的作用各不相同,其中小膠質細胞的特殊性尤為突出。該研究顯示,小膠質細胞在阿爾茨海默病的遺傳調控中扮演著核心角色。具體而言,與AD相關的BIN1、RASGEF1C和PICALM基因的調控作用在小膠質細胞中表現尤為強烈。這些基因在健康樣本中的調控作用相對較弱,但在AD樣本中,其eQTL效應顯著增強,甚至對疾病風險的貢獻超過了其他細胞類型。
小膠質細胞的這種「敏感性」可能與其作為大腦免疫系統核心的角色有關。在AD患者中,小膠質細胞的基因調控不僅涉及炎症反應,還可能直接影響神經元的生存和功能。例如,BIN1基因的表達調控增強被認為與澱粉樣蛋白病理的加速累積密切相關。這種發現強調了深入研究特定細胞類型在疾病中的遺傳調控作用的重要性,為未來靶向小膠質細胞的精準治療提供了理論依據。
數據背後的意義:疾病樣本調整仍不足以消除偏差
傳統上,研究中常採用混合疾病和健康樣本的方式,通過統計方法對疾病狀態進行調整。然而,該研究發現,這種方法難以完全消除疾病對基因調控的深遠影響。例如,某些疾病依賴性調控效應在混合數據中會被顯著削弱甚至掩蓋。以rs60935857位點調控ZNF880基因為例,在興奮性神經元中,其調控效應在帕金森病和對照組中有顯著差異(P值分別為2.24×10⁻⁶和2.60×10⁻¹⁵)。即使調整了疾病狀態,這種差異依然顯著,說明疾病本身已深刻影響了基因調控的動態過程。
這些發現凸顯了健康樣本在研究中的重要性。通過分析183個無神經系統疾病病史的健康樣本,研究團隊能夠更精準地揭示基因與疾病之間的因果關係。
孟德爾隨機化:探尋因果基因與疾病的關係
健康樣本的獨特價值:183個健康樣本中的91個新發現
在研究基因與疾病的因果關係時,健康樣本提供了獨特的優勢。該研究通過183個無神經系統疾病病史、經神經病理學檢查證實健康的大腦樣本,揭示了疾病狀態對基因調控的干擾作用,並發現了91個此前未在混合樣本中檢測到的新的基因調控位點(eQTLs)。這些新增發現強調了排除疾病狀態干擾的必要性。
例如,PEX13基因在興奮性神經元中調控的重要性,只有在健康樣本中得到明確體現。在混合數據集中,其共定位信號(colocalization signal)較弱(PP.H4=0.08),但在健康樣本中顯著增強至PP.H4=0.87。這種顯著差異表明,疾病狀態可能掩蓋了關鍵因果基因的作用,而健康樣本的分析有助於揭示這些被疾病狀態「隱藏」的因果關係。
因果基因的識別:140個基因-性狀關聯的驗證
通過健康樣本,研究團隊採用孟德爾隨機化(Mendelian Randomization, MR)方法,驗證了140個基因-性狀關聯,為探索複雜疾病的遺傳機制提供了堅實的科學依據。這些因果基因與26種中樞神經系統(CNS)性狀存在顯著關聯,包括阿爾茨海默病(AD)、帕金森病(PD)和智力水平等。
值得注意的是,這些因果關聯不僅限於單一細胞類型。例如,EGFR基因在星形膠質細胞中的表達與阿爾茨海默病風險顯著相關(MR P值=2.35×10⁻⁹),其效應方向表明基因表達的增加會提高疾病風險。此外,研究發現大多數基因-性狀關聯(81.9%)僅在特定細胞類型中顯現,而13個基因在多種性狀中具有廣泛關聯,提示這些基因可能在多種疾病或性狀中扮演關鍵角色。
EGFR基因在阿爾茨海默病中的雙重角色
EGFR(表皮生長因子受體)基因是該研究的一個亮點案例,其在阿爾茨海默病中的雙重角色引發了廣泛關注。MR分析表明,EGFR基因表達的增加顯著提高了AD的發病風險(效應值β=0.14)。這項發現與已有研究一致,支持了EGFR可能通過炎症或細胞增殖途徑加劇AD病理的觀點。
更為重要的是,EGFR的作用並不僅限於AD。在星形膠質細胞中,其基因調控也可能影響其他神經系統性狀,例如認知能力和大腦體積的變化。這種跨性狀的影響提示,EGFR可能是一個潛在的治療靶點。此外,由於EGFR信號的增強在健康樣本中表現得尤為明顯,這也表明靶向EGFR的治療可能具有疾病預防和干預的潛力。
新的研究思路:基因、細胞與疾病的交叉點
健康與疾病樣本的互補作用:從病理學到預防醫學
傳統的疾病研究主要聚焦於病理樣本,以探討疾病狀態下的基因調控變化。然而,疾病樣本的基因表達往往受到病理過程的深遠影響,這種複雜性可能掩蓋真正的致病機制。該研究通過結合健康與疾病樣本的互補分析,不僅揭示了疾病狀態下的特異性變化,還為預防醫學提供了新的視角。
例如,在健康樣本中,研究發現了一些潛在的保護性基因調控模式,這些基因可能在疾病早期階段發揮關鍵作用。以阿爾茨海默病(AD)為例,某些基因在健康小膠質細胞中的調控效應與疾病風險呈負相關,這提示這些基因可能有助於延緩病理進程。通過深入研究這些基因及其調控網路,研究人員有望開發出更有效的早期干預策略,從而推動從病理學到預防醫學的轉變。
多維度整合的潛力:單細胞與大規模數據結合的優勢
單細胞RNA測序(scRNA-seq)技術為揭示細胞特異性基因調控提供了前所未有的解析度,但其樣本規模相對較小,可能限制了某些稀有效應的發現。該研究通過將單細胞數據與大規模基因組關聯研究(GWAS)和體細胞全基因組測序(WGS)數據相結合,充分挖掘了多維數據的潛力。
這種整合的優勢在於,它能夠將GWAS中識別的疾病相關位點與單細胞數據中的特定細胞類型關聯起來。例如,研究將GWAS數據中的AD風險位點與小膠質細胞特異性基因調控效應相結合,成功識別了與炎症調控相關的多個新靶點。這種策略不僅提高了研究的統計效能,還顯著拓展了單細胞技術的應用範圍,使得稀有變異和細胞特異性效應的研究成為可能。
此外,通過整合不同數據類型,研究能夠更全面地理解基因、環境和細胞微環境之間的複雜相互作用。例如,該研究發現,星形膠質細胞中的特定調控網路可能通過與環境因素(如代謝應激)的交互,影響阿爾茨海默病的發病風險。這種發現為多維度數據整合的研究框架提供了範例。
應用前景:藥物靶點開發與生物標誌物識別
該研究的結果為藥物靶點的開發和生物標誌物的識別提供了重要參考。例如,EGFR基因的發現不僅明確了其在阿爾茨海默病中的關鍵作用,還提示了靶向EGFR的藥物可能具有多種適應症潛力。此外,研究中識別的140個因果基因和數千個特定細胞類型的eQTLs,為未來的藥物開發提供了豐富的候選分子。
在生物標誌物方面,健康樣本中發現的保護性基因調控模式有望用於疾病的早期診斷和風險預測。例如,小膠質細胞中與阿爾茨海默病風險負相關的基因可作為潛在的血清或腦脊液標誌物,用於識別高危人群或監測治療效果。這種從基因調控網路到臨床應用的轉化研究,將為精準醫學的發展提供強有力的支持。
從細胞層面精細剖析遺傳調控網路到全面探索疾病機制,該研究為神經科學領域開創了新篇章。單細胞技術的引入,不僅讓我們看得更清、更深,也為攻克複雜的大腦疾病帶來了新的希望。
參考文獻
Haglund, A., Zuber, V., Abouzeid, M. et al. Cell state-dependent allelic effects and contextual Mendelian randomization analysis for human brain phenotypes. Nat Genet (2025). https://doi.org/10.1038/s41588-024-02050-9
責編|探索君
排版|探索君
轉載請註明來源於【生物探索】
聲明:本文僅用於分享,不代表平台立場,如涉及版權等問題,請儘快聯繫我們,我們第一時間更正,謝謝!
End