中國學者通過病理學圖像信息,解決空間轉錄組基因譜數據噪音問題



隨着技術的進步,空間轉錄組(spatial transcriptomics)成為近年來通量測序技術中的「香餑餑」。


其原因在於空間轉錄組功能上的「一舉多得」,它不僅能提供基因表達譜數據(近似於單細胞測序數據),還可提供測序的位置信息,甚至對應的病理學圖像數據也因其可見。


然而,空間轉錄組技術(尤其是在高分辨率空間轉錄組技術)的基因表達譜數據並不能「拿來就用」,其中還存在着大量噪音。


它們或從低通量測序深度(位於每個測序位點)而來,或來自那些為保存測序位置而實施的額外實驗步驟。這些噪音在研究者們從空間轉錄組數據提取出有價值的信息時,形成了天然的障礙。


為修正空間轉錄組基因表達譜數據中的噪音,近日,美國德州大學西南醫學中心與德州大學阿靈頓分校團隊合作,發明了一種被稱為「Sprod」的方法。他們利用空間位置以及病理學圖像的信息,來解決上述問題。


8 月 4 日, 相關論文以《基於位置和圖像信息的空間轉錄組數據去噪方法》(Sprod for De-noising Spatial Transcriptomics Data Based on Position and Image Information)為題發佈在 Nature Methods 上[1]。



圖丨相關論文(來源:Nature Methods)


該論文的共同第一作者為德州大學西南醫學中心定量生物學研究中心數據科學家王允冠博士、博士後研究員宋冰,論文共同通訊作者為德州大學西南醫學中心定量生物學研究中心王濤助理教授、德州大學阿靈頓分校王莉教授。該論文的其他主要作者還包括西南醫學中心謝陽教授、肖光華教授、王詩丹助理教授。


審稿人對該論文評價道: 「隨着空間測序技術的普及,開發能夠有效處理和分析此類數據集的工具非常重要。Sprod 是一種朝着正確方向發展的新方法。利用空間信息和關係,對空間轉錄組基因表達譜數據降噪尤其具有吸引力。」



圖丨空間解析轉錄組數據中的廣泛噪聲(來源:Nature Methods)


該團隊在空間轉錄組數據中發現,在其病理學圖像和總體轉錄譜中,如果位點之間相似並測序位置相鄰,則其基因轉錄譜會相似。並且,這種轉錄譜相似度與位點間的相似程度成正比。


基於該原理,研究人員使用 Sprod 建立了隱圖模型,利用對不同測序位點的空間距離以及基因表達譜特徵的分析,將測序位點放入到隱圖中。空間轉錄組的表達譜信息以該隱圖為依據流動,從而實現了表達譜數據的降噪。


談及該方法的應用,王允冠表示,「Sprod 可在各類的空間轉錄組技術中廣泛使用,例如 Visium、Slide-Seq、HDST、Seq-Scope 等。分辨率與表達譜數據噪音成正比,即技術類型分辨率高其噪音也越大,因此 Sprod 也在其中發揮更大的價值。」



圖丨用於去噪的空間解析轉錄組數據(來源:Nature Methods)


該團隊首先在模擬數據(simulation data)上對 Sprod 的準確性進行了驗證。


在檢驗數據集上,研究人員生成了一個類似空間轉錄組數據的並且人為加入了噪音的數據。在應用了 Sprod 之後他們發現,在不同的噪音水平上,Sprod 至少去除掉了 85% 的噪音。


「驗證獲得了滿意的結果之後,我們優化了參數,最後把算法在來自各種空間轉錄組技術的數據集上進行驗證和應用。」王允冠說。



圖丨使用經過 sprod 校正的表達數據,細胞間通信的推斷更準確(來源:Nature Methods)


該論文重點在於 Sprod 在真實數據上的應用。研究人員測試了包括 Visium、Slide-Seq、HDST 和 Seq-Scope 等多個平台的數據,發現 sprod 可以在數據降噪的基礎上,增強差異表達分析的可靠性,並且使下游的擬時和細胞通訊分析可以更加真實的反應相應的生物學信息。


王允冠認為,正如 2014 年之後單細胞測序技術和應用「井噴式」的發展一樣,在未來若干年,空間轉錄組技術會是熱門技術。


他說:「Sprod 具有很強的通用性,並且可以校正來自不同來源的數據噪音。因此,Sprod 可以被應用在目前大多數、以及未來可能出現的空間轉錄組技術中。並且,在整個數據分析的初始階段對數據進行預處理,以提高整個數據分析流程的可靠性。」



圖丨王允冠(來源:王允冠)


王允冠大學本科畢業於大連理工大學生物工程系,之後他的碩士和博士階段分別在美國辛辛那提大學學習免疫學,以及生物信息學


此前,他曾在哈佛醫學院系統藥物學實驗室擔任計算生物學家,期間開發了針對重複免疫熒光染色數據的質量檢測和數據分析方法。


加入西南醫學中心後,在與朱浩副教授的合作中,王允冠用單細胞分析結構 2 區幹細胞的基因表達,並開發了組織定位系統圖像分析軟件,以進行大規模的系統圖像處理[2]。通過這些分析,發現了 2 區肝細胞介導肝細胞間的動態平衡。


此外,在與牟平研究組的合作中,他還曾用單細胞轉錄組分析,揭示了 JAK-STAT前列腺癌中誘導細胞向類幹細胞表型和多能性轉化,從而導致藥物抗性的重要作用[3]。


近年來,王濤實驗室(Tao Wang Lab)在計算免疫學方面收穫了系列豐碩成果。王濤教授的研究主要集中在研究免疫受體-抗原結合,單細胞轉錄組與免疫受體序列綜合分析,利用空間轉錄組數據研究免疫學問題等方向。目前,定量生物學研究中心有多個博士後招聘職位(qbrc.swmed.edu/labs/wanglab,qbrc.swmed.edu/labs/xielab,qbrc.swmed.edu/labs/xiaolab),歡迎各專業生物信息學人才加盟。



參考資料:

1.Wang, Y., Song, B., Wang, S. et al. Sprod for de-noising spatially resolved transcriptomics data based on position and image information. Nature Methods 19, 950–958 (2022). https://doi.org/10.1038/s41592-022-01560-w

2.Wei,Y.,Wang, Y. et al. Liver homeostasis is maintained by midlobular zone hepatocytes.Sceinece 371, 6532(2021). DOI: 10.1126/science.abb1625

3.Deng, S., Wang, C., Wang, Y. et al. Ectopic JAK–STAT activation enables the transition to a stem-like and multilineage state conferring AR-targeted therapy resistance. Nature Cancer 3, 1071–1087 (2022). https://doi.org/10.1038/s43018-022-00431-9