摘要
為實現調強放療治療鼻咽癌患者的更好治療方案和隨訪評估設計,需要一種準確的生存期預測算法(PFS)。我們建議使用深度學習方法開發鼻咽癌患者在放療治療後的PFS預測模型,並與傳統的紋理分析方法進行比較。151名鼻咽癌患者被納入這項回顧性研究。獲取T1加權、質子密度和動態增強磁共振(MR)圖像。
檢測五個基因(HIF-1α、EGFR、PTEN、Ki-67和VEGF)的表達水平和EB病毒的感染。殘差網絡被訓練來從MR圖像預測PFS。使用線性回歸模型將輸出和患者特徵結合起來,以提供最終的PFS預測。將預測精度與傳統的紋理分析方法進行了比較。將深度學習輸出與HIF-1α表達和EP stein-Barr感染相結合的回歸模型提供了最佳的PFS預測準確性,高於結合了質地分析和HIF-1α表達的回歸模型。
深度學習方法不需要手動繪製感興趣的腫瘤區域。使用深度學習結合患者特徵的MR圖像處理可以為鼻咽癌患者提供準確的PFS預測,並且不依賴於紋理分析方法所需的特定核或感興趣的腫瘤區域。
導言
放療與不同療法的組合可以提高患者存活率,例如,艾伏磷酰胺靶向低氧腫瘤細胞並導致增強的放射治療反應;尼妥珠單抗靶向表皮生長因子受體(EGFR)並抑制下游EGFR信號傳導。化療和放療的結合可以進一步提高生存率,並有助於非轉移鼻咽癌的局部區域控制。因此,它已成為最常用的鼻咽癌治療方法。
雖然新療法的發展和化療策略的優化反映了鼻咽癌的有希望的治療方向,但對鼻咽癌患者的治療反應仍令人不滿意,尤其是對晚期鼻咽癌患者。晚期鼻咽癌患者5年生存率在38%到63%之間,而接受放療治療的鼻咽癌患者在5年生存率在59%到83%之間。更好的治療方案和隨訪評估設計需要準確的無進展生存期(PFS)預測方法。
最近,深度學習方法被廣泛用於醫學圖像處理。基於多個卷積層、激活層和採樣層的串聯,深度學習方法可以在多個尺度上提取特徵,而不需要ROI或特徵庫。此外,深度學習方法可以提供對PFS的直接預測,而不需要依賴於某些生存模型。
因此,它們有望應用於PFS預測任務。雖然神經網絡已經被用於將特徵集成到一個PFS預測中,但是基於深度學習的MR圖像處理還沒有被應用於鼻咽癌患者的PFS預測。在這項研究中,我們提出了一個使用殘差卷積神經網絡的PFS預測模型,結合MR圖像、腫瘤分期和基因表達信息(HIF-1α、EGFR、PTEN、Ki-67、VEGF和EB病毒)來預測無轉移鼻咽癌患者的PFS。我們在這裡報告了這種深度學習方法的PFS預測精度以及與紋理分析方法的比較。
材料和方法
1.患者信息如表所示
2.圖像分析
所有圖像序列都與PD圖像配准,PD圖像具有基於地標的最高平面分辨率(0.46*0.46mm)。使用ITK快照。該過程由具有2年經驗的臨床放射科醫師執行,並由具有11年經驗的高級放射科醫師驗證。放射科醫生對臨床和組織病理學信息一無所知。典型的T1w、PD以及增強前後的DCE圖像如圖所示。
所有受試者被隨機分為兩組:訓練組(N=75)和測試組(N=76).然後執行兩種圖像處理方法,深度學習和紋理分析,來預測PFS。對於深度學習PFS預測,我們實施了一個18層2D殘差網絡,其中三個MR模態的圖像在通道維度上級聯。
使用線性回歸模型將每個切片的深度神經網絡輸出組合成一個單一輸出。對於紋理分析PFS預測,使用金字塔組學工具箱從每個3D MRI體積中提取120個紋理特徵。使用最小絕對收縮和選擇算子(LASSO)回歸選擇要素。使用多變量風險回歸模型將選擇的特徵結合起來。深度神經網絡和紋理分析模型的細節在附錄中描述。
3.圖像分析輸出和患者特徵的組合
為了將患者特徵與來自紋理分析方法的風險預測或來自深度學習方法的PFS預測相結合,以PFS為目標,在相同的訓練數據集上訓練線性回歸模型,並在測試數據集上進行測試。構建了兩個回歸模型:一個具有紋理分析輸出,另一個具有深度學習輸出。
本研究考慮了9個患者特徵:HIF-1α表達水平、EGFR表達水平、Ki-67表達水平、PTEN表達水平、VEGF表達水平、EB病毒感染水平、患者年齡、性別和腫瘤分期。這些患者特徵被逐步選擇,並通過在似然比檢驗中最小化Akaike信息而分別包含在兩個回歸模型中。
4.統計分析
對以下五個模型的性能進行了評估:來自MR圖像的深度學習預測、來自MR圖像的紋理分析預測、僅患者特徵、具有患者特徵的深度學習預測以及具有患者特徵的紋理分析預測。Spearman相關性檢驗用於檢驗實際PFS和根據這些模型估計的PFS之間的相關性。計算和諧指數以測試所提出的方法是否能夠提供準確的相對PFS。繪製1年PFS的受試者操作曲線,並計算曲線下面積值,以評估圖像處理方法的區分能力。
選擇最佳臨界值以最大化靈敏度和特異性。此外,我們根據每種圖像處理方法將測試數據集分為「高風險」和「低風險」組。最後,進行對數秩檢驗以確定臨界值並比較這兩組的存活曲線。所有統計分析均使用R統計軟件和ap<0.05的值被視為顯著。
結果
從紋理分析中提取的19個特徵被選擇用於多變量危險回歸模型。表中列出了這些特徵值和PFS之間的相關性。在試驗隊列中,在實際PFS和預測PFS之間,回歸模型的Harrell C指數為0.66。對於1年PFS分類,受試者操作曲線(ROC)的曲線下面積(AUC)為0.72。對數秩檢驗顯示高危組和低危組之間存在顯著差異。
深度學習方法在PFS預測中比紋理分析方法表現得更好。在實際PFS和預測PFS之間的測試隊列中,決定係數是0.44(p < 0.001, F= 58.84)而哈勒爾的C指數是0.80。對於1年PFS分類,ROC曲線的AUC為0.85。對數秩檢驗顯示高風險組和低風險組之間存在顯著差異。
在9個患者特徵中,HIF-1α表達與PFS呈負相關;Ki-67表達與PFS呈負相關;EB病毒感染與PFS呈負相關。EGFR表達、PTEN表達、VEGF表達、臨床分期、患者年齡和性別與PFS無顯著相關性(p分別= 0.41、0.16、0.38、0.79、0.26和0.89)。
在低PFS組(PFS<12個月)和高PFS組(PFS≥12個月)之間,獨立樣本t-檢驗顯示HIF-1α的表達有顯著差異,Ki-67表達,以及EB表達。EGFR沒有顯著性差異,PTEN表達(低PFS:0.97 0.16,高PFS:0.94 0.24p= 0.30),VEGF表達(低PFS:0.64±0.63,高PFS:0.84±0.82,p= 0.11),臨床分期(p= 0.46)、年齡(低PFS:51.78±12.07歲,高PFS:48.85±10.44歲,p= 0.11),以及性別(p = 0.97).
對於PFS的分析與預測,結合風險預測和HIF-1α表達的線性回歸模型提供了最小的Akaike信息。與僅使用MR圖像的風險預測相比,在試驗隊列中,對於1年PFS分類,ROC曲線的AUC從0.72增加到0.76。回歸模型的哈勒爾C指數從0.66提高到0.68。對數秩檢驗顯示高風險組和低風險組之間存在顯著差異。
對於深度學習PFS預測,結合神經網絡輸出、HIF-1α表達和EB感染的線性回歸模型提供了最少的Akaike信息。與僅使用MR圖像的風險預測相比,在試驗隊列中,對於1年PFS分類,ROC曲線的AUC從0.85增加到0.88。回歸模型的哈勒爾C指數從0.80提高到0.82。對數秩檢驗顯示高風險組和低風險組之間存在顯著差異。
作為比較,對於僅使用患者特徵的線性回歸模型,結合HIF-1α表達、Ki-67表達、PETN表達和EB病毒感染的模型提供了最少的Akaike信息。在實際PFS和預測PFS之間的測試隊列中,Harrell的C指數為0.63。對於1年PFS分類,ROC曲線的AUC為0.71。對數秩檢驗顯示高風險組和低風險組之間存在顯著差異。
五個模型的統計分析總結如表:來自MR圖像的深度學習預測、來自MR圖像的紋理分析預測、僅患者特徵、具有患者特徵的深度學習預測、以及具有患者特徵的紋理分析預測。具有患者特徵的深度學習預測提供了最高的哈氏C指數。
對於1年PFS分類,具有患者特徵的深度學習預測提供了最高的AUC,顯著高於具有患者特徵的紋理分析預測,沒有患者特徵的紋理分析預測,患者特徵並不顯著高於深度學習預測。log-rank檢驗表明,具有患者特徵的深度學習預測在低風險組和高風險組之間的差異最大。這些方法的存活可能性隨時間變化的曲線如圖所示。
討論
本研究涉及三種磁共振成像模式:T1w、PD和DCE磁共振成像。所有三種類型的圖像都對風險回歸模型有貢獻。高分辨率T1w和PD圖像可以提供腫瘤形態學信息,而DCE圖像可以提供血管通透性和血流信息。將不同的MR模態添加到模型中可以進一步提高PFS預測精度。
擴散加權成像(DWI)圖像已被證明有助於了解鼻咽癌治療反應,T2加權圖像可用於預測局部複發和遠處轉移。此外,從MR圖像的後處理獲得的定量參數,例如從DCE-MRI或動脈自旋標記圖像獲得的灌注參數和從多重回波梯度反轉圖像獲得的磁化率,也可以反映腫瘤特性並幫助預測PFS。這些模態的特徵與PFS預測模型相結合是有希望的。
我們的研究包括9個患者特徵:5個基因的表達水平、EB感染水平、患者年齡、性別和腫瘤分期。HIF-1α表達、Ki-67表達和EB病毒感染水平與PFS顯著相關。將這些患者特徵添加到PFS預測模型中提高了預測準確性,但這種提高並不顯著。
一個可能的原因是,這些患者特徵可能影響腫瘤的形態和灌注,並進一步影響MR圖像。因此,MR圖像並不獨立於患者特徵。應在更大的臨床隊列中研究MR圖像和患者特徵的相關性分析,以更好地了解這些患者特徵對PFS預測的價值。
這項研究有幾個局限性。首先,受數據大小的限制,入選的患者沒有根據腫瘤分期或類型分成亞組,這可能影響MR圖像和患者特徵與PFS的相關性。構建腫瘤分期或類型特異性PFS預測模型,尤其是晚期PFS的模型,可能有助於治療和患者隨訪的設計。其次,在DCE MRI掃描中,不同MR模態和時間幀之間可能存在運動偽影,影響深度學習和紋理分析圖像處理流水線的性能。
應該開發並應用用於鼻咽區域MR的配准算法來最小化運動偽影。第三,對於DCE MR圖像,切片厚度較大,時間分辨率較低,可能造成特徵丟失。優化的採樣模式和壓縮傳感技術可以加速採集,並最終有助於從DCE MRI提取特徵。第四,受GPU內存的限制,我們實現了一個18層的2D殘差網絡。
增加網絡的深度或將2D網絡改為3D網絡可能有助於進一步提高其性能。第五,這項研究是在一個機構中進行的,只有來自同一台掃描儀的三種磁共振設備。需要從不同的MR系統獲取多中心數據來進一步驗證我們的算法。第六,在這項研究中只獲得了1年的PFS,了解長期存活率和總體無複發存活率對於患者護理非常重要。需要對這些患者進行隨訪,以檢查所提出的算法是否可以應用於3年或5年PFS和總體無複發生存率預測。這些問題需要在進一步的研究中解決。
筆者認為:隨着計算機和圖形處理單元的快速發展,各種先進的圖像處理方法,如紋理分析方法和深度學習方法,已被應用於醫學圖像處理,以解決臨床問題。在本研究中,我們報告了深度學習方法在鼻咽癌PFS時間估計中的性能,以及與基於紋理分析提取的特徵的傳統回歸模型的比較。結果表明,深度學習方法可以提供更準確的PFS預測,並且結合患者基因表達信息可以進一步提高性能。
目前,基於磁共振圖像的鼻咽癌PFS預測主要基於紋理分析。在基於紋理分析的PFS預測模型中,使用來自對比增強T1圖像的特徵的兩個回歸模型實現了0.72和0.75的C指數;結合對比增強T1加權圖像和T2加權圖像特徵的兩個回歸模型實現了0.73和0.79的C指數,一個回歸模型結合了T1加權圖像、對比增強T1加權圖像和T2加權圖像的特徵,獲得了0.74的C指數。與紋理分析方法相比,基於深度學習的MR圖像處理不依賴於內核庫或手動繪製的ROI。
因此,它可以全自動捕捉更多的特徵。在這項研究中,通過用深度學習取代紋理分析,實現了鼻咽癌預測的顯著改善。
總之,深度學習方法對於從MR圖像和患者特徵預測PFS是有前途的。
參考文獻: