在醫療影像AI應用上,英特爾要讓數萬開發者和億萬大眾受益

2022年07月12日04:10:18 熱門 1463
在醫療影像AI應用上,英特爾要讓數萬開發者和億萬大眾受益 - 天天要聞

談到人工智能在醫學影像中的應用,不少業內人認為醫療領域內的約束和障礙還有很多,AI若想落地臨床,會受到數據多樣化、標註複雜化、政策明朗化及詢證理解難等多個問題的限制,目前還很難看到明確的未來。

於是不少企業選擇退步或觀望,即便涉水,也只是淺嘗輒止。

“醫療問題面前,不再分中國美國,也不分科技公司還是醫療公司,這是一個關係到全人類生命健康的話題。在面對這一問題時,不管過程多麼艱辛,一定要有人站出來。” 英特爾中國數據中心雲計算高級技術總監周翔如是說。

在與浙江大學第一附屬醫院、愛爾眼科等多家醫院,以及阿里雲、浙江大學數理學院、浙江德尚韻興圖像科技有限公司、晉弘科技和極視互聯等多家單位及企業共同探索數月後,英特爾已經印證了AI在甲狀腺結節、糖網和黃斑變性等眼底病變醫學影像輔助診斷上的可行性,於是決定加大力度,全力推進AI技術在醫療領域的實踐。

當業內其他公司的醫療團隊把所有精力集中在研發自有產品之際,英特爾認為“授人以魚,不如授之以漁”,一家公司能做的事畢竟有限,如果利用自己百年來積累的技術優勢、平台優勢和行業服務能力,扶持更多的AI醫療創新者,將比一人孤軍奮戰更有意義。

那麼如何“授之以漁”?

經過一番考量,英特爾決定為來自世界各地想用AI解決醫療問題的團隊,提供更強大的硬件平台、更易用的軟件,讓他們更專註解決問題本身,無需考慮軟、硬件限制,從而發揮最大勢能。

最終,英特爾選擇以比賽作為切入點,與合作夥伴啟動了一場有着2887支隊伍參與的天池醫療人工智能大賽,歷時7個月後,於近日正式落下帷幕。

在醫療影像AI應用上,英特爾要讓數萬開發者和億萬大眾受益 - 天天要聞

這次大賽向醫學界公認的難題肺結節早篩發起挑戰。

一、為何選擇從肺結節篩查切入?

此次大賽是英特爾、阿里雲、零氪科技一同發起和支持,是國內第一個醫療人工智能大賽,規模和數據量也在世界範圍內絕無僅有,共有16家國內知名腫瘤醫院為本次比賽提供了脫敏和標註的、近3000例高危患者的低劑量肺部CT影像數據。

之所以選擇肺結節篩查作為“考題”,是因為我國肺癌疾病形勢愈加嚴峻。全國腫瘤登記中心早在2013年發布的《2012年中國腫瘤登記年報》就顯示:截止當時,近30年肺癌的死亡率上升了465%,取代肝癌成為中國首位惡性腫瘤死亡原因。

而且國內有從肝癌識別的業內人士也曾指出,通過對比中、美、英三國的肺癌發生率和死亡率,數據顯示國內肺癌發生率低於英、美,但死亡率卻已超過英、美。這其中的重要原因是,當患者診斷出自身有肺癌後,70%已到中晚期,錯過了最佳診斷和治療時間。

因此肺癌早篩在國內是一件刻不容緩、急需解決的任務。

早篩是減少肺癌死亡率的重要手段,而癌症早期多表現為肺部結節。這些肺部結節的尺寸非常小、對比度低、抑制化高。

過去的篩查工作均由影像科醫生完成,由於每個病人肺部CT的掃描圖片數目超過200層,平均診斷時間在20分鐘以上,當醫生遇到大量病人時,極其耗時、耗力,而且容易漏診。

與此同時,微小肺部結節在影像學的表現易與其他組織或部位產生混淆,如毛細血管、結核、假瘤等,從而打擾到醫生的判斷。

基於這一痛點,影像科急需新的技術來輔助醫生提升診斷效率,這時候人工智能從眾多技術中脫穎。它能從海量醫學影像數據中學習和模仿醫生的診斷“經驗”,在短時間內快速提升診斷能力,輔助醫生減少誤診。

二、行業此前面臨的軟硬件局限與解決方法

雖然人工智能更新迭代迅速,但醫學影像分析作為一個龐大的工程問題,很多工作都得一步步進行,尤其像醫療這種數據形態和特徵較為複雜的行業,它在人工智能鋪助診斷上面臨的難題,也是一個接一個,且彼此之間密切相關:

  • 首先,GPU難擔重負,至強融核卻有獨到優勢

經調查發現,相比而言醫學影像分析更需要3D神經網絡架構的支撐,後者與行業內常見的2D圖像深度神經網絡有着很大不同。

記者了解到,天池大賽參賽隊伍大多採用3D影像數據方案,其模型本身並不大,但每次輸入的數據卻超過常用顯卡的顯存容量。醫療行業內除了3D數據外,還有附帶時序的核磁共振4D數據,它們更加依賴內存,這時GPU在處理3D和4D影像數據時往往面臨吃不消的問題。

要想做出優秀的醫療AI方案,不僅需要狹義上的計算力,同時也要有強大的存儲力做支撐,因此醫療為AI底層設施提出了全新的挑戰。

基於上述情況,英特爾專門為深度學習設計的至強融核處理器的優勢便開始突顯,它就像CPU一樣,可直接讀取內存,單顆能支持和使用的內存容量就高達384GB。

不少參賽隊伍在描述英特爾至強融核處理器時如此形容到:“我們首先要明白 最重要的一點,它是CPU,不是卡。你可以把它理解為一個高性能的、能做深度學習,又能夠直接連內存的CPU產品。”

而在此之前,得益於在人臉識別和常見圖像識別上的顯著優勢,GPU已成為絕大多數開發者們訓練模型的首選。

英特爾中國數據中心雲計算高級技術總監周翔向雷鋒網透露,他在高校經常看到學生辛苦苦苦設計的很多醫學影像分析模型無法在GPU上運行。

為此,學生們不得不降低3D肺部影像數據像素,然後拆分為多個小分塊,再進行一一識別。

這種“妥協”的方式會引發兩大問題:第一,降低像素會丟掉細節信息;第二,分塊識別有可能會產生誤差。

天池大賽冠軍團隊(北京大學LAB2112 )對此也深有體會,隊長鬍志強談到,肺部CT影像分析對存儲要求很高,GPU平台由於受到顯存的限制,要想對CT影像進行較好地分析往往需要多GPU協同甚至多機協同,但這些工程實現起來有一定的難度,尤其是對於諸如Batch Normalization等需要多GPU同步的層來說。

相比之下,至強融核平台可利用大容量內存,能更好地滿足了CT影像分析對內存的要求,同時也不存在多個設備之間同步的問題。

軟件方面,記者得知,通過英特爾的努力,目前大部分常用的深度學習框架都已有了針對CPU的優化版本。但進一步的,英特爾特別針對此次醫療AI大賽的需求,還對自有優化版Caffe框架和算法庫進行了深度定製。通過新增且優化諸如三維卷積層、三維反卷積層、損失函數層等數十個關鍵操作,極大的保證了至強融核平台計算力的充分發揮,再結合該平台自身的存儲力優勢,使之能夠真正有效的支撐三維醫學影像的深度學習應用。

於開發者而言,在至強融核處理器上的開發難度相對更低,雖然它的底層為深度學習的技術,但上層指令集均為X86,而且英特爾提供的部分庫也可把下層進行涵蓋,只要開發者們熟悉傳統CPU上的編程,也能迅速熟悉它。

“很多人喜歡談自己在GPU上的MicroBenchmark有多出色,確實,大家也已習慣拿到影像後先做預處理。但太過看重MicroBenchmark往往會忽略掉預處理之後造成的誤差。因此大家如果想做出一個比較實用的成品,應該把注意力集中更宏觀的任務上,專註解決Solution級別的問題,通過英特爾平台會讓整個目標的實現來得更加簡單,”周翔表示:“所以英特爾希望通過天池大賽給大家提供一個新的思路,讓他們了解到,不管是醫學影像還是高精度視頻分析,你編程的方法、訓練模型的方法,可以不受已有硬件在內存帶寬、容量方面的限制。”

  • 其次,通用深度學習開源框架已無法滿足醫療AI應用需求,更優化的框架是必備利器

硬件平台猶如土地,而土地之上若要豐收,離不開耕地的工具,它們就是軟件框架。

此次大賽,英特爾為深度學習框架Caffe定製了43個超越開源版本的新功能,來支撐選手的模型創新。

由於Caffe抽象級別較高,相比而言,它的性能明顯優於其他框架,但也存在靈活性欠佳的弊病。為此,英特爾針對它在靈活性上缺陷,為其定製了43個新功能,來對醫學影像分析難題提供更好的支持。

同時,英特爾也為天池軟件貢獻了35000行框架代碼和6000行參考模型代碼,為模型訓練保駕護航。結果表明,各隊選手在比賽期間遇到的80%的問題,英特爾事先都有驗證過。

“通過這次比賽積累的經驗,為未來深度學習框架的擴展奠定了一個較好的基礎,後續我們也考慮引入更多的框架。”

至強融核平台相比GPU在醫療影像AI應用上有如此多的優勢,那麼習慣了GPU平台的開發者,又應該如何實現平滑的遷移?

針對這一問題,天池冠軍北京大學團隊也談到,這件事剛開始麻煩,但最終還是成功解決。

“我們先盡量將整個流程分成不同的模塊,這種模塊化的開發方式能使代碼結構更加清晰,各部分功能獨立,方便排查錯誤,從而避免很多問題;我們在第一階段實現PyTorch版本框架時,已經考慮到了複賽的問題,於是將儘可能多的數據處理模塊獨立於深度學習框架之外,用NumPy等庫實現所有操作。

除此之外,開發者團隊也應該多花時間閱讀源代碼,因為我們在第二輪使用的是英特爾針對CPU優化後的Caffe版本,所以相比公版Caffe改變了一些功能,為了能更好的使用這些功能,閱讀源代碼就變得很有必要,同時理解源代碼也能幫助我們在遇到問題時更快地找出錯誤。比如我們在實現過程中,發現一開始使用的網絡初始化方式並沒有針對三維卷積進行處理,於是我們自己修正了初始化方式,使得結果有所提升。”隊長鬍志強向雷鋒網介紹到。

胡志強繼續說道,整個過程中,無論是代碼遷移還是其他重大技術問題,都離不開英特爾技術專家的服務與支持。

“印象最深刻的一次就是在我們使用英特爾優化版Caffe時,經常遇到Segmentation Fault的錯誤,該問題難以排查的地方在於其錯誤不經常復現,也就是說運行代碼的過程中有時會發生錯誤,有時候不會發生,使得我們很難找出錯誤的原因。有天晚上和英特爾團隊反饋了這個問題之後,工作人員很快就開始幫助我們排查問題並且第二天就給了我們回復,產生錯誤的原因是我們使用了一個原址(in-place)操作導致內存溢出。”

英特爾工作人員犧牲自己的休息時間,熬夜幫我們調試代碼,並且在很短時間內找出問題所在,這也從側面反映出他們團隊強大的技術實力。”

而現在,這支年輕的北京大學團隊已經與北大幾家附屬醫院在內的一些醫療機構展開合作,醫學專家們也對他們的系統給予非常不錯的評價。

三、英特爾的醫療AI願景

在本次訪談最後,周翔把英特爾對未來醫療AI的構想,從全社會和個人的角度予以展現:

一直以來,人們對英特爾的認知是一家芯片企業。實際來看,英特爾遠不止研發芯片這麼簡單。正如英特爾CEO科再奇所說,我們是一家以數據為中心的公司。

醫療行業有很多數據猶如還未被正確開發的巨大寶藏,我們希望聯手阿里巴巴、零氪科技這類優秀企業把各行各業的數據盤活。

英特爾特別希望通過這次醫療AI大賽,讓那些真正做醫療的人、擁有數據的人、制定政策的人,能夠看到一個由人工智能支撐的醫療模式是更加高效、更加安全、更具價值的。

我覺得科技公司不能因為政策和監管問題的限制,就選擇觀望,等待政策和監管落實後再行動。相反,我們的企業使命是考量能否通過扶持世界各地的創新者們加速AI技術的落地,讓更多政策制定者和監管機構明顯地感受到大家的創新成果和實際使用結果在不斷進步,從而也間接推動政策的落實,加快全社會對人工智能的認知和認同。

而站在個人角度,作為公司和社會的一個小小個體,最讓我們這些技術從業者感到幸福的事,莫過於自己付出的長期努力,不僅可以造福全世界,也或許能夠切切實實地幫助到自己以及身邊的人。

熱門分類資訊推薦

曾小賢的上司Lisa榕,現實中不僅才貌雙全,還嫁給了CEO - 天天要聞

曾小賢的上司Lisa榕,現實中不僅才貌雙全,還嫁給了CEO

曾小賢的上司Lisa榕,現實中不僅才貌雙全,還嫁給了CEO雖然說《愛情公寓》這部劇在劇情上充滿了爭議,但是一定程度上,這部劇也是很多人的回憶,是伴隨了一代人的青春回憶,而且劇中的很多角色都成為了經典,他們的口頭禪也一直被拿來玩兒梗。
Lisa榕做主持多年沒紅,被陳赫拉進愛情公寓爆紅,如今怎樣了 - 天天要聞

Lisa榕做主持多年沒紅,被陳赫拉進愛情公寓爆紅,如今怎樣了

談到《愛情公寓》這部火爆一時的歡樂喜劇,大家肯定都不陌生。不知道大家是否還記得《愛情公寓》中那個把曾小賢治得服服帖帖的女上司Lisa榕,現實中的她名叫榕榕,和劇中的形象也判若兩人。1981年出生在遼寧瀋陽的榕榕,畢業於上海戲劇學院,後來成為了上海東方傳媒集團有限公司的一名主持人。