讀創/深圳商報記者 袁斯茹
9月14日,「自主創新大講堂」在深圳舉行,本期活動主題為「基於深度學習的圖像復原與增強」,企業代表、專家齊聚,探討行業最新發展。
據悉,活動由深圳市科學技術協會、中國科學院先進技術研究院主辦,深圳市機械人協會、深圳市新一代信息通信產業集群承辦。
計算機視覺是人工智能領域的前沿和焦點,自深度學習算法開創以來,計算機視覺的各個任務都取得了前所未有的突破。圖像復原和增強是經典的底層計算機視覺問題,在4k/8k視頻、AI攝影、超清畫質、AR/VR等領域有廣泛應用。
本次報告,以圖像復原和增強任務為切入點,回顧深度學習算法的發展歷程,闡述算法的優勢與瓶頸,並展示最新的研究成果。本期沙龍主題為「基於深度學習的圖像復原與增強」,活動邀請中科院深圳先進院數字所董超副研究員作題為「圖像超分辨率技術的發展與前景」的報告。同時,特邀深圳市騰訊PCG高級研究員王鑫濤博士,商湯科技高級研究員張佳維博士,分別就圖像復原的退化模型和實際應用進行主題報告和交流。
會上,中科院深圳先進院副研究員董超以圖像超分辨率技術的發展與前景為題進行分享。他表示,自2014年以來,超分辨率技術自可分為六條發展線路,包括超分網絡、視覺超分、真實場景、可調復原、可解釋性以及超分比賽。
商湯科技研究員張佳維則表示,隨着深度神經網絡在計算機視覺中的運用越來越廣泛,越來越多的深度神經網絡結構也被用來解決退化圖像恢復問題,但是他們往往忽略了退化模型。「將深度神經網絡與傳統退化圖像恢復算法結合,才能更好地恢復圖像。」他說。
騰訊研究員王鑫濤分享道,近幾年,圖像復原,特別是圖像超分辨率技術發展迅速,各種指標不斷提高,視覺效果也在逐漸改進。但由於現實世界的降質過程複雜多樣,它們距離實際應用仍然有較大的差距。「我們從實際應用的角度出發,嘗試做了一些圖像復原與增強的探索工作。一是人臉復原GFPGAN,利用人臉生成對抗網絡的先驗,輔助實際低質量人臉的修復及細節生成,能夠有效解決大部分人臉場景。另一個是通用圖像復原Real-ESRGAN,探索利用純合成的方式,來解決實際的圖像修復問題。」他說。
審讀:譚錄崗