商湯發布AI傳感器:智能手機影像新核心

攝影圈裡常說,“底大一級壓死人”。

這一般是指數碼相機的CMOS圖像傳感器的尺寸越大,成像效果越好。它是相機的關鍵成像部件,也是塑造影像競爭力的核心。
也因此,我們看到隨着智能手機競爭越來越激烈,以及影像技術在手機中的地位越來越高,傳感器技術成為很多手機廠商的必爭之地,是差異化競爭所在。
然而手機往往追求輕薄和低功耗,使得手機圖像傳感器的尺寸天然存在物理限制。如何解決這一矛盾,成為業界的重要方向。

近日,商湯智能產業研究院發布《AI傳感器:智能手機影像新核心》白皮書,提出在智能手機市場緩慢步入瓶頸期的趨勢下,影像功能成為產業破局焦點,而AI軟件與CMOS圖像傳感器硬件的融合,將是智能手機影像能力持續提升的破題之道。

圖像傳感器步入AI時代

過去幾年,AI算法讓手機的影像能力得到了不小的提升,但在這種方案中,圖像傳感和AI算法的運行,在不同的硬件上完成,圖像傳感器提供圖像信號,處理器或者AI加速芯片執行AI算法。這會造成能耗資源的浪費,並且難以處理一些需要及時響應的場景。

白皮書指出,融入了AI技術的CMOS圖像傳感器,可以最大化地發揮原始光信號的價值。

在設備獲取視覺信號的伊始,AI傳感器就可以進行優化和處理,增強真實世界感知、提高圖像和視頻的質量、豐富內容細節,同時最大限度地降低了設備功耗,並增強了數據安全性。

白皮書指出,自20世紀50年代光學倍增管(Photo Multiplier Tube, PMT)出現以來,圖像傳感器便隨着技術的發展而持續演進。

如今,隨着AI技術的加持,CMOS圖像傳感器的發展開始進入AI軟件定義的時代,將成像系統的整體能力推向新的高度。

讓手機成為“個人智能影像工作室”

憑藉領先的AI技術和軟硬件整合能力,商湯已經在超分辨率、AI超畫質、夜景影像、高動態範圍、超清人像、影像虛化、RGB ToF 3D等關鍵影像場景,積累了大量算法能力。

同時早在2019年,商湯就與全球領先的圖像傳感器廠商開展緊密合作,將AI算法和傳感器硬件直接融合。目前,商湯AI傳感器已完成多款產品,並成功落地多款高端旗艦手機。

憑藉AI算法、AI傳感器和AI ISP的三位一體,商湯實現了AI技術對整個智能手機智能影像系統的一體化賦能。

一方面,通過AI技術充分挖掘鏡頭模組、各種新型傳感器等硬件的潛力,最大化利用成像設備的底層特性,實現最優的成像質量。

另一方面,利用AI技術將成像系統中的各個獨立部件有機結合在一起,充分聯動,使原本獨立運作的成像模塊成為協同合作的成像平台。

從上至下分別為超分辨率、AI超畫質、夜景影像效果對比,左邊為傳統方案拍攝效果,右邊為商湯賦能後拍攝效果,圖片均為原圖的局部放大

商湯的解決方案,讓手機攝影的質量得到了全面提升。

例如,通過AI對多種光源不同特性的學習,了解自然光譜特性,進而根據實際應用場景,帶來AI降噪、AI超分辨率,提升成像質量;在特殊拍攝模式下,AI夜景增強、AI人像增強,更為智能手機賦予了多樣的“魔幻場景”。

這些體驗,讓搭載了AI傳感器的智能手機,成為每個人專屬的“個人智能影像工作室”,消費者日常使用時,也能輕鬆拍出媲美專業影像器材的高質量作品。

機器“認知”世界的基礎設施

面向未來,AI傳感器的價值不僅在於提升智能手機的影像能力,它更將成為機器“認知”世界的基礎設施,為更多物聯網終端賦予智能感知與內容增強的能力。

在全球40億手機用戶的龐大基數下,AI傳感器的廣泛應用,將大幅降低世界建模成本,成為連接物理世界與虛擬世界的橋樑,加速“元宇宙”的構建。

在新興應用場景中,AI傳感器也將扮演重要角色。例如,在智能汽車領域,AI傳感器將成為車輛感知世界的核心部件;在智慧城市領域,AI傳感器更將為挖掘視頻信息的價值發揮重要作用。

Gartner 數據顯示,2022年CMOS圖像傳感器的出貨量將會超84億顆,到2026年則會超過107億顆,成長為百億出貨量規模的半導體細分市場。

秉承在AI傳感器技術領域的長期布局,商湯將緊密攜手合作夥伴,加速AI傳感器的市場滲透,共同以AI軟件重新“定義”圖像傳感器趨勢,賦予硬件更多創新可能性。