機器視覺走過70年,到了哪個發展階段?

2022年07月01日16:26:11 熱門 1750

談到計算機視覺,作為現在相當火的一門學科,離我們的日常生活其實非常近。比如人臉識別、攝像頭拍路邊的指示牌就能直接翻譯成本國文字,或者可以選中、複製圖片中的文字信息,這些都可認為是計算機視覺/機器視覺的典型應用。

計算機視覺早期實驗可以追溯到上世紀50年代;70年代時就有了區分手寫和書面文字的機器視覺商業應用。簡單地說,計算機視覺就是讓計算機或機器,理解並解釋影像畫面、視覺數據,某種程度替代人眼來執行觀察、識別、定位、檢查、測量、決策等工作。機器視覺系統能夠自動獲取、分析視覺影像,提供信息並控制機器或工作流程。

其應用範圍當然不止於拍照的人臉識別,比如我們此前參觀英飛凌的工廠,就發現他們應用機器視覺來檢查某些工序之下,半導體產品的良率問題——相比人工檢查要高效不少;微觀層面,EDA與foundry廠也基於機器視覺來發現芯片製造的缺陷......擴展開去,早前工業4.0這個詞流行起來時,我們就知道機器視覺在實現工業自動化的過程里扮演十分重要的角色。

如果我們簡單地將計算機視覺的工作流程切分成3大塊,大致就有影像捕捉、影像處理、影像分析與理解。基於此,本期《國際電子商情》封面故事採訪到了思特威、Prophesee、銀牛微電子、Imagination Technologies。其中思特威和Prophesee主要是圖像/視覺傳感器供應商,相關影像捕捉;Imagination則涉足後兩者——實際上Imagination早前也開發過ISP(圖像處理器);銀牛微電子專註於3D視覺,其角色定位應當是覆蓋了3個流程的。

雖說就產業鏈的角度,其中還有大量其他市場參與角色,比如上游的光源、鏡頭,中游的系統集成商,以及硬件之外的軟件、算法供應商等等組成部分;不過我們還是期望本文能夠簡單勾勒出當前機器視覺市場的發展潛力。聊聊這個已經有70多年發展歷史的領域,現在怎麼樣了。

各種語境下探討機器視覺

首先明確一下機器視覺(machine vision)與計算機視覺(computer vision)這兩個詞究竟在說什麼。針對這兩個詞的定義和區別,各種不同的資料給出的解釋都存在差別。艾媒諮詢此前有報告提出,機器視覺是為計算機視覺技術的工程化,「計算機視覺為機器視覺提供圖像和景物分析的理論和算法基礎,機器視覺為計算機視覺的實現提供傳感器模型、系統構造和實現手段」。

這話說得似乎有一定道理,聽起來是不同語境下不同維度的提法。從維基百科等資料來看,「機器視覺」這個說法更偏向於「計算機視覺」在工業領域的應用。我們這次採訪的多名專家也有類似的說法。比如銀牛微電子聯合創始人兼副總裁何火高先生就提到:「機器視覺技術賦予工業設備『看』的能力」,「機器視覺是計算機視覺技術一個非常重要的應用領域,計算機視覺是機器視覺技術的重要組成部分。」

Imagination Technologies產品總監Rob Fisher提到:「機器視覺可認為是計算機視覺的一個子集,計算機視覺包含更廣範圍的應用。」產品總監Gilberto Rodriguez則說:「計算機視覺和機器視覺的概念受到機器學習的影響,在發生迅速變化。」

Prophesee多名專家在回答中提到機器視覺與計算機視覺的界限模糊,「在同一領域裏,我們經常可以看到它們被互換使用。在我們看來,計算機視覺屬於更廣泛的視覺技術領域,而機器視覺則是計算機視覺的一個子集。」「更具體來說,我們可以將機器視覺視為一組任務導向型的視覺技能,應用於一些特定的應用(物體的存在檢測、質量控制、尺寸檢測、自動檢查、通過/失敗決策...)。而計算機視覺則是一個跨學科的領域,在技術層面包含了最先進的視覺感知和計算。」

則本文將不再特意區分計算機視覺與機器視覺兩個詞,討論範圍只限定於「機器視覺」的含義部分。(比如很多行業報告和本文不將汽車ADAS系統算作機器視覺範疇,即便它應用了諸多計算機視覺技術;但在某些文獻里,這兩個詞的確可以互換)

其次要闡明的一個問題是,計算機視覺與AI是什麼樣的關係。畢竟現在我們經常看到這兩個詞同時出現。以及了解了兩者的關係,也就更能搞清楚計算機視覺的發展前景。在查資料時,比較令我們驚訝的是,幾乎所有專家都提到,計算機視覺就是將AI應用於視覺世界,甚至說計算機視覺是AI的一個子集。按照我們的前期認知,計算機視覺的確有部分應用神經網絡技術的方案,但這不是計算機視覺的全部。

後來我們發現,普羅大眾對於「AI」的定義更加寬泛,它泛指對於人類行為方式或其他人類特性、智能進行模仿。那麼機器視覺本來就是在特定領域對人眼和理解做模擬,自然可將其歸屬於AI。不過實際上,現在我們常說的AI並不會有這麼寬泛的定義。

Gilberto說:「計算機視覺原本用於描述由人類編寫、在一般或專用計算硬件中執行的算法。隨着機器學習性能提升,以及高效異構架構的存在,現在我們可以通過訓練(AI training)來獲得算法,不再需要由人去寫代碼。這改變了我們對於計算機視覺概念的認識。」他特彆強調,「隨着AI和機器視覺技術更多的應用,傳統計算機視覺技術的採用正在變少。」這裡的「AI」的含義實際有了窄化。

當我們說2012年在ImageNet圖像識別大賽里,AlexNet卷積神經網絡(CNN)脫穎而出,還基於GPU做加速,這是對AI的革新。而且AlexNet當時也被認為是計算機視覺領域,影響最為深遠的技術創新。那麼AI的概念,在此處就已經窄化為深度學習(也是很多人對AI的狹義定義)。而計算機視覺對於深度學習的應用,才是這兩年計算機視覺技術發展的重大趨勢。在這個語境里,就不能再說計算機視覺是AI的子集了;而應當說AI在推動計算機視覺技術的發展。

AI火箭般的推力

AlexNet應當是AI推動機器視覺技術發展的一個代表;到當代ResNet殘差神經網絡每每成為我們聊AI,以及AI芯片公司發佈產品時必提及的常客。這其實就表明當代計算機視覺的發展,是被AI推着走的。就像Gilberto說的,傳統計算機視覺技術的分量在顯著減少;或者說從編程的角度來說,那些依據人類經驗寫的明確的規則判斷,會變得越來越不及AI技術。

「尤其是近年來人工智能的熱潮,對機器視覺技術的發展起到了推波助瀾的作用。AI進入了一個新的層級,不僅僅是比算力,比指標,而是讓機器真正具有人的特徵和屬性。今後AI將會在機器視覺領域扮演越來越重要的角色,並引領其今後的發展方向。」何火高先生說。

在深度學習應用於機器視覺領域的問題上,雖然我們無法提供確切的數字。不過從我們採訪的這幾家企業,都能看出AI比重的加強。Imagination不必多說,這家企業目前主推的產品除了GPU之外,就是NNA神經網絡加速器。其GPU本身也用於計算機視覺任務,「比如說360°去扭曲、重疊、信息顯示等。」 Gilberto說。

而「卷積神經網絡非常善於尋找和分類視覺對象...」「NNA是我們主要的計算機視覺處理器之一。NNA非常適合部署在高效率的機器學習計算中,實現從傳統計算到機器學習的過渡。」當然還有其RISC-V CPU也是機器學習對任務進行預處理/後處理的組成部分。

銀牛微電子主打3D雙目立體視覺技術。值得一提的是這家企業自研的NU4000芯片,何火高先生表示:「NU4000不但集成了深度引擎,AI算力引擎,通用CPU核,SLAM引擎,使應用場景的擴展性增強,集成度也大幅提升,真正成為從深度感知到AI運算到系統控制的單芯片解決方案SoC。繼NU4000集成了第三方DSP和CNN引擎以後,未來銀牛將自研的其他AI處理能力,也將集成到下一代芯片上。」他透露,未來計劃要發佈的芯片產品,除了主控CPU更強、能耗比更出色,3D深度視覺性能會更好,AI算力會越來越強勁。

思特威作為一家CIS(CMOS圖像傳感器)供應商,前兩年就開始探討將AI算力與CIS更靠近的解決方案——這其實也是這兩年包括索尼等CIS廠商普遍在做的事情。思特威在本次採訪中談到 「AI智能傳感器平台」,即「在圖像傳感器上集成邊緣AI計算,能有效地提高關鍵區域(如人臉或車牌)的分辨率,降低延時,並擁有高幀率及超低功耗,為人臉識別、高級輔助駕駛系統、無人駕駛、機械人等先進的人工智能應用,解決因幀率不夠高、分辨率不足導致的響應慢、演示稿及識別率低等問題,提升整個人工智能系統的能效。」

傳統CIS產生的數據應用AI其實算是相當普遍的。但我們本次採訪的另一家企業Prophesee——這家企業所推的基於事件的視覺傳感器,是我們認為可能不關乎AI的一種傳感器類型。因為這種傳感器和傳統基於幀的圖像傳感器是不同的,它感知的是場景變化信息,靜態部分不會被捕捉;它更適用於常規的簡單規則判斷。不過Prophesee聯合創始人兼CEO Luca Verre告訴我們,最近芯鼎科技(iCatch)以及日本的DMP和Restar都分別宣布了與Prophesee的合作,開發基於事件的視覺傳感器AI方案,以及全球「首個基於事件的邊緣AI視覺系統和服務」。

機器視覺走過70年,到了哪個發展階段? - 天天要聞

圖1,AI Research Funding Portfolios and Extreme Growth研究中計算機視覺佔比近一半

無論這其中的AI具體是如何實施的或者在哪個環節,以基於事件的視覺傳感器都在與AI發生結合(或輔助)這一事實,機器視覺與AI已經到了不可分割的地步。畢竟AI的一大熱點不就是計算機視覺嗎?

去年喬治城大學發佈的一篇論文AI Research Funding Portfolios and Extreme Growth對600個大型AI研究集群做了分析,發現其中相關計算機視覺研究領域的佔到了將近一半(圖1)。何火高先生打比方說:「計算機視覺是AI的最重要應用場景,因為視覺占人類所有感官輸入的80%。」 基於AI當前為市場熱點的事實,我們都可以說計算機視覺當前正在「如日中天」的發展階段。

發展空間幾何?

要判斷一個行業的發展階段有很多種方法,包括看當前的市場增長率、新技術的迭代周期,以及市場參與者的份額分佈情況。比較匪夷所思的是,我們看了大約不下10篇相關機器視覺的行業報告,諸多研究機構對該行業的市場價值預估數量級相去甚遠——數據跨度有4倍之多;而且對分屬行業、區域的重要性也有各自不同的解讀。這可能和不同研究機構對於「機器視覺」的定義有差異,或統計的範圍不同有關。

我們從市場規模數據、應用方向,以及新技術點幾個方向來推測機器視覺市場目前所處的發展階段。

對包括Grand View Research、The Business Research Company、前瞻產業研究院等機構的報告數據取個中值,機器視覺全球市場規模今年大約在130-150億美元左右,預計2021-2026的年複合增長率(CAGR)在8-12%,應該說仍舊是高速增長中的行業。

其中有多家研究機構的報告提到,該市場「高度分散」,有大量市場參與者。2020年排名前10的市場參與者所佔整個市場的份額還不到20%。這裡的「市場參與者」主要說的應該是系統級供應商(如工業相機),典型如Cognex(康耐視)、Keyence(基恩士)等。一般電子產業的高度分散,意味着該領域尚有巨大的競爭空間。不過這個問題或許還應當仔細了解該領域不同層級的供應商情況,涵蓋光源、鏡頭、傳感器、算法與軟件等各個相關組成部分。

至於機器視覺的應用市場和方向,主要包括汽車、食品與飲料、製藥與醫療、電子與半導體、工業機械人、包裝印刷等。在工業操作中取代人工檢查與測量,是機器視覺比較大的應用市場——畢竟全社會的發展方向,本來就是人力成本在不斷攀升的過程。機器視覺的本質是自動化的組成部分,所以我們才總說工業4.0與機器視覺是息息相關的。

機器視覺走過70年,到了哪個發展階段? - 天天要聞

圖2,2020-2026工業與自動化相機市場前瞻;來源:Yole Développement

要說其中哪個行業成為機器視覺發展的重點,調研機構的說法也差別不小。如前瞻產業研究院認為電子及半導體(製造)是當前機器視覺最大的下游市場;而Mordor Intelligence和Grand View Research則認為最大的應用方向是汽車製造。從數據來看,這兩者應當的確在伯仲之間(雖然可能仍有量級差距)。與此同時,汽車行業的發展潛力是普遍被認為最大的。

另外有關北美和亞太市場誰更大的問題也有分歧,但亞太市場發展潛力更大亦為共識...... 要驗證這些數據的可靠性,Cognex的財報大概是個方法。從Cognex公司2020年報來看,這家公司30%的營收來自於消費電子,20%來自物流行業,20%來自汽車,還有30%為其他。美國是其最大市場,歐洲其次。不過如果將其大中華區與亞洲其他地區營收相加,則的確僅次於美國市場。

當然一家公司的情況不能說明整個行業。以我們的經驗,分析報告數據的語焉不詳、量級差異以及結論不同,都表明該行業尚在上升期早期。我們認為當前其技術發展階段,仍有海量需求等待填補;或者說至少該市場離發展「成熟」還相去甚遠。

如前文所述,計算機視覺這一交叉學科的發展本身也有些年頭了。但實際上很多技術的起步都很早,比如這兩年才變得很火的基於事件的視覺傳感器,Luca告訴我們這種技術早在上世紀80年代就有人提出了,但技術真正走向成熟卻是這兩年。而這類看起來比較新興,且擁有較大發展前景的傳感器,Yole Développement預計神經形態AI到2030年會達到70億美元市場規模,屆時CIS市場大約有9%的份額會被此類傳感器吃下。這就表明,新技術的湧現在促成整個行業的發展;以及機器視覺行業本身也在嘗試各種新技術。

機器視覺走過70年,到了哪個發展階段? - 天天要聞

圖3,3D視覺市場未來幾年將達到最大漲幅;來源:Allied Market Research

3D視覺感知更不必多說,好幾份報告都特別提到了智能攝像頭系統的發展,很大程度將歸功於3D成像市場的增長——這一點我們在此前的3D ToF技術報告中曾提過。因為3D機器視覺當下已經能夠提供精準、實時的信息,給予機器視覺更多的數據。3D感知與成像本來就是個可單獨拿來探討的領域。在3D視覺/成像這個賽道上,銀牛微電子着眼的是stereoscope,具體為雙目視覺。

「今天機器視覺最大的不同,是未來發展將會越來越多地應用3D視覺技術,尤其是密集的雙目立體視覺技術(dense depth stereo)。」何火高先生談到,「就像地球物種大爆發的寒武紀一樣,因為有雙目立體視覺能力,物種的進化和交流才迅速得繁盛起來。」

「機器以前不知道圖像中的物體之間的相互位置關係和距離,因此經常產生視覺錯覺和誤判。隨着3D/立體視覺感知技術的產生和發展,尤其是雙目立體視覺技術的發展,對機器視覺中產生的錯覺和誤判就有了非常有效的工具去避免。從而使得3D/立體視覺感知技術在機器視覺中的應用越來越廣泛,重要性和高效率也不斷得到業界的認可和重視。」

「作為AIoT異構平台的引領者,銀牛的核心競爭優勢不但包括AI運算處理能力,還有非常獨特的雙目立體3D視覺算法引擎和集成的通用CPU核心,這些都是在機器視覺領域不可或缺的重要組成部分。「

從這個角度來說,以銀牛微電子的產品為代表的3D視覺技術,未來拿下更多市場是不言而喻的。實際上即便是傳統的CIS,思特威也在嘗試就機器視覺做技術方面的加強,包括我們所知的高幀率、全局快門、非可見光下成像(遠紅外增強技術)等。從思特威的官網來看,「機器視覺」是作為其一大應用方向來展示的。無人機、掃地機械人、AR/VR、智能掃碼、人臉識別、工業相機和智慧交通系統,都是思特威看到的機器視覺行業未來的前景。

從技術可創新和當前湧現出的市場新勢力來看,如果將這些機器視覺的總合確切地稱作一個「行業」,則該行業即便在技術層面都還有大量可發展的空間。

且其下屬分支領域都有進一步被寡頭化的空間,尤其在AI技術越來越成為主流之際。雖然面向下游不同應用領域時,機器視覺技術的需求可能是千差萬別的:Prophesee表示基於其合作經驗,即便同樣是基於事件的視覺傳感器,不同行業對技術的需求都是各不相同的。所以這個問題可能還有進一步探討的空間。

在我們觀察機器視覺領域時,實則還有很多其他的收穫,比如某些技術趨勢:像是多種傳感器的融合(包括視覺傳感器與其他類別傳感器),邊緣計算的崛起、算力單元部分向傳感器短靠攏,以及能源效率的持續進步等。但真正的大方向仍舊是:在AI技術持續邁進之際,機器視覺即便沉澱了過去幾十年的發展歷程,現在這個時間點才真的算是剛剛開始。

責編:Clover.li

熱門分類資訊推薦

曾小賢的上司Lisa榕,現實中不僅才貌雙全,還嫁給了CEO - 天天要聞

曾小賢的上司Lisa榕,現實中不僅才貌雙全,還嫁給了CEO

曾小賢的上司Lisa榕,現實中不僅才貌雙全,還嫁給了CEO雖然說《愛情公寓》這部劇在劇情上充滿了爭議,但是一定程度上,這部劇也是很多人的回憶,是伴隨了一代人的青春回憶,而且劇中的很多角色都成為了經典,他們的口頭禪也一直被拿來玩兒梗。
Lisa榕做主持多年沒紅,被陳赫拉進愛情公寓爆紅,如今怎樣了 - 天天要聞

Lisa榕做主持多年沒紅,被陳赫拉進愛情公寓爆紅,如今怎樣了

談到《愛情公寓》這部火爆一時的歡樂喜劇,大家肯定都不陌生。不知道大家是否還記得《愛情公寓》中那個把曾小賢治得服服帖帖的女上司Lisa榕,現實中的她名叫榕榕,和劇中的形象也判若兩人。1981年出生在遼寧瀋陽的榕榕,畢業於上海戲劇學院,後來成為了上海東方傳媒集團有限公司的一名主持人。