惠普Z系列算法大賽核心解題思路和技巧快來Get

2022年11月14日22:37:18 科技 1491

在競技中磨礪,在實戰中成長

集結超千名數據科學家報名參加

惠普Z系列算法大賽火熱進行中

在這裡,切磋交流,彰顯技術實力

在這裡,快速學習,提升算法技能

在這裡,創意無限,解鎖極智鏡界

合Z之力 解鎖極智境界

「惠普Z系列算法大賽」報名倒計時

為幫助大家勇奪佳績

奉上解題算法指南

理清思路,創新算法

歡迎數據科學家來挑戰!

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

賽題簡介

本次惠普Z系列算法大賽主要聚焦在衛星/無人機遙感場景,大賽官方將提供場景數據,由參賽者檢測道路車輛,在本地完成「帶角度信息的目標檢測」並調試算法,在線提交結果。

算法簡介

本次為大家帶來的解題思路,是利用YOLOv3目標檢測方法,在融合DRBox算法思想的基礎上完成對各類旋轉車輛目標的定位與分類。

1.1 YOLOv3算法簡介

隨着目標檢測方法各種不同思想的融會貫通,YOLO系列檢測算法經歷了從YOLOv1到YOLOv2,再到如今YOLOv3的迭代過程。

YOLOv1是Joseph Redmon等人於2015年提出的單階段目標檢測算法。其將輸入圖片劃分為S×S個網格,每個網格負責預測中心點落到該處的目標。具體來說,整個網絡最後輸出(B×5+C)個S×S的特徵圖,其中B表示每個網絡會預測B個邊框,每個邊框包括5個預測值,分別是x, y, w, h和confidence;C則表示B個邊框共享的C類目標概率。在當時的實時檢測算法中,YOLOv1的檢測效果是最好的。然而,其最大的缺點在於檢測精度明顯較低。

考慮到YOLOv1的檢測精度較差,Joseph Redmon等人於2017年提出了更新的YOLOv2檢測算法。YOLOv2重點解決了召回率和定位精度方面的誤差,相較於YOLOv1進行了以下一些改進:提高了分類網絡訓練的圖像分辨率;引入了Faster R-CNN中anchor box的思想;對網絡結構的設計進行了改進;輸出層使用卷積層替代YOLO的全連接層等,從而在識別精度、定位精度和檢測速度等方面都有大大提升。

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

圖1-1 YOLOv3與其他方法在COCO上的性能比較

YOLOv3則是在YOLOv2的基礎上,吸收SSD中多層檢測、FPN特徵金字塔以及ResNet更好的基礎網絡等思想提出的更精準的檢測方法。其在COCO上的性能如圖1-1所示。

相比於YOLOv2,YOLOv3從以下幾個方面進行了改進:

1)採用多標籤分類來替代之前的多交叉熵分類:每個候選框採用多標籤的方式進行分類,即採用二值交叉熵來進行候選框類別的學習。當預測的目標類別較複雜,且存在重疊情況時,這種分類方式十分有效;

2)採用多尺度特徵進行預測:借鑒SSD和FPN的思想,YOLOv3在三個不同尺度的特徵圖上進行預測,分別為scale1(13×13)、scale2(26×26)和scale3(52×52)。同時,在scale2和scale3上,採用高層特徵上採樣後和低層特徵進行融合後的特徵進行預測;

3)設置更多、更有效的先驗框:YOLOv3延續了YOLOv2利用聚類統計的方式來獲取先驗框寬高的設置,由於預測層數的變多,YOLOv3總共設置了9個尺度的先驗框,並且平均分佈於每個尺度的預測層上(即對於每個尺度的預測層,其每個特徵點對應3個先驗框,13×13對應較大的3個,52×52對應較小的3個,26×26對應餘下的3個);

4)利用更強大的特徵提取網絡:YOLOv3結合ResNet和NIN的思想,提出了更加高效的backbone,名為darknet-53。Darknet-53在保留相對較低計算量的同時,分類精度可媲美ResNet-101,甚至ResNet-152。

在YOLOv3後,出現了少量基於該框架的一些檢測方法,分別如下:

1)GIoU(CVPR 2019):在目前大多數目標檢測算法中,常常採用L2、L1或者Smooth L1 Loss的方式來進行邊框調整的訓練,然而在評測的時候卻利用IoU來判斷是否檢測到目標。這兩種方式顯然存在不一致性,即無法用上述度量來決定IoU的好壞。針對這一問題,GIoU提出了一種更加普適的度量,直接利用GIoU進行損失的計算和梯度反傳,從而使得目標檢測精度更高。

2)Gaussian YOLOv3(ICCV 2019):參考KL Loss,Gaussian YOLOv3在YOLOv3的基礎上,採用高斯模型來預測邊框。即對於每個預測框來說,從之前的(

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

)變為(

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

),其中

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞表示邊框的坐標,惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞表示各坐標的不確定性。在最終獲取目標置信度時,採用邊框包含目標概率、目標類別概率和邊框確定性三部分的乘積,即

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞。這裡的惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞採用的是上述四個方差的平均。

詳細可參考:https://github.com/pjreddie/darknet

1.2 DRBox旋轉框思想簡介

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

圖1-2 DRBox(基於SSD)算法示意圖

DRBox採用定向框來克服遙感圖像中水平檢測框的困難。定向框是一個帶有angle參數的矩形,用於定義其方向。其需要五個參數來回歸其位置,大小和方向。與水平檢測框相比,定向框更緊密地圍繞了目標的輪廓,比水平框包含更少的背景像素,因此目標和背景之間的分類更容易。

詳細可參考:

(DRBox)

https://github.com/liulei01/DRBo

(DRBoxv2)

https://github.com/ZongxuPan/DrBox-v2-tensorflow

1.3 推薦思路

傳統的YOLOv3採用無旋轉矩形框的方式來檢測目標,與之相關的操作也基本保持這個特性,例如先驗框的設定,訓練過程中匹配先驗框的機制以及NMS過程中IoU的計算等。而在旋轉矩形建模下,其最大的不同在於額外引入了旋轉角θ。因此,上述相關的操作過程要根據進行調整。

1.3.1 先驗框設置

在原始的YOLOv3中,主要包含以下一些先驗框。這裡以基礎網絡為darknet-53,網絡輸入大小為416×416舉例說明。

1)scale1(13×13):在該尺度特徵圖上,每個點對應3個不同大小的先驗框,分別是[116,90],[156,198]和[373,326],如圖3-3所示。

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

圖3-3 scale1(13×13)傳統矩形先驗框示例圖

2)scale2(26×26):在該尺度特徵圖上,每個點同樣對應3個不同大小的先驗框,分別是[30,61],[62,45]和[59,119],如圖3-4所示。

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

圖3-4 scale2(26×26)傳統矩形先驗框示例圖

先驗框放大4倍顯示

3)scale3(52×52):在該尺度特徵圖上,每個點同樣對應3個不同大小的先驗框,分別是[10,13],[16,20]和[33,23],如圖3-5所示。

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

圖3-5 scale3(52×52)傳統矩形先驗框示例圖

先驗框放大8倍顯示

在保持每個尺度上先驗框大小不變的情況下,我們為每個先驗框增加了旋轉角度,旋轉角度以30°的間隔從0°開始變化到330°。每個尺度帶旋轉角度的先驗框分別如圖3-6、3-7和3-8所示。

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

圖3-6 scale1(13×13)旋轉矩形先驗框示例圖

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

圖3-7 scale2(26×26)旋轉矩形先驗框示例圖

先驗框放大4倍顯示

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

圖3-8 scale3(52×52)旋轉矩形先驗框示例圖

先驗框放大8倍顯示

1.3.2 先驗框與目標框匹配

YOLOv3在匹配的過程中,首先初始化每個尺度的先驗框為背景區域,即令Objectness的ground-truth為0;然後對於每個目標框,找到與其最佳匹配的先驗框,令其Objectness的ground-truth為1,同時根據先驗框的分類和邊框回歸偏置值進行梯度反傳,之後不斷迭代優化。

在傳統矩形先驗框下,一般採用IoU的度量來獲取每個目標的最佳匹配。IoU定義如下:

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

基於傳統IoU,旋轉矩形之間的匹配度量ArIoU在保持框位置和大小的情況下,同時引入了角度之間的差異,具體如下:

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

其中A表示目標框,旋轉角度為

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

B表示先驗框,旋轉角度為

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

表示將先驗框B繞中心點旋轉,使得其與目標框A具有同樣的旋轉角度。因此,ArIoU相當於在傳統IoU的基礎了,多了

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

在每種尺度預測層上的匹配過程中,對於每個旋轉矩形目標,首先獲取其所對應的網格;然後在該網格中找到與其最佳匹配的旋轉先驗框,若該先驗框正好處於當前尺度下,則該先驗框與當前目標框進行匹配,並根據先驗框的分類和邊框回歸偏置值進行梯度反傳,之後不斷迭代優化。

1.3.3 先驗框與目標框匹配

在原始傳統矩形框檢測下,YOLOv3會在三個尺度上進行預測,假設尺度表示為

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

。同時對於每個尺度特徵圖上的點,會設置M個先驗框,每個先驗框會預測

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

個數值,分別是邊框偏移量(

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

),置信度C以及屬於每個類別的概率。

儘管在YOLOv3的技術報告中沒有提到損失函數的具體定義,但根據對源碼和其之前系列檢測算法的了解,損失函數包含三個部分,一是採用歐式距離損失計算邊框偏移量的預測誤差,二是採用logistic回歸損失定義信度C的預測誤差,最後是採用logistic回歸損失定義多標籤P分類的預測誤差。具體形式表示如下:

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

其中,

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

在加入旋轉角度後,網絡預測的邊框偏移量變成(

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞)。因此,網絡的損失增加了預測角度的誤差。另外,由於先驗框引入了角度維度,網絡預測量也成倍增多。新的損失形式如下:

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

其中,

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

1.3.4 NMS過程

在NMS中,預測旋轉框之間的度量採用與匹配過程中類似的ArIoU形式。由於在實際預測過程中,同一位置一般僅包含一個目標,因此對於角度相差180°的預測框也因同樣抑制。故而在這個過程的度量,一般忽略目標頭和尾的朝向。忽略朝向後的度量如下所示:

惠普Z系列算法大賽核心解題思路和技巧快來Get - 天天要聞

了解算法指南後

是否躍躍欲試

展示你的算法創意?

快來參加惠普Z系列算法大賽

和數據科學家們一起競技吧!

【任務時間

大賽日程報名及模型提交

9月29日-11月24日

成績評審

11月25日-12月7日

結果公布

12月8日

【任務獎勵

豐厚獎金等你來拿

10萬元獎金池

將由組委會評選出的6支優秀參賽團隊瓜分

一等獎1名 獎金3萬元

二等獎2名 獎金2萬元

三等獎3名 獎金1萬元

掃碼報名參賽↓

科技分類資訊推薦

美零售商要求中企照常發貨,關稅美方承擔 - 天天要聞

美零售商要求中企照常發貨,關稅美方承擔

特朗普關稅重壓下,美國貨真會像特朗普所說的那樣,擺滿貨架,大批人來買嗎?有美國商人已經做了調查,結論是0人想買。美零售商巨頭因此不得不求着中國出口商發貨,還保證關稅成本由美國人買單! 美國....
阿里雲通義點金發佈DianJin-R1金融領域推理大模型 - 天天要聞

阿里雲通義點金發佈DianJin-R1金融領域推理大模型

近日,阿里雲通義點金團隊與蘇州大學攜手合作,在金融大語言模型領域推出了突破性的創新成果: DianJin-R1 。這款推理增強型金融大模型,融合了先進的技術和全面的數據支持,專為金融任務而設計。
曝iPhone 18 Pro內測屏下3D人臉識別:蘋果邁入單挖孔屏時代 - 天天要聞

曝iPhone 18 Pro內測屏下3D人臉識別:蘋果邁入單挖孔屏時代

快科技5月4日消息,博主數碼閑聊站爆料,iPhone 18 Pro和iPhone 18 Pro Max在測試屏下3D人臉識別,採用單挖孔屏形態。他還爆料,iPhone 18和iPhone 18 Air仍然是藥丸屏形態。眾所周知,從iPhone X開始,蘋果開啟了劉海屏時代,在這個劉海內,蘋果塞進了原深感攝像頭系統,實現了3D人臉識別,該系統包含了多個精密原件
三款7000元附近RTX 5070筆記本對壘,誰更讓你心動? - 天天要聞

三款7000元附近RTX 5070筆記本對壘,誰更讓你心動?

不得不說,RTX 50系列浪潮來得很快,這麼快就有多款產品在7000元附近了,選擇面很大。當然,這裡的功勞主要是補貼,沒補貼的話,這些本還在9000元高位,但有了補貼後,實際價格也是我們需要正視的。這次,我們就找到三款價格在7000元附近的RTX 5070筆記本,看看哪款讓你心動。第一款,是七彩虹隱星P16 Pro,原價8999元,到...
未來智能駕駛圖鑑:車路協同成主流,道路兩側也安上雷達! - 天天要聞

未來智能駕駛圖鑑:車路協同成主流,道路兩側也安上雷達!

新能源汽車風口下,智能駕駛成為起飛的豬。國內供應鏈發展也十分迅猛,現在10萬級的車也能體驗智駕,那麼在未來,智能駕駛會達到什麼樣的狀態呢?答案是「車路協同」。車端智能是基礎現在帶智駕功能的車都有一定的硬件基礎做支撐,比如毫米波雷達、攝像頭、激光雷達、芯片等,通過這些硬件,可以採集車輛周圍的環境信息和信...
「英偉達已向中國三家企業通報」 - 天天要聞

「英偉達已向中國三家企業通報」

據台灣《工商時報》網站5月3日報道,在針對中國市場的H20芯片遭美國政府禁售後,美國芯片大廠英偉達正加緊開發另一款符合美國出口規定的人工智能(AI)芯片,以繼續保住其在中國的市場份額。
金舟投屏文件輸出目錄設置方法 - 天天要聞

金舟投屏文件輸出目錄設置方法

金舟投屏文件輸出目錄怎麼設置?跟着我來操作。1、 打開金舟投屏應用2、 在金舟投屏窗口,點擊菜單按鈕。3、 在彈出的下拉菜單中,選擇設置選項。4、 進入設置窗口後,選擇點擊文件選項。5、 在文件窗口裡,點擊輸出目錄按鈕,於彈出窗口選擇文件輸出路徑,例如:D:文件保存金舟投屏。6、 點擊關閉即可完成操作(9777180)...