Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載)

2025年02月15日00:12:03 科技 1935

關注並星標

從此不迷路

計算機視覺研究院

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

公眾號ID計算機視覺研究院

學習群掃碼在主頁獲取加入方式

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

論文地址:https://www.scitepress.org/Papers/2021/102344/102344.pdf

計算機視覺研究院專欄

Column of Computer Vision Institute

深度學習模型在目標檢測的性能上取得了重大突破。然而,在傳統模型中,例如Faster R-CNN和YOLO,由於計算資源有限和功率預算緊張,這些網路的規模使其難以部署在嵌入式移動設備上。

一、前言

深度學習模型在目標檢測的性能上取得了重大突破。然而,在傳統模型中,例如Faster R-CNN和YOLO,由於計算資源有限和功率預算緊張,這些網路的規模使其難以部署在嵌入式移動設備上。

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

深度學習領域的加速發展極大地促進了目標檢測的發展,其在人臉檢測、自動駕駛、機器人視覺和視頻監控等方面的廣泛應用。隨著目標檢測的蓬勃發展,近年來提出了幾種深度卷積神經網路模型,例如R-CNN、SSD和YOLO等。然而,隨著網路變得越來越複雜,這些模型的規模不斷增加,這使得在現實生活中將這些模型部署到嵌入式設備上變得越來越困難。因此,開發一種高效快速的物體檢測模型以在不影響目標檢測質量的情況下減小參數大小至關重要。

二、背景

隨著目標檢測網路系列不斷變得更加複雜,減少權重參數和計算成本變得很重要。模型壓縮方法分為低秩分解、知識蒸餾、剪枝和量化,其中剪枝已被證明是通過去除冗餘參數來降低網路複雜度的有效方法(A survey of model compression and acceleration for deep neural networks)。

為了解決目標檢測網路問題,有幾種最先進的工作技術可以減少YOLO架構中的參數數量。(YOLO-LITE: a real-time object detection algorithm optimized for non-GPU computers) 開發了YOLO-Lite網路,其中從YOLOv2-tiny中刪除了批量歸一化層以加速目標檢測。該網路在PASCAL VOC 2007和COCO數據集上分別實現了33.81%12.26%的mAP。(Yolo nano: a highly compact you only look once convolutional neural network for object detection) 創建了一個高度緊湊的網路YOLO-nano,它是一個基於YOLO網路的8位量化模型,並在PASCAL VOC 2007數據集上進行了優化。該網路在PASCAL VOC 2007數據集上實現了3.18M模型大小69.1%mAP

三、概要

因此,研究者就提出了一種新的基於輕量級CNN的目標檢測模型,即基於YOLOv3-Tiny的Micro-YOLO,它在保持檢測性能的同時顯著減少了參數數量和計算成本。研究者建議將YOLOv3-tiny網路中的卷積層替換為深度分布偏移卷積(DSConvhttps://arxiv.org/abs/1901.01928v1)和帶有squeeze和excitation塊的移動反向瓶頸卷積 (MBConv:主要源自於EfficientNet),並設計漸進式通道級剪枝演算法以最小化數量參數並最大化檢測性能。因此,與原始YOLOv3-tiny網路相比,所提出的Micro-YOLO網路將參數數量減少了3.46倍,乘法累加操作(MAC)減少了2.55倍,同時在COCO數據集上評估的mAP略微減少了0.7%。

四、新框架介紹

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

Micro-YOLO

為了減小網路的大小,研究者探索了可選擇的輕量級卷積層來替代YOLO網路中的卷積層Conv。MobileNet網路採用兩個輕量級卷積層(a)DSConv和(b)MBConv。

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

如上圖(a) 所示,DSConv執行兩種類型的卷積:(i) 深度卷積和 (ii) 逐點卷積,這可以顯著降低網路的模型大小和計算成本。上圖(b) 所示,MBConv的結構是一個1×1的channel expansion卷積,然後是深度卷積和一個1×1的channel reduction層。它利用squeeze和excitation塊,這是一個分支,由squeeze階段的全局平均池化操作和excitation階段的兩個小FC層組成在深度卷積和通道之間還原層。由於輸出通道的數量不等於輸入通道的數量,研究者在MBConv中移除了殘差連接,MBConv層在輸入和輸出處提供緊湊的表示,同時在內部將輸入擴展到更高維的特徵空間以增加非線性變換的表達能力。因此,與DSconv層相比,MBconv層提供了更好的壓縮網路,而不會降低檢測精度。

這些層之間的計算成本,即Conv層(Cs)、DSConv層(Cds)和MBConv層(Cmb)可以分別用以下公式表示:

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

其中k表示內核大小,Cin表示輸入通道數,Cout表示輸出通道數,W和H表示特徵圖的寬度和高度,α和β分別表示MBConv中的擴展因子和縮減因子。

Progressive Channel Pruning

在確定新提出的Micro-YOLO網路的架構後,研究者可以通過使用剪枝技術進一步減少權重參數。在提出的工作中,研究者採用了粗粒度剪枝,因為DSConv和MBConv層主要由1×1內核大小組成,這為細粒度剪枝留下了最小的空間。(Rethinking the value of network pruning) 表明修剪後的架構本身,而不是一組繼承的「重要」權重,對最終模型的效率更重要,這表明在某些情況下修剪可能是有用的一種架構搜索範式。因此,研究者提出了一種漸進式剪枝方法來在修改後的網路中搜索「更薄」的架構。具體偽代碼流程如下:

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

五、實驗

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

新提出的框架圖

不同卷積類型和相同內核大小的不同輸入通道所需的參數數量

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

不同卷積類型的參數量

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

內核大小探索結果。不同的條形表示內核大小的不同組合。為簡單起見,僅以紅色顯示最佳內核大小組合,如下圖:

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

最後看下檢測效果:

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

© THE END

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

轉載請聯繫本公眾號獲得授權

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

計算機視覺研究院學習群等你加入!

ABOUT

計算機視覺研究院

計算機視覺研究院主要涉及深度學習領域,主要致力於目標檢測、目標跟蹤、圖像分割OCR、模型量化、模型部署等研究方向。

研究院每日分享最新的論文演算法新框架,提供論文一鍵下載,並分享實戰項目。

研究院主要著重」技術研究「和「實踐落地」。

研究院會針對不同領域分享實踐過程,讓大家真正體會擺脫理論的真實場景,培養愛動手編程愛動腦思考的習慣!

計算機視覺研究院主要涉及AI視覺領域和大模型研究,致力於目標檢測、目標分類、圖像分割、OCR、模型量化、模型部署等方向。

  • 應用於園區人臉人體檢測、車輛車牌檢測識別、煙霧煙火檢測、抽煙等行為檢測

  • 應用於景區溺水檢測、丟失兒童詢查、車輛違停檢測、垃圾滿溢檢測、煙火檢測、人流量統計等

  • 應用於工廠中的入侵檢測、周界巡檢、工服檢測、產品缺陷檢測、產品計件統計、AGV自動搬運等

  • 應用於林業畜牧業中的無人機實時檢測、牲畜計數、林業面積測量、枯黃枯死樹木檢測定位、煙霧煙火檢測、垃圾檢測等

研究院承接各種AI視覺類項目,還有更多領域業務可落地,歡迎來諮詢!

Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞Micro-YOLO:探索目標檢測壓縮模型的有效方法(附論文下載) - 天天要聞

🔗

科技分類資訊推薦

大廠競相押注的MCP是啥? - 天天要聞

大廠競相押注的MCP是啥?

當地時間2025年2月27日,馬來西亞吉隆坡,阿里巴巴集團雲計算部門開發的Qwen AI大型語言模型(LLM)用戶查詢流程圖在阿里雲AI技術日活動上展示。視覺中國/圖2025年春,AI世界再次開卷新概念。
獲黃仁勛高調推薦的AI搜索引擎 最新估值衝擊千億關口 - 天天要聞

獲黃仁勛高調推薦的AI搜索引擎 最新估值衝擊千億關口

財聯社5月13日訊(編輯 史正丞)據當地媒體報道,美國AI搜索引擎公司Perplexity正接近完成新一輪融資談判,使得公司估值升至近140億美元(約合人民幣1013億元)。知情人士稱,知名風投機構Accel將牽頭本輪融資,預計總額達5億美
蘋果 macOS 15.5 正式發布 - 天天要聞

蘋果 macOS 15.5 正式發布

IT之家 5 月 13 日消息,蘋果今日向 Mac 電腦用戶推送了 macOS 15.5 更新(內部版本號:24F74),本次更新距離上次發布正式版間隔 26 天。 需要注意的是,因蘋果各區域節點伺服器配置緩存問題,可能有些地方探測到升級更新的時間略有延遲,一般半小時內,不會太久。 本文由機器人發布,IT之家稍後將為大家帶來具體更新內容...
106億營收僅4億利潤:燒錢換流量,押注短視頻能否拯救三隻松鼠? - 天天要聞

106億營收僅4億利潤:燒錢換流量,押注短視頻能否拯救三隻松鼠?

2025年4月25日,三隻松鼠正式向港交所遞交招股書,計劃在香港主板實現「A+H」股雙重上市。若此次上市成功,其將成為國內首個跨越滬深港兩地的零食巨頭。2024年財報顯示,三隻松鼠營收達106.22億元,同比增長49.3%,凈利潤同比增長85.5%至4.08億元。這一業績使其穩居中國零食企業零售額第一,但亮眼數據背後,依賴線上渠道、...
權威認證護航出海征程!Intertek 為正泰電源液冷儲能戶外櫃系列產品頒發 ETL、CB、CE等系列證書 - 天天要聞

權威認證護航出海征程!Intertek 為正泰電源液冷儲能戶外櫃系列產品頒發 ETL、CB、CE等系列證書

近日,Intertek天祥集團(以下簡稱「Intertek」)為上海正泰電源系統有限公司(以下簡稱「正泰電源」)研發的CPS ESS-125kW/261kWh 液冷儲能戶外櫃系列產品頒發了 ETL、CB、CE等系列證書,正式標誌著該系列產品可順利進入北美和歐洲市場。 頒證儀式在德國慕尼黑Intersolar展會現場正泰電源展台隆重舉行, 正泰電源總經理李..
廣州積極推動以科技為核心的「華夏社區」項目 - 天天要聞

廣州積極推動以科技為核心的「華夏社區」項目

一、科技賦能社區,保障民生穩定 廣州「華夏社區」項目以科技為核心,融合人工智慧、大數據、物聯網等前沿技術,構建智能化社區管理體系。通過智能安防、智慧醫療、便民服務等功能,提升居民生活質量,確保社區安全穩定。 例如,社區引入智能安防系統,實現全天候監控與預警;智慧醫療平台提供在線診療、健康監測等服務,方...
『敗家變持家』讓我Carry全場的神器,ROG絕神27Pro顯示器評測 - 天天要聞

『敗家變持家』讓我Carry全場的神器,ROG絕神27Pro顯示器評測

哈嘍小夥伴們好,我是Stark-C~對於和我一樣喜歡玩遊戲的玩家來說,在選購顯示器似乎都有這樣的糾結:一方面,我們再玩《CSGO》或者《使命召喚》這類FPS 遊戲時我們希望顯示器不影響我們拔槍的速度,能有超高刷新率和低延遲,這樣畫面就會更加
蘋果手機開啟新一輪降價!有iPhone 16 Pro降價2000元,能參加「國補」了 - 天天要聞

蘋果手機開啟新一輪降價!有iPhone 16 Pro降價2000元,能參加「國補」了

蘋果手機開啟新一輪降價,這次是線下渠道商的價格鬆動。 有消息稱,蘋果5月10日向渠道商下發了調價通知,昨日渠道商開始調價。第一財經記者12日走訪了深圳兩個不同的渠道商門店了解到,蘋果iPhone 16系列確實是從昨天開始降價,且最高降價額度都是1400元,蘋果官方線下的Apple Store零售店有部分產品享受國補,此外未有額外...
越來越多打工人,擠進春秋航空綠皮機艙 - 天天要聞

越來越多打工人,擠進春秋航空綠皮機艙

文源 | 源Sight作者 | 王言「賣最便宜的機票,當最賺錢的航司」,這是在當前仍處在恢復期的航空業,春秋航空呈現出的反差寫照。2024 年,春秋航空盈利表現突出,22.73億元的凈利潤,在一眾A股上市航司中排在首位。