YOLOv10性能效率大幅提升,清華開源新一代實時目標監測模型

2024年06月18日18:20:10 科技 1973

始智ai wisemodel.cn開源社區

YOLOv10性能效率大幅提升,清華開源新一代實時目標監測模型 - 天天要聞

近日,清華大學推出了新一代yolov10模型,此次的yolov10模型做出了多方面的調整和優化。該模型已經上線始智ai wisemodel.cn開源社區,歡迎大家前往wisemodel社區下載體驗。

YOLOv10性能效率大幅提升,清華開源新一代實時目標監測模型 - 天天要聞

https://wisemodel.cn/models/thu-mig/yolov10

1.在head部分,創造性地融合了one-to-one和one-to-many兩種模式,既利用了one-to-many豐富的監督(supervision)信號來訓練優化模型參數保證模型的精度,又採取one-to-one進行推斷(inference)來避免nms後處理從而提高推斷速度。論文作者將這種方式稱為:雙重標籤分配(dual label assignment)。

2.對yolo模型的結構進行改良,推出全面效率-準確性驅動的模型設計(holistic efficiency-accuracy driven model design),在效率(efficiency)和精確度(accuracy)兩方面進行改良。

一、雙重標籤分配

存在問題:

yolo通常在訓練過程中採用一對多的標籤分配策略,其中一個真實情況(ground-truth)物體對應於多個正(positive)樣本。儘管這種方法取得了優越的性能,但它需要在推理過程中使用nms(non-maximum suppression,非極大值抑制)來選擇最佳的陽性預測。這降低了推理速度,並使性能對nms的超參數敏感,從而阻礙了yolo實現最優的端到端部署。解決這個問題的一條途徑是採用最近引入的端到端detr架構。例如,rt-detr提出了一種有效的混合編碼器和非確定性最小 query 選擇,將detr推向了實時應用領域。然而,部署detr的固有複雜性阻礙了它在準確性和速度之間達到最優平衡的能力。另一條途徑是探索基於cnn的檢測器的端到端檢測,這通常利用一對一的分配策略來抑制冗餘預測。然而,它們通常引入額外的推理開銷或達到次優性能。

解決方案:

yolov10提出了一種新的訓練方法,即"dual assignments"。這種方法在訓練階段同時使用one-to-many(一對多)和one-to-one(一對一)的標籤分配策略。研究人員在head部分原本的one-to many基礎上多加上了一個one-to-one的部分,它保持與原始一對多分支相同的結構,並採用相同的優化目標,但利用一對一匹配來獲得標籤賦值。在訓練期間,兩個頭部與模型一起優化,允許backbone和neck享受由一對多賦值提供的豐富監督。在推理期間, 研究人員丟棄一對多頭部,使用一對一頭部進行預測。這使得yolo能夠實現無需任何額外推理成本的端到端部署。此外,為了確保兩個頭部在訓練過程中的監督信號一致性,論文還提出了"consistent matching metric"(一致的匹配度量),確保one-to-one頭部在選擇預測時與one-to-many頭部的最佳預測保持一致,從而在推理時提供高質量的樣本,提高性能。(詳情請參考論文)具體原理可參考下圖:
YOLOv10性能效率大幅提升,清華開源新一代實時目標監測模型 - 天天要聞


二、全面效率-準確性驅動的模型設計(holistic efficiency-accuracy driven model design)

效率驅動的模型設計:(提高效率,減小計算成本)

yolo的組件包括幹線(stem)、下採樣層(downsampling layers)、具有基本構建塊的階段(stages with basic building blocks)和頭部(head)。幹線產生的計算成本很少,因此 研究人員對其他三個部分進行了效率驅動的模型設計。

1.輕量級分類頭部。在yolo中,分類和回歸頭部通常具有相同的架構。然而,它們在計算開銷上表現出顯著的差異。例如,在yolov8-s中,分類頭部(5.95g/1.51m)的flops和參數計數是回歸頭部(2.34g/0.64m)的2.5倍和2.4倍。然而,經過分析分類誤差和回歸誤差(見表6)的影響後,研究人員發現回歸頭部對yolo的性能更為重要。因此,可以在不擔心大幅損害性能的情況下減少分類頭部的開銷。研究人員簡單地為分類頭部採用了輕量級架構,該架構由兩個深度可分離卷積[24,8]組成,核大小為3×3,後跟1×1卷積。

2.空間-通道解耦下採樣。yolo通常利用標準的3×3卷積,步長為2,同時實現空間下採樣(從h×w到h^2×w^2)和通道轉換(從c到2c)。這引入了不可忽視的計算成本o(9^2hwc^2)和參數數量o(18c^2)。研究人員提議將空間縮減和通道增加操作解耦,實現更高效的下採樣。具體來說,首先利用點卷積來調節通道維度,然後使用深度卷積來執行空間下採樣。這將計算成本降低到o(2hwc^2 + 9^2hwc),參數數量降低到o(2c^2 + 18c)。同時,它最大化了下採樣期間的信息保留,更好地降低了延遲。

3.等級引導的塊設計。yolo通常對所有階段使用相同的基本構建塊設計,例如yolov8中的瓶頸塊(the bottleneck block)。為了徹底檢查yolo的這種同質設計,研究人員利用內在秩來分析每個階段的冗餘。具體來說,研究人員計算每個階段最後一個基本塊中最後一個卷積的數值秩,這統計了大於某個閾值的奇異值的數量。
YOLOv10性能效率大幅提升,清華開源新一代實時目標監測模型 - 天天要聞
圖(a)展示了yolov8的結果,表明深層階段和大型模型更容易表現出更多的冗餘。這一觀察表明,簡單地對所有階段應用相同的塊設計對於最佳容量-效率權衡來說是次優的。為了解決這個問題,研究人員提出了一個等級引導的塊設計方案,旨在使用緊湊的架構設計降低顯示出冗餘的階段的複雜性。
首先,研究人員提出了一個緊湊的倒置塊(cib)結構,它採用成本低廉的深度卷積進行空間混合和成本效益高的點卷積進行通道混合,如圖(b)所示。它可以作為高效的基本構建塊,例如嵌入到elan結構中(見圖(b))。
然後,他們提倡一個等級引導的塊分配策略,以實現最佳的效率,同時保持競爭力的能力。具體來說,給定一個模型,根據它們的內在秩按升序對它的所有階段進行排序。進一步地,研究人員檢查用cib替換領先階段(leading stage)的基本塊時的性能變化。如果沒有與給定模型相比的性能下降,研究人員繼續替換下一個階段,並在性能下降時停止該過程。因此,研究人員可以在不同階段和模型尺度上實現自適應的緊湊塊設計,實現更高的效率,而不影響性能。

三、準確性驅動的模型設計:(提高準確性)

研究人員進一步探索了大核卷積和自注意力,以準確性為驅動進行設計,旨在在最低成本下提高性能。

1.大核卷積。使用大核深度卷積是擴大感受野和增強模型能力的有效方法。然而,簡單地在所有階段使用它們可能會引入淺層特徵的污染,這些特徵被用來檢測小物體,同時也會引入高分辨率階段的顯著i/o開銷和延遲。因此,研究人員提議在深層階段的cib中使用大核深度卷積。具體來說,研究人員將cib中第二個3×3深度卷積的核大小增加到7×7,參考。此外,研究人員採用結構重參數化技術,引入另一個3×3深度卷積分支,以減輕優化問題,而不增加推理開銷。此外,隨着模型大小的增加,其感受野自然擴大,使用大核卷積的好處也在減少。因此,研究人員只為小模型尺度採用大核卷積。

2.部分自注意力(psa)。由於其顯著的全局建模能力,自注意力被廣泛用於各種視覺任務。然而,它表現出高計算複雜性和內存佔用。為了解決這個問題,鑒於普遍存在的注意力頭冗餘,研究人員設計了一個高效的部分自注意力(psa)模塊設計,如圖(c)所示。具體來說,研究人員在1×1卷積後將特徵均勻地跨通道分成兩部分。只將一部分輸入由多頭自注意力模塊(mhsa)和前饋網絡(ffn)組成的npsa塊。然後將兩部分連接起來,並通過1×1卷積進行融合。此外,將查詢和鍵的維度設置為mhsa中值的一半,並將layernorm替換為batchnorm,以實現快速推理。此外,psa僅放置在具有最低分辨率的第4階段之後,避免了自注意力的二次計算複雜性帶來的過度開銷。通過這種方式,可以將全局表示學習能力以低計算成本納入yolo,這很好地增強了模型的能力並改進了性能。

本文是對yolov10的簡單介紹,更多詳細信息請查詢論文:

論文地址:https://arxiv.org/pdf/2405.14458

項目地址:https://github.com/thu-mig/yolov10

整理丨張皓程

編輯丨趙雅鑫

-----    end   -----

始智ai wisemodel開源社區最近上線了開源模型的在線體驗功能,已經有近50個大模型可以直接進行在線體驗。在線體驗的創建無需任何代碼開發,人人都可以來玩開源大模型。歡迎前往wisemodel.cn社區進行體驗,若需指引可以參考《》。大家研發的模型也可以發佈到wisemodel社區,同時適配一下wisemodel-api,相應模型就可以直接在線運行了。如果有需要模型的在線推理運行託管服務,也歡迎聯繫我們。
YOLOv10性能效率大幅提升,清華開源新一代實時目標監測模型 - 天天要聞

wisemodel相關

系統升級

YOLOv10性能效率大幅提升,清華開源新一代實時目標監測模型 - 天天要聞
YOLOv10性能效率大幅提升,清華開源新一代實時目標監測模型 - 天天要聞

科技分類資訊推薦

維修更自由:蘋果宣布將增強 iPhone 對第三方顯示屏和電池的支持 - 天天要聞

維修更自由:蘋果宣布將增強 iPhone 對第三方顯示屏和電池的支持

IT之家 6 月 26 日消息,蘋果今天發佈了一份白皮書,概述了公司在設備可維修性和耐用性方面的政策。蘋果在其中透露,iPhone 將在 2024 年晚些時候「更好地支持第三方顯示屏和電池」。首先,蘋果表示今年晚些時候 True Tone 功能將兼容第三方 iPhone 顯示屏:True Tone 功能需要通過校準才能正常工作,由於無法為第三方顯示...
支付寶怎麼關閉自動充值話費?手把手教你! - 天天要聞

支付寶怎麼關閉自動充值話費?手把手教你!

雖然在支付寶開通自動充值話費能保證手機不因欠費而停機,但是有很多人表示會產生莫名扣費,甚至有人出現兩次扣費的情況,想要關閉卻找不到入口了。那該怎麼辦呢?今天的視頻一定能幫到您,感興趣的朋友一起來看看吧。
機械革命極光X遊戲本細節公布 - 天天要聞

機械革命極光X遊戲本細節公布

IT之家 6 月 26 日消息,機械革命旗下主打高性價比的極光系列官宣迎來一位新成員 —— 極光 X 遊戲本,該遊戲本將採用全新的模具,至高可選擇酷睿 i7-14650HX 處理器搭配 GeForce RTX 4070 顯卡。
賽力斯怎麼抱上華為大腿的 博主:張興海讓CTO親自送車上門給余承東試車 - 天天要聞

賽力斯怎麼抱上華為大腿的 博主:張興海讓CTO親自送車上門給余承東試車

快科技6月26日消息,誰能想到,數年前還籍籍無名的東風小康,抱上華為大腿,更名賽力斯後,股價一飛衝天,市值一度超過1500億元,成為中國造車新勢力中的龍頭品牌。而賽力斯之所以能和華為搭上線,這期間還有一段往年秘事,日前,有博主發視頻,將賽力斯和華為合作的初始淵源,給網友講述了出來。據博主介紹,2020年底時,...
湖北電信天地一體「潮科技」,築牢防汛安全「堤壩」 - 天天要聞

湖北電信天地一體「潮科技」,築牢防汛安全「堤壩」

極目新聞記者 蘭莎通訊員 許國勝 蔡源源6月18日,湖北入梅,梅雨期雨水集中、強度大、致災風險高,湖北省防辦已要求全省各地全力做好「防淹」「防災」「防險」工作。近日,極目新聞記者走訪中國電信湖北公司,現場觀看多重保障基站搭建、「衛星通信」、無人機等新型防汛通信裝備演練。現場體驗5G-A、人工智能、手機直連衛星...
純電續航318km 2025款嵐圖FREE 318評測解析 - 天天要聞

純電續航318km 2025款嵐圖FREE 318評測解析

在剛過去的5月,嵐圖汽車累計交付新車4521輛,同比增長51%;1-5月累計交付新車24869輛,同比增長107%,銷量穩定攀升。作為嵐圖汽車旗下的暢銷中大型SUV,嵐圖FREE近期帶來了它的全新版本——2025款嵐圖FREE 318,這款車擁有318km純電續航,是混動SUV純電續航最長的車型,綜合續航達到1458km,連跨2、3個省市的長途自駕游也...
何俊聰有新職!曾任東莞市麻涌鎮鎮長 - 天天要聞

何俊聰有新職!曾任東莞市麻涌鎮鎮長

6月26日上午,東莞市十七屆人大常委會第二十二次會議召開,表決通過人事任免事項;其中,任命何俊聰為東莞市信訪局局長,免去趙胤的東莞市信訪局局長職務。何俊聰。
中國國家版本館第二批版本捐贈入藏大會舉行,萬方數據知識服務平台入藏 - 天天要聞

中國國家版本館第二批版本捐贈入藏大會舉行,萬方數據知識服務平台入藏

近日,中國國家版本館第二批版本捐贈入藏大會暨「文瀚聚珍」精品版本展在京舉行。本次捐贈包括來自全國有關公藏單位和民間藏家捐贈的1.5萬餘冊/件實物版本和131TB數字版本,呈現歷史文化價值高、版本地域廣泛、數字內容豐富的特點。作為捐贈代表企業,北京萬方數據股份有限公司總經理梁冰出席會議並在捐贈儀式上發言。他表...
OpenAI宣布斷供,國產大模型來「平替」? - 天天要聞

OpenAI宣布斷供,國產大模型來「平替」?

撰文 | 李信馬題圖 | TechRadar不久前,在 ChatGPT 「崩了」的時候,有中國網友自嘲道,發現登不上賬號,都會先卑微地反省下是不是自己的問題,直到 OpenAI 官方發了通知,才確定是對方的問題。而今,情況變得更嚴峻了。