TensorRT極致推理加速,望塵科技打造AI體育全場景多維重構引擎

2022年12月02日22:31:08 科技 1734

深圳望塵科技公司擁有國內領先的 AI 視覺算法團隊和實時渲染引擎,十年來一直專註於體育遊戲與其相關 AI 視覺技術的研發,積累了巨量的球員角色數據庫,不僅有所有在國際足聯註冊的 2 萬名職業球員精確到厘米的球員體型、骨長、BMI、體脂肌肉比等數據,還有數千名頂級球員高精度的 3D 模型,幾乎全球所有主要球場的高精度模型。


基於這些高質量結構化的數據,Arena4D 可將捕捉結果在實時渲染引擎中以接近照片級真實的質量渲染,用完全自由的鏡頭特效和運鏡方式實現前所未有的震撼體驗。


Arena4D 空間追蹤識別及數據處理

面臨算力挑戰


  • 球員和球的運動速度快,姿態變化大,且衣服外貌相似性較大,難以使用行業通用的 MOT 算法進行高質量的追蹤和姿態識別。
  • 即使是 4k 圖像,球員和球在圖像中太小,追蹤困難。
  • 多台高清攝像頭每幀圖像需上傳到顯卡進行實時轉碼、降噪等前處理工作,數據吞吐量較大。
  • 基於神經網絡的計算流水線,需要實時進行多個視角、多個運動員的追蹤、識別、姿態估計與降噪計算。
  • 在多個 AI 模型級聯計算流水線中,每個 AI 模型之間的數據處理與拷貝佔用了大量的時間。

NVIDIA AI 計算平台為 Arena4D

實現全流程GPU加速提供算力支持


基於以上挑戰,望塵科技選擇了採用 NVIDIA AI 計算平台來提供支持,使用後給研發和項目落地帶來了巨大的支持和提升。


1、基於 GalaSports 體育遊戲渲染生成巨量的合成數據,在 NVIDIA 數據中心 GPU 上進行加速訓練。首先在有 GT 的合成數據上訓練基礎網絡,然後再在手工標註的真實數據上進行 finetune。


2、Arena4D 採用了 NVIDIA TensorRT 推理加速引擎,TensorRT 首先對神經網絡進行量化處理,然後再優化、合併算子,最後經過 Batch 化,推理處理速度較原來提升了 4-12 倍,能高效地處理多路攝像頭 4k 高清數據,實時提取球員的 3D Pose 和外貌特徵並進行匹配計算。


3、將原有基於 CPU 運行的數據拷貝,圖像格式轉換,圖像 crop/resize 等耗時較多的操作流水線,利用 CUDA 進行實現,完全切換到 GPU 處理,比起 CPU 實現的方案,加速 50~100 倍。


4、針對體育場景中運動員速度快、運動幅度大、圖像中尺寸小的特點,改進了網絡結構和算子,使其適合體育場這種稀疏變化,追蹤角色小的場景;提升了 MOT 算法,通過多個視圖的 fusion 網絡對 2D 追蹤結果進行 finetune,實現多視圖在 3D 空間的追蹤。


TensorRT極致推理加速,望塵科技打造AI體育全場景多維重構引擎 - 天天要聞

圖1:整體流程

圖片來源及所屬:Galasports 望塵科技


5、針對神經網絡流水線的計算延遲問題,首先根據體育比賽的使用場景與相機視角對模型結構進行了優化,根據不同體育類型的相機機位和球場尺度,設計了專門針對特定比賽的識別網絡,大大降低了網絡的複雜度;基於連續幀的姿態計算骨長度和 BMI 等球員特徵,在數據庫中進行匹配提升識別準確率;針對多相機從內存到顯存大量數據拷貝 IObound 問題,使用 CUDA 多流技術實現了內存拷貝與數據處理並行化,降低了 overhead,4 路4k 相機數據的拷貝與轉碼從 50ms 減少到 30ms;然後使用量化工具對網絡進行 fp16/int8(QAT) 量化加速,最後使用 NVIDIA TensorRT 針對 NVIDIA 數據中心 GPU 編譯,在 NVIDIA 數據中心 GPU 上能達到最優性能的模型。


TensorRT極致推理加速,望塵科技打造AI體育全場景多維重構引擎 - 天天要聞

圖2:計算延遲解決思路

圖片來源及所屬:Galasports 望塵科技


6、整個流水線經過 TensorRT 編譯運行在 NVIDIA 數據中心 GPU 上,每路視頻信號由一張 GPU 進行實時計算,最後在 CPU 中對多路計算結果降噪融合。最終,以足球場場景為例,追蹤目標為 1 個足球 + 22 名球員 + 3 名教練的位置與骨骼,在一張 NVIDIA 數據中心 GPU 設備上我們實現了平均 50ms/幀的速度,在二張 NVIDIA 數據中心 GPU 設備上能達到平均 30ms/幀的速度,整個流水線比原型提升了 18 倍。


使用了 NVIDIA TensorRT 推理加速引擎NVIDIA 數據中心計算卡,Arena4D 整個流水線可實時運行,進一步提升了用戶使用體驗,為擴展 AI 體育方向的其他業務、甚至是 XR 場景的加入打下了良好的基礎。


NVIDIA 助力望塵科技

打造新一代實時 AI 體育全場景多維重構引擎


Arena4D 通過 NVIDIA TensorRT 等技術,實現了多視圖在 3D 空間的追蹤、提升了識別骨長度和 BMI 等球員特徵的準確率、完成了內存拷貝與數據處理的並行化、改進了網絡結構和算子使其適合體育場的稀疏變化,最終實現全流程 GPU 加速,速度提升超過 50~100 倍。


AI 體育行業是最受關注的人工智能應用領域之一,傳統的體育企業也開始擁抱科技,紛紛引入人工智能產業。一個集技術、人才與場景優勢的科技企業必須與一個優秀的合作夥伴一起積極開拓和長期發展。NVIDIA 提供的 GPU 解決方案,解決了深度學習和機器學習的技術難題,使得望塵科技在 AI 體育領域能夠持續不斷地創新產品,拓寬 AI 應用場景,為觀眾和球迷提供新時代的數字化全新觀賽體驗。


NVIDIA 初創加速計劃


望塵科技是 NVIDIA 初創加速計劃 (NVIDIA Inception) 會員企業。NVIDIA 初創加速計劃為免費會員制、旨在培養顛覆行業格局的優秀創業公司。該計劃聯合國內外知名的風投機構,創業孵化器,創業加速器,行業合作夥伴以及科技創業媒體等,打造創業加速生態系統。能夠提供產品折扣,技術支持,市場宣傳,融資對接,業務推薦等一系列服務,加速創業公司的發展。


想獲得 NVIDIA 初創加速生態助力?掃描下方二維碼,僅需一分鐘填寫意向申請表單,獲得快速聯繫。


TensorRT極致推理加速,望塵科技打造AI體育全場景多維重構引擎 - 天天要聞

TensorRT極致推理加速,望塵科技打造AI體育全場景多維重構引擎 - 天天要聞

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發佈了控股股東「正在與其他國資央企集團籌劃重組事項」的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日 - 天天要聞

從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日

發佈會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了「廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退「外敵」,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,積架路虎宣布暫停對美出口一個月,奧迪更是直接