TensorRT極致推理加速,望塵科技打造AI體育全場景多維重構引擎

2022年12月02日22:31:08 科技 1734

深圳望塵科技公司擁有國內領先的 AI 視覺演算法團隊和實時渲染引擎,十年來一直專註於體育遊戲與其相關 AI 視覺技術的研發,積累了巨量的球員角色資料庫,不僅有所有在國際足聯註冊的 2 萬名職業球員精確到厘米的球員體型、骨長、BMI、體脂肌肉比等數據,還有數千名頂級球員高精度的 3D 模型,幾乎全球所有主要球場的高精度模型。


基於這些高質量結構化的數據,Arena4D 可將捕捉結果在實時渲染引擎中以接近照片級真實的質量渲染,用完全自由的鏡頭特效和運鏡方式實現前所未有的震撼體驗。


Arena4D 空間追蹤識別及數據處理

面臨算力挑戰


  • 球員和球的運動速度快,姿態變化大,且衣服外貌相似性較大,難以使用行業通用的 MOT 演算法進行高質量的追蹤和姿態識別。
  • 即使是 4k 圖像,球員和球在圖像中太小,追蹤困難。
  • 多台高清攝像頭每幀圖像需上傳到顯卡進行實時轉碼、降噪等前處理工作,數據吞吐量較大。
  • 基於神經網路的計算流水線,需要實時進行多個視角、多個運動員的追蹤、識別、姿態估計與降噪計算。
  • 在多個 AI 模型級聯計算流水線中,每個 AI 模型之間的數據處理與拷貝佔用了大量的時間。

NVIDIA AI 計算平台為 Arena4D

實現全流程GPU加速提供算力支持


基於以上挑戰,望塵科技選擇了採用 NVIDIA AI 計算平台來提供支持,使用後給研發和項目落地帶來了巨大的支持和提升。


1、基於 GalaSports 體育遊戲渲染生成巨量的合成數據,在 NVIDIA 數據中心 GPU 上進行加速訓練。首先在有 GT 的合成數據上訓練基礎網路,然後再在手工標註的真實數據上進行 finetune。


2、Arena4D 採用了 NVIDIA TensorRT 推理加速引擎,TensorRT 首先對神經網路進行量化處理,然後再優化、合併運算元,最後經過 Batch 化,推理處理速度較原來提升了 4-12 倍,能高效地處理多路攝像頭 4k 高清數據,實時提取球員的 3D Pose 和外貌特徵並進行匹配計算。


3、將原有基於 CPU 運行的數據拷貝,圖像格式轉換,圖像 crop/resize 等耗時較多的操作流水線,利用 CUDA 進行實現,完全切換到 GPU 處理,比起 CPU 實現的方案,加速 50~100 倍。


4、針對體育場景中運動員速度快、運動幅度大、圖像中尺寸小的特點,改進了網路結構和運算元,使其適合體育場這種稀疏變化,追蹤角色小的場景;提升了 MOT 演算法,通過多個視圖的 fusion 網路對 2D 追蹤結果進行 finetune,實現多視圖在 3D 空間的追蹤。


TensorRT極致推理加速,望塵科技打造AI體育全場景多維重構引擎 - 天天要聞

圖1:整體流程

圖片來源及所屬:Galasports 望塵科技


5、針對神經網路流水線的計算延遲問題,首先根據體育比賽的使用場景與相機視角對模型結構進行了優化,根據不同體育類型的相機機位和球場尺度,設計了專門針對特定比賽的識別網路,大大降低了網路的複雜度;基於連續幀的姿態計算骨長度和 BMI 等球員特徵,在資料庫中進行匹配提升識別準確率;針對多相機從內存到顯存大量數據拷貝 IObound 問題,使用 CUDA 多流技術實現了內存拷貝與數據處理並行化,降低了 overhead,4 路4k 相機數據的拷貝與轉碼從 50ms 減少到 30ms;然後使用量化工具對網路進行 fp16/int8(QAT) 量化加速,最後使用 NVIDIA TensorRT 針對 NVIDIA 數據中心 GPU 編譯,在 NVIDIA 數據中心 GPU 上能達到最優性能的模型。


TensorRT極致推理加速,望塵科技打造AI體育全場景多維重構引擎 - 天天要聞

圖2:計算延遲解決思路

圖片來源及所屬:Galasports 望塵科技


6、整個流水線經過 TensorRT 編譯運行在 NVIDIA 數據中心 GPU 上,每路視頻信號由一張 GPU 進行實時計算,最後在 CPU 中對多路計算結果降噪融合。最終,以足球場場景為例,追蹤目標為 1 個足球 + 22 名球員 + 3 名教練的位置與骨骼,在一張 NVIDIA 數據中心 GPU 設備上我們實現了平均 50ms/幀的速度,在二張 NVIDIA 數據中心 GPU 設備上能達到平均 30ms/幀的速度,整個流水線比原型提升了 18 倍。


使用了 NVIDIA TensorRT 推理加速引擎NVIDIA 數據中心計算卡,Arena4D 整個流水線可實時運行,進一步提升了用戶使用體驗,為擴展 AI 體育方向的其他業務、甚至是 XR 場景的加入打下了良好的基礎。


NVIDIA 助力望塵科技

打造新一代實時 AI 體育全場景多維重構引擎


Arena4D 通過 NVIDIA TensorRT 等技術,實現了多視圖在 3D 空間的追蹤、提升了識別骨長度和 BMI 等球員特徵的準確率、完成了內存拷貝與數據處理的並行化、改進了網路結構和運算元使其適合體育場的稀疏變化,最終實現全流程 GPU 加速,速度提升超過 50~100 倍。


AI 體育行業是最受關注的人工智慧應用領域之一,傳統的體育企業也開始擁抱科技,紛紛引入人工智慧產業。一個集技術、人才與場景優勢的科技企業必須與一個優秀的合作夥伴一起積極開拓和長期發展。NVIDIA 提供的 GPU 解決方案,解決了深度學習和機器學習的技術難題,使得望塵科技在 AI 體育領域能夠持續不斷地創新產品,拓寬 AI 應用場景,為觀眾和球迷提供新時代的數字化全新觀賽體驗。


NVIDIA 初創加速計劃


望塵科技是 NVIDIA 初創加速計劃 (NVIDIA Inception) 會員企業。NVIDIA 初創加速計劃為免費會員制、旨在培養顛覆行業格局的優秀創業公司。該計劃聯合國內外知名的風投機構,創業孵化器,創業加速器,行業合作夥伴以及科技創業媒體等,打造創業加速生態系統。能夠提供產品折扣,技術支持,市場宣傳,融資對接,業務推薦等一系列服務,加速創業公司的發展。


想獲得 NVIDIA 初創加速生態助力?掃描下方二維碼,僅需一分鐘填寫意向申請表單,獲得快速聯繫。


TensorRT極致推理加速,望塵科技打造AI體育全場景多維重構引擎 - 天天要聞

TensorRT極致推理加速,望塵科技打造AI體育全場景多維重構引擎 - 天天要聞

科技分類資訊推薦

華為砸300個億,在貴州建全球最牛的數據中心!為什麼選貴州? - 天天要聞

華為砸300個億,在貴州建全球最牛的數據中心!為什麼選貴州?

文|青茶前言在數字經濟高速發展的今天,算力成為推動社會進步和科技創新的關鍵力量。貴州,憑藉優越的自然條件和政策支持,正迅速崛起為中國乃至全球的算力高地。華為在貴州砸下300億元巨資建設的雲智算中心,集聚了超過百萬台伺服器,成為全球最大規模的
阿維塔全系車型齊聚重慶車展 展現品牌實力與創新 - 天天要聞

阿維塔全系車型齊聚重慶車展 展現品牌實力與創新

作為重慶車展的主場品牌,阿維塔以單品均價超27萬元和四年銷量超15萬輛的業績奠定了它在中國豪華品牌的巋然地位。四年時間,這個品牌走完了其他品牌至少需要八年的發展歷程,這就是令人驚嘆的「阿維塔速度」。
小米新品發布會定檔 6 月 26 日,MIX Flip 2、REDMI K80 至尊版、小米 YU7 SUV 同期發布 - 天天要聞

小米新品發布會定檔 6 月 26 日,MIX Flip 2、REDMI K80 至尊版、小米 YU7 SUV 同期發布

今天上午,小米官方以及旗下 REDMI 品牌正式官宣,將於本周四 6 月 26 日舉行小米人車家全生態發布會並發布多款新品。包括小米首款 SUV,小米 YU7、小米 MIX Flip 2 小摺疊旗艦手機、小米平板 7S Pro、REDMI K80 至尊版、REDMI K Pad 等產品在內。除此之外,據爆料顯示還將包括小米 AI 眼鏡、小米開放式耳機 Pro
三星 Exynos 2500 晶元發布, Galaxy Z Flip7 首發搭載 - 天天要聞

三星 Exynos 2500 晶元發布, Galaxy Z Flip7 首發搭載

近日,三星正式發布了旗下新一代旗艦處理器三星 Exynos 2500 晶元。據悉,三星 Exynos 2500 基於三星 3nm GAA 工藝打造,採用 10 核心設計,具體為 1 顆 3.3GHz 主頻 Cortex-X925 大核心 +2 顆 2.74GHz 主頻 Cortex-A725 核心 +5 顆 2.36GHz 主頻 Cortex-A725 核心
iQOO 15 迎早期爆料, 6.85 英寸 2K 解析度三星 LTPO 四窄邊大直屏加持 - 天天要聞

iQOO 15 迎早期爆料, 6.85 英寸 2K 解析度三星 LTPO 四窄邊大直屏加持

今天,數碼博主數碼閑聊站也帶來了疑似 iQOO 新一代旗艦的最新消息。同時根據目前爆料來看,iQOO 旗艦預計跳過 14 直接以 iQOO 15 命名。據悉,iQOO 15 將會搭載一塊 6.85 英寸 2K 解析度三星 LTPO 四窄邊大直屏,支持 Pol-less 去偏光技術,AR 扛眩光膜等技術,是目前的爆料中子系列旗艦中屏幕規格最高的一款。除此之外目
特斯拉上線Robotaxi:十年押注AI商業化的第一槍|鈦度車庫 - 天天要聞

特斯拉上線Robotaxi:十年押注AI商業化的第一槍|鈦度車庫

圖片來源網路一場遲到的兌現,或許正成為特斯拉未來命運的分水嶺。近日,特斯拉在美國得克薩斯州奧斯汀地區悄然上線Robotaxi試點服務。試運營僅面向受邀用戶開放,服務區域局限於奧斯汀南部,車輛配備安全員,每次乘坐收費4.2美元(約合人民幣30元)。這項低調啟動的服務,雖看似微不足道,卻標誌著特斯拉自動駕駛戰略自20...
成立6個月,公司賣了5億,員工財富自由 - 天天要聞

成立6個月,公司賣了5億,員工財富自由

(圖片由豆包AI生成 提示詞財富自由 遊艇)AI造富到底有多兇猛?近日,一起併購進入我們視野:海外互聯網巨頭Wix宣布,正式收購一家AI初創公司Base44,交易金額為8000萬美元(約合5.7億元人民幣),以現金支付。乍眼一看,交易雙方都