性能是其它AI PC的60倍,英偉達如何變革端側AI?

2024年,AI PC無疑是消費級市場中最受關注的焦點,同時端側大模型及生成式AI的熱度仍在持續上升。隨著越來越多AI PC新品的發布,PC產業正在迎來一場新的革命。

而這場革命中必然少不了英偉達。就在今日,英偉達於CES 2024中發布了GeForce RTX 40 SUPER系列產品,並正式對外宣布已優化的軟體、庫及工具。

英偉達新的軟硬體產品不僅將為遊戲玩家帶來全新的AI遊戲體驗,還將推動端側生成式AI的普及。

RTX 40 SUPER系列發布,英偉達加入AI PC主戰場

AI PC,是指具備集成軟硬體混合式智能學習與推理能力的計算機。

但目前業內對AI PC的定義仍較為模糊,以西南證券的研究報告為例,其將AI PC定義為:在架構設計上,AI PC最重要的是嵌入了AI晶元,形成「CPU+GPU+NPU」的異構方案。

不過,英偉達在不使用NPU的情況下,仍能讓PC表現出優異的性能,其表示:「以宏碁、華碩、戴爾、惠普、聯想微星等合作夥伴發布全新RTX AI筆記本電腦為例,與使用NPU相比,RTX AI筆記本電腦的性能可提升20-60倍。」

不過無論AI PC該如何被定義,在這一波浪潮中,產品性能才是王道,擁有創造和運行生成式AI的生態才是標準。這點也可以從其新款RTX 40 SUPER系列產品看出。

雷峰網了解到,本次發布性能最高的GeForce RTX 4080 SUPER,在AI工作負載方面,生成視頻的速度比RTX 3080 Ti快1.5倍,生成圖像的速度比RTX 3080 Ti快1.7倍。SUPER GPU的Tensor Core可提供最高可達836 AI TOPS。

而新發布的GeForce RTX 4070 Ti SUPER則是擁有更多核心,顯存容量增至 16GB,顯存位寬為256 bits。比RTX 3070 Ti快1.6倍,打開DLSS 3後,比RTX 3070 Ti快2.5 倍。而RTX 4070 SUPER,則是核心數量比RTX 4070多20%,使其僅使用RTX 3090的一小部分功耗就實現了超越RTX 3090的性能,藉助DLSS 3,它的性能領先優勢將擴大到1.5倍。

基於強大的AI性能,英偉達的GeForce GPU將給包括遊戲玩家在內的用戶帶來全新的AI體驗。

遊戲玩家的全新體驗和端側AI的全面普及

英偉達推出了NVIDIA ACE(Avatar Cloud Engine)微服務,它使用生成式AI讓遊戲NPC變得更真實,旨在增強用戶與遊戲NPC之間的交互。具體表現為,用戶以自然語言對遊戲NPC說話後,NPC並無預設回復,而是由大模型生成NPC的反應、回復內容、語音、口型、神態。背後的大模型可以運行在雲上,也可以運行在PC端。

同時,英偉達發布了NVIDIA RTX Remix,用於創建經典遊戲RTX重製版的平台。測試版將於本月底發布,提供生成式AI工具,可將經典遊戲中的基本紋理轉化物理精準的4K高精度材質。

幀率提升方面,NVIDIA DLSS 3支持幀生成技術(Frame Generation),可利用AI將幀率提高到原生渲染的4倍,據了解,這將用於已發布的14款全新RTX遊戲中的十幾款遊戲中,包括《地平線:西之絕境》(Horizon Forbidden West)、Pax Dei和《龍之信條 2》(Dragon』s Dogma 2)等。[Bb1]

AI開發者也可以充分利用端側強大的AI能力,讓生成式AI無處不在。

英偉達月底即將上線NVIDIA AI Workbench工具包,允許開發者在PC或工作站上快速創建、測試和自定義預訓練的生成式AI模型和LLM,並且項目可擴展到數據中心、公有雲或NVIDIA DGX Cloud等,然後再回到PC或工作站上的本地RTX系統進行推理和輕量定製。該工具還簡化了對Hugging Face、GitHub和NVIDIA NGC等流行存儲庫的訪問。

NVIDIA AI Foundation Models and Endpoints(包括RTX加速的AI模型和軟體開發工具包)有了新的進展。目前英偉達與惠普達成合作,將其集成到惠普AI Studio中,這是一個集成化的數據科學平台,簡化AI模型的開發。這將使用戶能跨PC和雲輕鬆搜索、導入和部署優化後的模型。並且,為PC使用場景構建AI模型之後,開發者可使用NVIDIA TensorRT對其進行優化,以充分利用RTX GPU的Tensor Core。

英偉達通過TensorRT-LLM for Windows將TensorRT擴展到基於文本的應用,目前最新更新現已發布,將Phi-2加入不斷增長的PC預優化模型列表,與其他backend相比推理速度提升5倍;另一方面,TensorRT擴展更新版的發布,令加速Stable Diffusion XL (SDXL) Turbo和LCM的性能提升了60%。[Bb2]

英偉達還宣布了一項為AI愛好者而設計的技術Demo——Chat with RTX。據了解,這項服務或將作為開源參考項目於月底發布,讓用戶通過"檢索增強生成retrieval-augmented generation(RAG)",可將PC LLM連接到自己的數據。該Demo由TensorRT-LLM 加速,使用戶快速與自己的筆記、文檔和其他內容進行交互。