性能是其它AI PC的60倍,英偉達如何變革端側AI?

2024年01月09日18:35:15 科技 1855

2024年,AI PC無疑是消費級市場中最受關注的焦點,同時端側大模型及生成式AI的熱度仍在持續上升。隨着越來越多AI PC新品的發佈,PC產業正在迎來一場新的革命。

而這場革命中必然少不了英偉達。就在今日,英偉達於CES 2024中發佈了GeForce RTX 40 SUPER系列產品,並正式對外宣布已優化的軟件、庫及工具。

英偉達新的軟硬件產品不僅將為遊戲玩家帶來全新的AI遊戲體驗,還將推動端側生成式AI的普及。

性能是其它AI PC的60倍,英偉達如何變革端側AI? - 天天要聞

RTX 40 SUPER系列發佈,英偉達加入AI PC主戰場

AI PC,是指具備集成軟硬件混合式智能學習與推理能力的計算機。

但目前業內對AI PC的定義仍較為模糊,以西南證券的研究報告為例,其將AI PC定義為:在架構設計上,AI PC最重要的是嵌入了AI芯片,形成「CPU+GPU+NPU」的異構方案。

不過,英偉達在不使用NPU的情況下,仍能讓PC表現出優異的性能,其表示:「以宏碁、華碩、戴爾、惠普、聯想微星等合作夥伴發佈全新RTX AI筆記本電腦為例,與使用NPU相比,RTX AI筆記本電腦的性能可提升20-60倍。」

不過無論AI PC該如何被定義,在這一波浪潮中,產品性能才是王道,擁有創造和運行生成式AI的生態才是標準。這點也可以從其新款RTX 40 SUPER系列產品看出。

雷峰網了解到,本次發佈性能最高的GeForce RTX 4080 SUPER,在AI工作負載方面,生成視頻的速度比RTX 3080 Ti快1.5倍,生成圖像的速度比RTX 3080 Ti快1.7倍。SUPER GPU的Tensor Core可提供最高可達836 AI TOPS。

而新發佈的GeForce RTX 4070 Ti SUPER則是擁有更多核心,顯存容量增至 16GB,顯存位寬為256 bits。比RTX 3070 Ti快1.6倍,打開DLSS 3後,比RTX 3070 Ti快2.5 倍。而RTX 4070 SUPER,則是核心數量比RTX 4070多20%,使其僅使用RTX 3090的一小部分功耗就實現了超越RTX 3090的性能,藉助DLSS 3,它的性能領先優勢將擴大到1.5倍。

性能是其它AI PC的60倍,英偉達如何變革端側AI? - 天天要聞

基於強大的AI性能,英偉達的GeForce GPU將給包括遊戲玩家在內的用戶帶來全新的AI體驗。

遊戲玩家的全新體驗和端側AI的全面普及

英偉達推出了NVIDIA ACE(Avatar Cloud Engine)微服務,它使用生成式AI讓遊戲NPC變得更真實,旨在增強用戶與遊戲NPC之間的交互。具體表現為,用戶以自然語言對遊戲NPC說話後,NPC並無預設回復,而是由大模型生成NPC的反應、回復內容、語音、口型、神態。背後的大模型可以運行在雲上,也可以運行在PC端。

同時,英偉達發佈了NVIDIA RTX Remix,用於創建經典遊戲RTX重製版的平台。測試版將於本月底發佈,提供生成式AI工具,可將經典遊戲中的基本紋理轉化物理精準的4K高精度材質。

幀率提升方面,NVIDIA DLSS 3支持幀生成技術(Frame Generation),可利用AI將幀率提高到原生渲染的4倍,據了解,這將用於已發佈的14款全新RTX遊戲中的十幾款遊戲中,包括《地平線:西之絕境》(Horizon Forbidden West)、Pax Dei和《龍之信條 2》(Dragon』s Dogma 2)等。[Bb1]

AI開發者也可以充分利用端側強大的AI能力,讓生成式AI無處不在。

英偉達月底即將上線NVIDIA AI Workbench工具包,允許開發者在PC或工作站上快速創建、測試和自定義預訓練的生成式AI模型和LLM,並且項目可擴展到數據中心、公有雲或NVIDIA DGX Cloud等,然後再回到PC或工作站上的本地RTX系統進行推理和輕量定製。該工具還簡化了對Hugging Face、GitHub和NVIDIA NGC等流行存儲庫的訪問。

性能是其它AI PC的60倍,英偉達如何變革端側AI? - 天天要聞

NVIDIA AI Foundation Models and Endpoints(包括RTX加速的AI模型和軟件開發工具包)有了新的進展。目前英偉達與惠普達成合作,將其集成到惠普AI Studio中,這是一個集成化的數據科學平台,簡化AI模型的開發。這將使用戶能跨PC和雲輕鬆搜索、導入和部署優化後的模型。並且,為PC使用場景構建AI模型之後,開發者可使用NVIDIA TensorRT對其進行優化,以充分利用RTX GPU的Tensor Core。

英偉達通過TensorRT-LLM for Windows將TensorRT擴展到基於文本的應用,目前最新更新現已發佈,將Phi-2加入不斷增長的PC預優化模型列表,與其他backend相比推理速度提升5倍;另一方面,TensorRT擴展更新版的發佈,令加速Stable Diffusion XL (SDXL) Turbo和LCM的性能提升了60%。[Bb2]

英偉達還宣布了一項為AI愛好者而設計的技術Demo——Chat with RTX。據了解,這項服務或將作為開源參考項目於月底發佈,讓用戶通過"檢索增強生成retrieval-augmented generation(RAG)",可將PC LLM連接到自己的數據。該Demo由TensorRT-LLM 加速,使用戶快速與自己的筆記、文檔和其他內容進行交互。

科技分類資訊推薦

樂動機械人港交所遞交招股書:連續三年虧損,業務單一 - 天天要聞

樂動機械人港交所遞交招股書:連續三年虧損,業務單一

近日,全棧式智能機械人企業樂動機械人正式向港交所遞交招股書,並計劃於港交所主板掛牌上市。樂動機械人成立於2017年11月,主要打造以視覺感知為核心的智能機械人基礎設施並賦能各類智能機械人應用場景,同時提供適合新興應用場景的視覺感知產品及整機
流量焦慮?親測10個野路子引流方法 - 天天要聞

流量焦慮?親測10個野路子引流方法

各位村民好,我是村長不管是做什麼項目,流量最重要。在當下,用戶的注意力被極度分散且同類產品眾多的情況下。好產品,也怕巷子深。另外就算你有好口碑,不主動去做流量,用戶的消費注意力也會被轉移。關於流量的獲取的方法有很多種,今天我在這裡幫大家簡單
第三代半導體怎麼了? - 天天要聞

第三代半導體怎麼了?

近期,碳化硅半導體巨頭Wolfspeed申請破產的消息在業界引起普遍關注。這不僅是今年以來規模最大的破產案之一,更折射出第三代半導體市場正深陷需求不振的困境。第三代半導體廠商相繼倒下Wolfspeed在申請破產保護後,已啟動債務重組程序,預計於今年第三季度末完成。據最新披露的破產重組協議顯示,其重組前總債務高達65億美...
格芯收購MIPS;英特爾考慮關閉Fab28半導體工廠;Imagination否認GPU IP部門被收購 | 新聞速遞 - 天天要聞

格芯收購MIPS;英特爾考慮關閉Fab28半導體工廠;Imagination否認GPU IP部門被收購 | 新聞速遞

五分鐘了解產業大事每日頭條芯聞格芯收購MIPS英特爾宣布在俄勒岡州裁員529人,包含近300名軟硬件工程師英特爾考慮關閉Fab28半導體工廠微星重新進入處理器風冷散熱器市場Imagination否認GPU IP部門被收購華碩、技嘉、微星三大台系板卡廠公布6月及2025年H1營收:上半年同比皆增長20%以上普華永道:十年後全球1/3半導體產能依...