性能是其它AI PC的60倍,英偉達如何變革端側AI?

2024年01月09日18:35:15 科技 1855

2024年,AI PC無疑是消費級市場中最受關注的焦點,同時端側大模型及生成式AI的熱度仍在持續上升。隨着越來越多AI PC新品的發布,PC產業正在迎來一場新的革命。

而這場革命中必然少不了英偉達。就在今日,英偉達於CES 2024中發布了GeForce RTX 40 SUPER系列產品,並正式對外宣布已優化的軟件、庫及工具。

英偉達新的軟硬件產品不僅將為遊戲玩家帶來全新的AI遊戲體驗,還將推動端側生成式AI的普及。

性能是其它AI PC的60倍,英偉達如何變革端側AI? - 天天要聞

RTX 40 SUPER系列發布,英偉達加入AI PC主戰場

AI PC,是指具備集成軟硬件混合式智能學習與推理能力的計算機。

但目前業內對AI PC的定義仍較為模糊,以西南證券的研究報告為例,其將AI PC定義為:在架構設計上,AI PC最重要的是嵌入了AI芯片,形成“CPU+GPU+NPU”的異構方案。

不過,英偉達在不使用NPU的情況下,仍能讓PC表現出優異的性能,其表示:“以宏碁、華碩、戴爾、惠普、聯想微星等合作夥伴發布全新RTX AI筆記本電腦為例,與使用NPU相比,RTX AI筆記本電腦的性能可提升20-60倍。”

不過無論AI PC該如何被定義,在這一波浪潮中,產品性能才是王道,擁有創造和運行生成式AI的生態才是標準。這點也可以從其新款RTX 40 SUPER系列產品看出。

雷峰網了解到,本次發布性能最高的GeForce RTX 4080 SUPER,在AI工作負載方面,生成視頻的速度比RTX 3080 Ti快1.5倍,生成圖像的速度比RTX 3080 Ti快1.7倍。SUPER GPU的Tensor Core可提供最高可達836 AI TOPS。

而新發布的GeForce RTX 4070 Ti SUPER則是擁有更多核心,顯存容量增至 16GB,顯存位寬為256 bits。比RTX 3070 Ti快1.6倍,打開DLSS 3後,比RTX 3070 Ti快2.5 倍。而RTX 4070 SUPER,則是核心數量比RTX 4070多20%,使其僅使用RTX 3090的一小部分功耗就實現了超越RTX 3090的性能,藉助DLSS 3,它的性能領先優勢將擴大到1.5倍。

性能是其它AI PC的60倍,英偉達如何變革端側AI? - 天天要聞

基於強大的AI性能,英偉達的GeForce GPU將給包括遊戲玩家在內的用戶帶來全新的AI體驗。

遊戲玩家的全新體驗和端側AI的全面普及

英偉達推出了NVIDIA ACE(Avatar Cloud Engine)微服務,它使用生成式AI讓遊戲NPC變得更真實,旨在增強用戶與遊戲NPC之間的交互。具體表現為,用戶以自然語言對遊戲NPC說話後,NPC並無預設回復,而是由大模型生成NPC的反應、回復內容、語音、口型、神態。背後的大模型可以運行在雲上,也可以運行在PC端。

同時,英偉達發布了NVIDIA RTX Remix,用於創建經典遊戲RTX重製版的平台。測試版將於本月底發布,提供生成式AI工具,可將經典遊戲中的基本紋理轉化物理精準的4K高精度材質。

幀率提升方面,NVIDIA DLSS 3支持幀生成技術(Frame Generation),可利用AI將幀率提高到原生渲染的4倍,據了解,這將用於已發布的14款全新RTX遊戲中的十幾款遊戲中,包括《地平線:西之絕境》(Horizon Forbidden West)、Pax Dei和《龍之信條 2》(Dragon’s Dogma 2)等。[Bb1]

AI開發者也可以充分利用端側強大的AI能力,讓生成式AI無處不在。

英偉達月底即將上線NVIDIA AI Workbench工具包,允許開發者在PC或工作站上快速創建、測試和自定義預訓練的生成式AI模型和LLM,並且項目可擴展到數據中心、公有雲或NVIDIA DGX Cloud等,然後再回到PC或工作站上的本地RTX系統進行推理和輕量定製。該工具還簡化了對Hugging Face、GitHub和NVIDIA NGC等流行存儲庫的訪問。

性能是其它AI PC的60倍,英偉達如何變革端側AI? - 天天要聞

NVIDIA AI Foundation Models and Endpoints(包括RTX加速的AI模型和軟件開發工具包)有了新的進展。目前英偉達與惠普達成合作,將其集成到惠普AI Studio中,這是一個集成化的數據科學平台,簡化AI模型的開發。這將使用戶能跨PC和雲輕鬆搜索、導入和部署優化後的模型。並且,為PC使用場景構建AI模型之後,開發者可使用NVIDIA TensorRT對其進行優化,以充分利用RTX GPU的Tensor Core。

英偉達通過TensorRT-LLM for Windows將TensorRT擴展到基於文本的應用,目前最新更新現已發布,將Phi-2加入不斷增長的PC預優化模型列表,與其他backend相比推理速度提升5倍;另一方面,TensorRT擴展更新版的發布,令加速Stable Diffusion XL (SDXL) Turbo和LCM的性能提升了60%。[Bb2]

英偉達還宣布了一項為AI愛好者而設計的技術Demo——Chat with RTX。據了解,這項服務或將作為開源參考項目於月底發布,讓用戶通過"檢索增強生成retrieval-augmented generation(RAG)",可將PC LLM連接到自己的數據。該Demo由TensorRT-LLM 加速,使用戶快速與自己的筆記、文檔和其他內容進行交互。

科技分類資訊推薦

獲國家級認可!深圳這家醫院自主研發智慧養老評估系統入選國家推廣目錄 - 天天要聞

獲國家級認可!深圳這家醫院自主研發智慧養老評估系統入選國家推廣目錄

近日,工業和信息化部、民政部、國家衛生健康委員會聯合發布了《智慧健康養老產品及服務推廣目錄(2024年版)》,深圳市第二人民醫院大鵬新區南澳醫院(南澳人民醫院)自主研發的“智慧老年人需求與綜合能力評估系統”脫穎而出,成功入選老年人能力評估類目錄,全國僅3例。這一系統的入選,標誌着南澳人民醫院在智慧養老領...
Manus跑路了嗎? - 天天要聞

Manus跑路了嗎?

衡宇 發自 凹非寺量子位 | 公眾號 QbitAIManus,真的從國內撤了?!4個月前一夜躥紅起飛的AI Agent產品Manus,剛被曝出背後公司一舉裁掉國內七成團隊。事實上,Manus總部已在5月搬到了新加坡,國內員工何去何從?現在答
美團:任何騎手學歷的總量數據都無事實依據 - 天天要聞

美團:任何騎手學歷的總量數據都無事實依據

IT之家 7 月 10 日消息,美團今日通過“小團有話說”公眾號對“丁 X 昭為什麼送外賣”進行回應:近期,短視頻賬號“丁 X 昭頻道”發布多條身着美團騎手工服的視頻被廣泛關註:視頻中,丁 X 昭自述今年 39 歲,2004 年參加高考,是清華本科、北大與牛津雙碩士、南洋理工大學博士,曾任新加坡國立大學博士後研究員,目前在送...
潤滑鑄鋼魂 | 埃克森美孚中國攜創新方案助鋼鐵設備升級 - 天天要聞

潤滑鑄鋼魂 | 埃克森美孚中國攜創新方案助鋼鐵設備升級

在鋼鐵行業加速推進綠色低碳與智能化轉型的背景下,由中國設備管理協會冶金行業國際合作服務中心主辦的2025(第二屆)鋼鐵設備大會在張家港舉行。大會以“創新裂變·智驅未來”為主題,聚合政府部門、行業協會、研究機構及鋼鐵產業鏈上下游企業的眾多專業人士,共議冶金裝備在碳約束時代的技術突圍路徑與低碳發展範式。作為...
享界星享之夜耀啟新程:新標亮相,智造升級,用戶共鑒豪華新篇 - 天天要聞

享界星享之夜耀啟新程:新標亮相,智造升級,用戶共鑒豪華新篇

在汽車工業的百年變革中,中國新能源汽車正以智能化與高端化的姿態重新定義豪華。北汽集團與華為聯合打造的享界超級工廠,不僅是一座工廠,更是中國智造邁向全球價值鏈高端的宣言書。這座位於北京密雲區中關村科技園區的工廠,集成了20年豪華車製造經驗與尖端數字技術,每一台駛
iQOO不講武德,驍龍8Gen3手機重回1571元,120W閃充+5000萬雙攝 - 天天要聞

iQOO不講武德,驍龍8Gen3手機重回1571元,120W閃充+5000萬雙攝

什麼時候選購手機是一年之中最划算的時候呢?結合往年的慣例,一般都是每年的618或者是雙11的時候,因為這個時間點,大部分廠商都會通過讓利的方式大幅拉低旗下手機的入手門檻,無論是選擇中端旗艦還是選擇高端手機,都能夠獲得相對有吸引力的價格。