性能是其它AI PC的60倍,英偉達如何變革端側AI?

2024年01月09日18:35:15 科技 1855

2024年,AI PC無疑是消費級市場中最受關注的焦點,同時端側大模型及生成式AI的熱度仍在持續上升。隨着越來越多AI PC新品的發布,PC產業正在迎來一場新的革命。

而這場革命中必然少不了英偉達。就在今日,英偉達於CES 2024中發布了GeForce RTX 40 SUPER系列產品,並正式對外宣布已優化的軟件、庫及工具。

英偉達新的軟硬件產品不僅將為遊戲玩家帶來全新的AI遊戲體驗,還將推動端側生成式AI的普及。

性能是其它AI PC的60倍,英偉達如何變革端側AI? - 天天要聞

RTX 40 SUPER系列發布,英偉達加入AI PC主戰場

AI PC,是指具備集成軟硬件混合式智能學習與推理能力的計算機。

但目前業內對AI PC的定義仍較為模糊,以西南證券的研究報告為例,其將AI PC定義為:在架構設計上,AI PC最重要的是嵌入了AI芯片,形成“CPU+GPU+NPU”的異構方案。

不過,英偉達在不使用NPU的情況下,仍能讓PC表現出優異的性能,其表示:“以宏碁、華碩、戴爾、惠普、聯想微星等合作夥伴發布全新RTX AI筆記本電腦為例,與使用NPU相比,RTX AI筆記本電腦的性能可提升20-60倍。”

不過無論AI PC該如何被定義,在這一波浪潮中,產品性能才是王道,擁有創造和運行生成式AI的生態才是標準。這點也可以從其新款RTX 40 SUPER系列產品看出。

雷峰網了解到,本次發布性能最高的GeForce RTX 4080 SUPER,在AI工作負載方面,生成視頻的速度比RTX 3080 Ti快1.5倍,生成圖像的速度比RTX 3080 Ti快1.7倍。SUPER GPU的Tensor Core可提供最高可達836 AI TOPS。

而新發布的GeForce RTX 4070 Ti SUPER則是擁有更多核心,顯存容量增至 16GB,顯存位寬為256 bits。比RTX 3070 Ti快1.6倍,打開DLSS 3後,比RTX 3070 Ti快2.5 倍。而RTX 4070 SUPER,則是核心數量比RTX 4070多20%,使其僅使用RTX 3090的一小部分功耗就實現了超越RTX 3090的性能,藉助DLSS 3,它的性能領先優勢將擴大到1.5倍。

性能是其它AI PC的60倍,英偉達如何變革端側AI? - 天天要聞

基於強大的AI性能,英偉達的GeForce GPU將給包括遊戲玩家在內的用戶帶來全新的AI體驗。

遊戲玩家的全新體驗和端側AI的全面普及

英偉達推出了NVIDIA ACE(Avatar Cloud Engine)微服務,它使用生成式AI讓遊戲NPC變得更真實,旨在增強用戶與遊戲NPC之間的交互。具體表現為,用戶以自然語言對遊戲NPC說話後,NPC並無預設回復,而是由大模型生成NPC的反應、回復內容、語音、口型、神態。背後的大模型可以運行在雲上,也可以運行在PC端。

同時,英偉達發布了NVIDIA RTX Remix,用於創建經典遊戲RTX重製版的平台。測試版將於本月底發布,提供生成式AI工具,可將經典遊戲中的基本紋理轉化物理精準的4K高精度材質。

幀率提升方面,NVIDIA DLSS 3支持幀生成技術(Frame Generation),可利用AI將幀率提高到原生渲染的4倍,據了解,這將用於已發布的14款全新RTX遊戲中的十幾款遊戲中,包括《地平線:西之絕境》(Horizon Forbidden West)、Pax Dei和《龍之信條 2》(Dragon’s Dogma 2)等。[Bb1]

AI開發者也可以充分利用端側強大的AI能力,讓生成式AI無處不在。

英偉達月底即將上線NVIDIA AI Workbench工具包,允許開發者在PC或工作站上快速創建、測試和自定義預訓練的生成式AI模型和LLM,並且項目可擴展到數據中心、公有雲或NVIDIA DGX Cloud等,然後再回到PC或工作站上的本地RTX系統進行推理和輕量定製。該工具還簡化了對Hugging Face、GitHub和NVIDIA NGC等流行存儲庫的訪問。

性能是其它AI PC的60倍,英偉達如何變革端側AI? - 天天要聞

NVIDIA AI Foundation Models and Endpoints(包括RTX加速的AI模型和軟件開發工具包)有了新的進展。目前英偉達與惠普達成合作,將其集成到惠普AI Studio中,這是一個集成化的數據科學平台,簡化AI模型的開發。這將使用戶能跨PC和雲輕鬆搜索、導入和部署優化後的模型。並且,為PC使用場景構建AI模型之後,開發者可使用NVIDIA TensorRT對其進行優化,以充分利用RTX GPU的Tensor Core。

英偉達通過TensorRT-LLM for Windows將TensorRT擴展到基於文本的應用,目前最新更新現已發布,將Phi-2加入不斷增長的PC預優化模型列表,與其他backend相比推理速度提升5倍;另一方面,TensorRT擴展更新版的發布,令加速Stable Diffusion XL (SDXL) Turbo和LCM的性能提升了60%。[Bb2]

英偉達還宣布了一項為AI愛好者而設計的技術Demo——Chat with RTX。據了解,這項服務或將作為開源參考項目於月底發布,讓用戶通過"檢索增強生成retrieval-augmented generation(RAG)",可將PC LLM連接到自己的數據。該Demo由TensorRT-LLM 加速,使用戶快速與自己的筆記、文檔和其他內容進行交互。

科技分類資訊推薦

廣東:科技提速鄉音尋親,鏈接企業就業資源 - 天天要聞

廣東:科技提速鄉音尋親,鏈接企業就業資源

今年6月19日是第13個全國救助管理機構“開放日”,廣東省民政廳、廣州市民政局在廣州市救助管理站市區分站設立“開放日”活動主會場,省、市救助管理工作特邀監督員、人大代表、政協委員,相關社會組織、志願者、市民群眾代表等走進救助管理機構。2024年,廣州市被民政部、省民政廳確定為救助管理區域性中心試點城市之一。...
卡邦電氣 PLC 控制櫃:工業控制主體力量! - 天天要聞

卡邦電氣 PLC 控制櫃:工業控制主體力量!

在現代工業領域,自動化控制的重要性不言而喻,而 PLC 控制櫃則是實現這一關鍵環節的核心設備。今天,我們就來深入了解一下卡邦電氣的 PLC 控制櫃,看看它是如何在工業舞台上大放異彩的。
2025品牌影響力大,姚遠新能源榮獲多個獎項! - 天天要聞

2025品牌影響力大,姚遠新能源榮獲多個獎項!

2025年6月14日至15日,由《中國企業報》、《中國商界》雜誌社、CCTV《發現品牌》欄目組和中國品牌影響力評價辦公室聯合主辦的“2025(第十二屆)品牌影響力發展大會暨成果發布活動”在北京隆重舉行。
螞蟻消金林嘉南:大模型賦能智能風控,額度互動促進金融健康 - 天天要聞

螞蟻消金林嘉南:大模型賦能智能風控,額度互動促進金融健康

“螞蟻消金希望利用交互式智能風控技術,挖掘年輕人努力成長的證明”。6月19日,在上海舉行的2025中國國際金融展上,螞蟻消金首席風險官林嘉南分享了,如何將大模型技術應用在交互式智能風控領域,從而促進額度的互動性,促進用戶與機構的金融健康。這契合了本屆展會 “開放創新,科技賦能,共創金融新未來”的主題。普惠金...
德國西格瑪(SIGMA Audio)品牌介紹 - 天天要聞

德國西格瑪(SIGMA Audio)品牌介紹

德國西格瑪(SIGMA Audio)品牌溯源:精密工藝與純粹音質的融合德國西格瑪(SIGMA Audio)是享譽全球的高端音響品牌,誕生於德國精密工程與聲學技術的沃土。