精彩回顧| “NVIDIA AI 研發技術開放日” 演講視頻全集!

在全球 AI 產業生態體系日趨成熟的背景下,加速計算迎來了前所未有的發展空間,在眾多不同應用以及各行各業得到了廣泛應用,相關技術也飛速發展不斷迭代。

10 月 22 日,在 NVIDIA AI 研發技術開放日上,共邀請了 10 位來自 NVIDIA 加速計算專家團隊的講師,深入互聯網核心應用場景,聚焦五大技術熱點,與大家分享了加速計算的優化經驗。

演講視頻已正式上線,歡迎掃描下方二維碼,觀看精彩內容:


演講一 GPU 編程和優化 – 最佳實踐分享

演講嘉賓:NVIDIA 加速計算專家 劉冰 & 鄭鵬

演講簡介:

  • CUDA 編程基礎知識和 CUDA 優化技術
  • 基於 FlashAttention2 與 FlashAttention 的 CUDA 編程最佳實踐


演講二 在 NVIDIA NeMo 中實現大語言模型全周期開發 – 以 LLaMa2 為例

演講嘉賓:NVIDIA 加速計算專家 姚鑫 & 顏子傑

演講簡介:

  • NeMo Framework 介紹
  • 使用 Nemo Framework 進行預訓練,包括優化策略和性能
  • 微調:包括 SFT 和 PEFT
  • RLHF:包括 RLHF 的訓練與性能優化算法
  • 介紹如何將模型導出到 TensorRT-LLM


演講三 TensorRT Hackathon 2023 總結 AIGC 及大語言模型推理的典型案例深入解析

演講嘉賓:NVIDIA 加速計算專家 季光 & 陳庾

演講簡介:

  • TensorRT Hackathon 2023 總結:TensorRT Hackathon 是 NVIDIA 組織的年度編程賽事。我們回顧今年的賽事情況,包括賽題、比賽的組織與結果,並歡迎更多開發者參加比賽。
  • 通過 TensorRT-LLM 中的量化技術加速 LLM 推理


演講四 向量數據庫的加速策略和實戰

演講嘉賓:NVIDIA 加速計算專家 王雍 & 張靜蓉

演講簡介:

  • 介紹 Vector DB 的核心引擎近似最近鄰(ANN)搜索
  • RAPIDS-RAFT 庫中基於 GPU 的 ANN 並行算法和工具,包括:IVF-Flat、IVF-PQ、基於圖的方法等
  • ANN 算法中使用的關鍵優化技術,特別是並行 Top-K 算法


演講五 推薦系統的最新優化策略和實踐 – 以 HPS 為例

演講嘉賓:NVIDIA 加速計算專家 魏英燦 & 王澤寰

演講簡介:

  • 用於推薦系統推理加速的分級參數服務器(HPS)框架介紹
  • 高性能 GPU 推理緩存的設計思路與實現細節
  • HPS 與 GPU 推理緩存的性能評估