精彩回顾| “NVIDIA AI 研发技术开放日” 演讲视频全集!

在全球 AI 产业生态体系日趋成熟的背景下,加速计算迎来了前所未有的发展空间,在众多不同应用以及各行各业得到了广泛应用,相关技术也飞速发展不断迭代。

10 月 22 日,在 NVIDIA AI 研发技术开放日上,共邀请了 10 位来自 NVIDIA 加速计算专家团队的讲师,深入互联网核心应用场景,聚焦五大技术热点,与大家分享了加速计算的优化经验。

演讲视频已正式上线,欢迎扫描下方二维码,观看精彩内容:


演讲一 GPU 编程和优化 – 最佳实践分享

演讲嘉宾:NVIDIA 加速计算专家 刘冰 & 郑鹏

演讲简介:

  • CUDA 编程基础知识和 CUDA 优化技术
  • 基于 FlashAttention2 与 FlashAttention 的 CUDA 编程最佳实践


演讲二 在 NVIDIA NeMo 中实现大语言模型全周期开发 – 以 LLaMa2 为例

演讲嘉宾:NVIDIA 加速计算专家 姚鑫 & 颜子杰

演讲简介:

  • NeMo Framework 介绍
  • 使用 Nemo Framework 进行预训练,包括优化策略和性能
  • 微调:包括 SFT 和 PEFT
  • RLHF:包括 RLHF 的训练与性能优化算法
  • 介绍如何将模型导出到 TensorRT-LLM


演讲三 TensorRT Hackathon 2023 总结 AIGC 及大语言模型推理的典型案例深入解析

演讲嘉宾:NVIDIA 加速计算专家 季光 & 陈庾

演讲简介:

  • TensorRT Hackathon 2023 总结:TensorRT Hackathon 是 NVIDIA 组织的年度编程赛事。我们回顾今年的赛事情况,包括赛题、比赛的组织与结果,并欢迎更多开发者参加比赛。
  • 通过 TensorRT-LLM 中的量化技术加速 LLM 推理


演讲四 向量数据库的加速策略和实战

演讲嘉宾:NVIDIA 加速计算专家 王雍 & 张静蓉

演讲简介:

  • 介绍 Vector DB 的核心引擎近似最近邻(ANN)搜索
  • RAPIDS-RAFT 库中基于 GPU 的 ANN 并行算法和工具,包括:IVF-Flat、IVF-PQ、基于图的方法等
  • ANN 算法中使用的关键优化技术,特别是并行 Top-K 算法


演讲五 推荐系统的最新优化策略和实践 – 以 HPS 为例

演讲嘉宾:NVIDIA 加速计算专家 魏英灿 & 王泽寰

演讲简介:

  • 用于推荐系统推理加速的分级参数服务器(HPS)框架介绍
  • 高性能 GPU 推理缓存的设计思路与实现细节
  • HPS 与 GPU 推理缓存的性能评估