“工程师的元宇宙”:NVIDIA深度学习技术让2D像瞬间“起立”变3D

2021年04月27日20:19:07 科技 1931

快系好安全带,你的平面汽车可以随时出发!

GANverse3D 由多伦多的 NVIDIA AI 研究实验室开发,作为 NVIDIA Omniverse 平台的扩展应用,它能将平面图像转换成逼真的 3D 模型,并将其可视化地呈现在虚拟空间中,供人们自由操控。

GANverse3D已为美国电视剧《霹雳游侠》 (Knight Rider) 中的 AI 汽车基特 (KITT) 注入新的灵魂。研究人员将汽车基特的平面图像输入到模型中,通过预测相应的 3D 纹理网格, GANverse3D 生成出了基特的 3D 模型,让其在虚拟空间中行驶,并配有逼真的前灯、尾灯和转向灯。

此外,NVIDIA Omniverse 套件和 NVIDIA PhysX 工具还可以将预测的纹理转成高质量材料,使基特具有更加真实的外观和“触感”。

“工程师的元宇宙”:NVIDIA深度学习技术让2D像瞬间“起立”变3D - 天天要闻

(来源:NVIDIA)


通过 GANverse3D ,即使没有 3D 建模方面的知识,建筑师、创作者、游戏开发人员和设计师也能轻松地将平面设计转换成立体模型,并能最大程度削减渲染方面的预算。

“警察抓小偷”式的学习模式

GANverse3D 的基础原理是生成式对抗网络(GAN, Generative Adversarial Networks )。

生成式对抗网络是一种新近的深度学习模型,最早由伊安·好伙伴教授(Ian Goodfellow)于 2014 年提出,一经提出,学界对 GAN 的研究如火如荼。

GAN的框架包括至少两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)。

好伙伴教授将其原理比作制假钞的伪造者 (Generator) 和警察 (Discriminator) 之间的博弈。伪造者不断更新技术制造以假乱真的钞票,警察则需用更先进的技术甄别假钞,两人在对抗中不断升级各自的技能。


因此,在 GAN 模型的训练过程中,生成网络 G(Generator,简称 G) 的任务就是要生成逼真的图像欺骗判别网络 D(Discriminator,简称 D),而 D 的目标是区分 G 生成的图像和真实图像。如此,G 和 D 便构成了一个动态“博弈过程”。最终,在理想情况下,G 能够生成以假乱真的图像成功混淆 D 的判断。

在原始理论中, G 和 D 只要是能够拟合相应模型的函数即可,并不要求二者都是神经网络。但实际开发中人们多使用深度神经网络作为 G 和 D 。一个优秀的 GAN 应用需要科学有效的训练方法,否则神经网络模型的自由性可能会导致输出不理想。

NVIDIA 利用生成式对抗网络形成训练数据集。这就像摄影师绕着一辆停泊的汽车,从不同的角度拍摄以获得多视角图像一样。这些多视角图像最终会被放入逆向图 (inverse graphics) 的渲染框架中,以此合成 3D 图像。

逆向图指是从 2D 图像推断 3D 网格模型的过程。以前的逆向图模型依赖于 3D 图形作为训练数据,NVIDIA 的 GANverse3D 则是根据真实图像进行训练。NVIDIA 研究员 Jun Gao 表示,以真实图像作为训练基础得到的AI模型,“能更好地推广到现实世界中。”

在没有 3D 要素的帮助下,“我们把 GAN 模型变成了一个非常高效的数据生成器,这样我们就可以基于网络上的任何 2D 图像创建出 3D 对象。”NVIDIA 研究员 Wenzheng Chen 说。

有关 GAN verse3D 研究成果将在 5 月份的 ICLR 会议和 6 月份的 CVPR 会议上发表。


为工程师搭建元宇宙

英伟达 CEO 黄仁勋:“科幻小说中的元宇宙已经近了。”


众多科技公司都在从元宇宙 (Metaverse) 概念中汲取灵感,英伟达也不例外,趁热推出元宇宙的工程师版。

黄仁勋在 2021 GTC 大会上宣布,英伟达要推出 to B 端的实时协作仿真平台 Omniverse ——一个面向企业的虚拟工作平台。

英伟达早在去年 10 月推出 Omniverse 测试版,并在游戏、建筑等领域得到应用。宝马、爱立信、沃尔沃、Adobe 等超过超过 17,000 名客户体验了测试版。

黄仁勋在此前的采访中表示, Omniverse 能让游戏开发者轻松应对复杂的流水线工作,以此提升工作效率。在 Omniverse 平台上,动画、纹理、灯光、几何图形等常规游戏制作的流水线工程将能一举打通链接。每个人都能看到他人在做什么,并能做到“眼见为实”。

“工程师的元宇宙”:NVIDIA深度学习技术让2D像瞬间“起立”变3D - 天天要闻

(来源:NVIDIA)

游戏、架构和设计领域的创作者们高度依赖于虚拟世界,在产品完成之前,他们需要测试和可视化其原型。但仅是渲染一辆汽车、一条街道就需要捕获成百上千的多视角图像,期间会产生大量成本。因此并非每位创作者资源和精力将其绘制的图像转成 3D 模型。

基于此, NVIDIA 开发 GANverse3D 应用,可以迅速追踪实时光线来创造一个真实的虚拟世界。

任何 2D 图像都可以在 Omniverse 中转换成可以自定义和制作动画的 3D 图形。

NVIDIA 深度学习工程师 Jean-Francois Lafleche 表示:“Omniverse 让研究人员能够将激动人心的前沿研究直接带给创作者和最终用户。作为 Omniverse 的扩展程序, GANverse3D 将帮助艺术家为游戏开发、城市规划甚至训练新的机器学习模型创建更丰富的虚拟世界。”

科技分类资讯推荐

4999元?华为这款新机,绝对是来捣乱的! - 天天要闻

4999元?华为这款新机,绝对是来捣乱的!

昨天写了一篇文章,当时有博主透露华为将会带来两款新手机,一个新平板。而且还有博主表示,华为的一款新机,将会属于华为nova系列,但不是华为nova13系列。不是华为nova13系列,但是属于华为nova系列。原本怀疑是华为nova12Pro
699元“月薪”聘一位AI主播,靠谱吗? - 天天要闻

699元“月薪”聘一位AI主播,靠谱吗?

作 者丨丁莉编 辑丨张雅婷图 源丨图虫618已近尾声,带货热潮仍未落下帷幕,直播间里却悄然“换帅”。半个多月来,品牌商家直播大面积铺开,汹涌人潮涌入。
为电竞而生 | 凯华&ilovbee联合定制知速轴正式推出! - 天天要闻

为电竞而生 | 凯华&ilovbee联合定制知速轴正式推出!

‍‍  凯华&ilovbee联合定制的知速轴,将在6月17日晚搭载键盘B87首发开售。此款轴体是一款轻克力的快触发轴体,线性手感。  材质上采用了POM轴芯,PC高透上盖以及POM基座的主流配置。POM轴芯与严选高透的PC材质相结合,带来更小的摩擦与更加顺滑的按压体验。  作为一款电竞快触发轴,轴心触发行程是1.2mm+0.4/-0...
超薄的兆芯KX-6000G ITX迷你小板发布:四核3.3GHz、高性能GPU三屏输出 - 天天要闻

超薄的兆芯KX-6000G ITX迷你小板发布:四核3.3GHz、高性能GPU三屏输出

快科技6月18日消息,作为兆芯重要的生态伙伴,专业的工业计算机设计制造公司安勤发布了一款基于兆芯开先KX-6000G处理器平台的Mini-ITX迷你规格的工业主板“EMX-KX60G”,而且是超薄设计。它可以提供紧凑的设计、出色的性能、丰富的功能,非常适合需要可靠高效算力但空间受限的应用,如工业自动化、数字广告牌、便携式终端、...
不准使用苹果手机?库克没有想到,“反转”这么快就来了 - 天天要闻

不准使用苹果手机?库克没有想到,“反转”这么快就来了

在华为遭遇老美制裁的阴霾下,全球智能手机市场格局发生了显著变化。原本在国内市场份额陷入低谷的苹果公司,却在这一变局中脱颖而出,实现了华丽的转身。据统计,苹果在国内市场的份额从之前的8%快速提升至20%,成功重返榜首位置,成为了最大的受益者。
百川光热曲面镜生产线在鄂尔多斯零碳产业园启动量产 - 天天要闻

百川光热曲面镜生产线在鄂尔多斯零碳产业园启动量产

6月18日,百川光热曲面镜生产线在鄂尔多斯零碳产业园启动量产。旗委副书记、旗长、蒙苏经济开发区党工委书记乔小军,旗人大常委会主任王雁军出席启动仪式,旗人民政府副旗长张富春、内蒙古百川光热科技有限公司董事长张锋分别致辞,园区、部门、企业相关负责人参加。内蒙古百川光热科技有限公司通过能源消费量、能源消费结...
梅雨期将至,如何快速了解天气变化?这份应用工具包请收好 - 天天要闻

梅雨期将至,如何快速了解天气变化?这份应用工具包请收好

上海昨日官宣,预计19日入梅。刚入梅,上海就将遭遇一场开梅暴雨!19-20日有大雨到暴雨过程,并伴有雷电、短时强降水和雷雨大风。本市入梅后降水频率和强度将明显增加,根据上海市气候中心预测,今年本市梅雨量偏多。那么,如何快速掌握气候变化?来看市大数据中心提供的应用工具包19-20日,上海有大雨到暴雨过程,并...