“工程师的元宇宙”:NVIDIA深度学习技术让2D像瞬间“起立”变3D

2021年04月27日20:19:07 科技 1931

快系好安全带,你的平面汽车可以随时出发!

GANverse3D 由多伦多的 NVIDIA AI 研究实验室开发,作为 NVIDIA Omniverse 平台的扩展应用,它能将平面图像转换成逼真的 3D 模型,并将其可视化地呈现在虚拟空间中,供人们自由操控。

GANverse3D已为美国电视剧《霹雳游侠》 (Knight Rider) 中的 AI 汽车基特 (KITT) 注入新的灵魂。研究人员将汽车基特的平面图像输入到模型中,通过预测相应的 3D 纹理网格, GANverse3D 生成出了基特的 3D 模型,让其在虚拟空间中行驶,并配有逼真的前灯、尾灯和转向灯。

此外,NVIDIA Omniverse 套件和 NVIDIA PhysX 工具还可以将预测的纹理转成高质量材料,使基特具有更加真实的外观和“触感”。

“工程师的元宇宙”:NVIDIA深度学习技术让2D像瞬间“起立”变3D - 天天要闻

(来源:NVIDIA)


通过 GANverse3D ,即使没有 3D 建模方面的知识,建筑师、创作者、游戏开发人员和设计师也能轻松地将平面设计转换成立体模型,并能最大程度削减渲染方面的预算。

“警察抓小偷”式的学习模式

GANverse3D 的基础原理是生成式对抗网络(GAN, Generative Adversarial Networks )。

生成式对抗网络是一种新近的深度学习模型,最早由伊安·好伙伴教授(Ian Goodfellow)于 2014 年提出,一经提出,学界对 GAN 的研究如火如荼。

GAN的框架包括至少两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)。

好伙伴教授将其原理比作制假钞的伪造者 (Generator) 和警察 (Discriminator) 之间的博弈。伪造者不断更新技术制造以假乱真的钞票,警察则需用更先进的技术甄别假钞,两人在对抗中不断升级各自的技能。


因此,在 GAN 模型的训练过程中,生成网络 G(Generator,简称 G) 的任务就是要生成逼真的图像欺骗判别网络 D(Discriminator,简称 D),而 D 的目标是区分 G 生成的图像和真实图像。如此,G 和 D 便构成了一个动态“博弈过程”。最终,在理想情况下,G 能够生成以假乱真的图像成功混淆 D 的判断。

在原始理论中, G 和 D 只要是能够拟合相应模型的函数即可,并不要求二者都是神经网络。但实际开发中人们多使用深度神经网络作为 G 和 D 。一个优秀的 GAN 应用需要科学有效的训练方法,否则神经网络模型的自由性可能会导致输出不理想。

NVIDIA 利用生成式对抗网络形成训练数据集。这就像摄影师绕着一辆停泊的汽车,从不同的角度拍摄以获得多视角图像一样。这些多视角图像最终会被放入逆向图 (inverse graphics) 的渲染框架中,以此合成 3D 图像。

逆向图指是从 2D 图像推断 3D 网格模型的过程。以前的逆向图模型依赖于 3D 图形作为训练数据,NVIDIA 的 GANverse3D 则是根据真实图像进行训练。NVIDIA 研究员 Jun Gao 表示,以真实图像作为训练基础得到的AI模型,“能更好地推广到现实世界中。”

在没有 3D 要素的帮助下,“我们把 GAN 模型变成了一个非常高效的数据生成器,这样我们就可以基于网络上的任何 2D 图像创建出 3D 对象。”NVIDIA 研究员 Wenzheng Chen 说。

有关 GAN verse3D 研究成果将在 5 月份的 ICLR 会议和 6 月份的 CVPR 会议上发表。


为工程师搭建元宇宙

英伟达 CEO 黄仁勋:“科幻小说中的元宇宙已经近了。”


众多科技公司都在从元宇宙 (Metaverse) 概念中汲取灵感,英伟达也不例外,趁热推出元宇宙的工程师版。

黄仁勋在 2021 GTC 大会上宣布,英伟达要推出 to B 端的实时协作仿真平台 Omniverse ——一个面向企业的虚拟工作平台。

英伟达早在去年 10 月推出 Omniverse 测试版,并在游戏、建筑等领域得到应用。宝马、爱立信、沃尔沃、Adobe 等超过超过 17,000 名客户体验了测试版。

黄仁勋在此前的采访中表示, Omniverse 能让游戏开发者轻松应对复杂的流水线工作,以此提升工作效率。在 Omniverse 平台上,动画、纹理、灯光、几何图形等常规游戏制作的流水线工程将能一举打通链接。每个人都能看到他人在做什么,并能做到“眼见为实”。

“工程师的元宇宙”:NVIDIA深度学习技术让2D像瞬间“起立”变3D - 天天要闻

(来源:NVIDIA)

游戏、架构和设计领域的创作者们高度依赖于虚拟世界,在产品完成之前,他们需要测试和可视化其原型。但仅是渲染一辆汽车、一条街道就需要捕获成百上千的多视角图像,期间会产生大量成本。因此并非每位创作者资源和精力将其绘制的图像转成 3D 模型。

基于此, NVIDIA 开发 GANverse3D 应用,可以迅速追踪实时光线来创造一个真实的虚拟世界。

任何 2D 图像都可以在 Omniverse 中转换成可以自定义和制作动画的 3D 图形。

NVIDIA 深度学习工程师 Jean-Francois Lafleche 表示:“Omniverse 让研究人员能够将激动人心的前沿研究直接带给创作者和最终用户。作为 Omniverse 的扩展程序, GANverse3D 将帮助艺术家为游戏开发、城市规划甚至训练新的机器学习模型创建更丰富的虚拟世界。”

科技分类资讯推荐

联想 EA350 开放式真无线耳机开售:支持蓝牙 5.4,首发 129 元 - 天天要闻

联想 EA350 开放式真无线耳机开售:支持蓝牙 5.4,首发 129 元

IT之家 6 月 9 日消息,日前,联想 EA350 开放式真无线耳机在京东平台开售,原价 179 元,首发价 129 元。据介绍,这款新品耳机采用零感亲肤材质,左右耳都有单独的触控按键,可随意切歌、接听挂断电话、唤醒语音助手,支持闪连 5.4 技术。首次配对后,打开仓盖自动开机,自动完成连接,拿起即可聆听。该产品配备 13mm 动圈...
市场变化:苹果份额25%下滑,国产品牌崛起时机已到? - 天天要闻

市场变化:苹果份额25%下滑,国产品牌崛起时机已到?

文|斗战圣魔归来苹果手机晒出真实遭遇,国产品牌“突飞猛进”时刻到了时间到了六月,如果要问手机市场到底朝着什么样的路线发展,那么答案大概不可能偏离“同质化、跟风与模仿”这些关键词不过正是在这些名词之间,如果稍微细看一眼手机行业的目前最新的趋势
Magic6大跳水跌至3856元,16+512G杀疯了! - 天天要闻

Magic6大跳水跌至3856元,16+512G杀疯了!

512GB顶配竟不到4000元一则荣耀Magic6大降价的消息在网上引起了热议。没错,就是那款今年1月份刚上市,以极致性能和影像实力俘获无数果粉的Magic6系列,仅仅过了短短五个月,就迎来了一次”from天价to白菜”的大跳水。
群体沉迷色情,全因马斯克?评论区不忍直视,笑掉大牙 - 天天要闻

群体沉迷色情,全因马斯克?评论区不忍直视,笑掉大牙

近日,一则新闻让人感到吃惊,一个长期生活在亚马逊雨林深处的原始部落沉浸在互联网中,他们整天所痴迷的并不是求知,也不是直播,而是网络色情!在这个部落里,互联网成为了一种新兴的稀罕物,因为在去年9月突然之间就联网了,网络让这里的人感到前所未有的
外媒评特斯拉上线百度地图V20:缓解中国对数据安全担忧 - 天天要闻

外媒评特斯拉上线百度地图V20:缓解中国对数据安全担忧

导读:特斯拉最新版本OTA(空中下载技术)上线了城市车道级导航,同日百度地图官宣V20车道级导航现已全球首发特斯拉。(文/邓文静 编辑/高莘)6月7日,特斯拉最新版本OTA(空中下载技术)上线了城市车道级导航,同日百度地图官宣V20车道级导
最新消息!她已离职!曾凌晨发文道歉 - 天天要闻

最新消息!她已离职!曾凌晨发文道歉

本月初,百度副总裁璩静在短视频平台上发布的几条出镜视频引发网友关注,特别是其提到“员工闹分手提离职我秒批”等职场话题引发网友质疑,一度登上微博热搜。