“工程师的元宇宙”:NVIDIA深度学习技术让2D像瞬间“起立”变3D

2021年04月27日20:19:07 科技 1931

快系好安全带,你的平面汽车可以随时出发!

GANverse3D 由多伦多的 NVIDIA AI 研究实验室开发,作为 NVIDIA Omniverse 平台的扩展应用,它能将平面图像转换成逼真的 3D 模型,并将其可视化地呈现在虚拟空间中,供人们自由操控。

GANverse3D已为美国电视剧《霹雳游侠》 (Knight Rider) 中的 AI 汽车基特 (KITT) 注入新的灵魂。研究人员将汽车基特的平面图像输入到模型中,通过预测相应的 3D 纹理网格, GANverse3D 生成出了基特的 3D 模型,让其在虚拟空间中行驶,并配有逼真的前灯、尾灯和转向灯。

此外,NVIDIA Omniverse 套件和 NVIDIA PhysX 工具还可以将预测的纹理转成高质量材料,使基特具有更加真实的外观和“触感”。

“工程师的元宇宙”:NVIDIA深度学习技术让2D像瞬间“起立”变3D - 天天要闻

(来源:NVIDIA)


通过 GANverse3D ,即使没有 3D 建模方面的知识,建筑师、创作者、游戏开发人员和设计师也能轻松地将平面设计转换成立体模型,并能最大程度削减渲染方面的预算。

“警察抓小偷”式的学习模式

GANverse3D 的基础原理是生成式对抗网络(GAN, Generative Adversarial Networks )。

生成式对抗网络是一种新近的深度学习模型,最早由伊安·好伙伴教授(Ian Goodfellow)于 2014 年提出,一经提出,学界对 GAN 的研究如火如荼。

GAN的框架包括至少两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)。

好伙伴教授将其原理比作制假钞的伪造者 (Generator) 和警察 (Discriminator) 之间的博弈。伪造者不断更新技术制造以假乱真的钞票,警察则需用更先进的技术甄别假钞,两人在对抗中不断升级各自的技能。


因此,在 GAN 模型的训练过程中,生成网络 G(Generator,简称 G) 的任务就是要生成逼真的图像欺骗判别网络 D(Discriminator,简称 D),而 D 的目标是区分 G 生成的图像和真实图像。如此,G 和 D 便构成了一个动态“博弈过程”。最终,在理想情况下,G 能够生成以假乱真的图像成功混淆 D 的判断。

在原始理论中, G 和 D 只要是能够拟合相应模型的函数即可,并不要求二者都是神经网络。但实际开发中人们多使用深度神经网络作为 G 和 D 。一个优秀的 GAN 应用需要科学有效的训练方法,否则神经网络模型的自由性可能会导致输出不理想。

NVIDIA 利用生成式对抗网络形成训练数据集。这就像摄影师绕着一辆停泊的汽车,从不同的角度拍摄以获得多视角图像一样。这些多视角图像最终会被放入逆向图 (inverse graphics) 的渲染框架中,以此合成 3D 图像。

逆向图指是从 2D 图像推断 3D 网格模型的过程。以前的逆向图模型依赖于 3D 图形作为训练数据,NVIDIA 的 GANverse3D 则是根据真实图像进行训练。NVIDIA 研究员 Jun Gao 表示,以真实图像作为训练基础得到的AI模型,“能更好地推广到现实世界中。”

在没有 3D 要素的帮助下,“我们把 GAN 模型变成了一个非常高效的数据生成器,这样我们就可以基于网络上的任何 2D 图像创建出 3D 对象。”NVIDIA 研究员 Wenzheng Chen 说。

有关 GAN verse3D 研究成果将在 5 月份的 ICLR 会议和 6 月份的 CVPR 会议上发表。


为工程师搭建元宇宙

英伟达 CEO 黄仁勋:“科幻小说中的元宇宙已经近了。”


众多科技公司都在从元宇宙 (Metaverse) 概念中汲取灵感,英伟达也不例外,趁热推出元宇宙的工程师版。

黄仁勋在 2021 GTC 大会上宣布,英伟达要推出 to B 端的实时协作仿真平台 Omniverse ——一个面向企业的虚拟工作平台。

英伟达早在去年 10 月推出 Omniverse 测试版,并在游戏、建筑等领域得到应用。宝马、爱立信、沃尔沃、Adobe 等超过超过 17,000 名客户体验了测试版。

黄仁勋在此前的采访中表示, Omniverse 能让游戏开发者轻松应对复杂的流水线工作,以此提升工作效率。在 Omniverse 平台上,动画、纹理、灯光、几何图形等常规游戏制作的流水线工程将能一举打通链接。每个人都能看到他人在做什么,并能做到“眼见为实”。

“工程师的元宇宙”:NVIDIA深度学习技术让2D像瞬间“起立”变3D - 天天要闻

(来源:NVIDIA)

游戏、架构和设计领域的创作者们高度依赖于虚拟世界,在产品完成之前,他们需要测试和可视化其原型。但仅是渲染一辆汽车、一条街道就需要捕获成百上千的多视角图像,期间会产生大量成本。因此并非每位创作者资源和精力将其绘制的图像转成 3D 模型。

基于此, NVIDIA 开发 GANverse3D 应用,可以迅速追踪实时光线来创造一个真实的虚拟世界。

任何 2D 图像都可以在 Omniverse 中转换成可以自定义和制作动画的 3D 图形。

NVIDIA 深度学习工程师 Jean-Francois Lafleche 表示:“Omniverse 让研究人员能够将激动人心的前沿研究直接带给创作者和最终用户。作为 Omniverse 的扩展程序, GANverse3D 将帮助艺术家为游戏开发、城市规划甚至训练新的机器学习模型创建更丰富的虚拟世界。”

科技分类资讯推荐

外媒评特斯拉上线百度地图V20:缓解中国对数据安全担忧 - 天天要闻

外媒评特斯拉上线百度地图V20:缓解中国对数据安全担忧

导读:特斯拉最新版本OTA(空中下载技术)上线了城市车道级导航,同日百度地图官宣V20车道级导航现已全球首发特斯拉。(文/邓文静 编辑/高莘)6月7日,特斯拉最新版本OTA(空中下载技术)上线了城市车道级导航,同日百度地图官宣V20车道级导
最新消息!她已离职!曾凌晨发文道歉 - 天天要闻

最新消息!她已离职!曾凌晨发文道歉

本月初,百度副总裁璩静在短视频平台上发布的几条出镜视频引发网友关注,特别是其提到“员工闹分手提离职我秒批”等职场话题引发网友质疑,一度登上微博热搜。
淘宝取消“618”预售机制后,京东宣布“现货开卖” - 天天要闻

淘宝取消“618”预售机制后,京东宣布“现货开卖”

继5月7日天猫宣布取消“618”预售机制后,5月8日,京东也正式宣布“现货开卖”。今年京东618将于5月31日晚8点全面开启。据了解,现货开卖的同时,京东还将同步推出百亿补贴日活动。在6月2日、6月3日、6月8日,还将先后推出9.
细思极恐网络暴力和群殴 - 天天要闻

细思极恐网络暴力和群殴

互联网高速发展利用时代踏实做事和说实话的人都不被人待见,时时刻刻遭受网络暴力,声讨,群殴,格力电器董明珠,踏踏实实做企业,创税收,促进就业,,为国家为人民奉献大半辈子青春,心血, 汗水,本该退休安享晚年,侍弄儿孙遗憾找不到合适放心接班人,七
探秘vivo影像之美,与X系列技术沟通会共同见证卓越蓝图 - 天天要闻

探秘vivo影像之美,与X系列技术沟通会共同见证卓越蓝图

前段时间的vivo X系列新品发布让我们记忆深刻,而刚刚结束结束的“影像新蓝图X系列技术沟通会”也十分精彩,这次沟通会不仅告诉了大家vivo在影像领域的最新成果,也让粉丝们对vivo影像背后的故事有更多了解,在vivo影像的发展历程中可以分成两方面,一方面,vivo通过自主研发,不断提升自身的影像技术实力,另一方面,vivo...
华为再次亮剑,鸿蒙系统亮点多多 - 天天要闻

华为再次亮剑,鸿蒙系统亮点多多

5月15日,华为夏季全场景新品发布会简直是一场视觉与科技的盛宴,看得我热血沸腾!不得不说,华为这次真的是大招频出,新品多到让人眼花缭乱!先说说那个华为MatePad 11.5 ” S吧,一亮相就让人眼前一亮!它的设计简约而不失时尚,屏幕清晰得让人仿佛置身其中。
【新机】升级了个寂寞?蓝厂新机发布 - 天天要闻

【新机】升级了个寂寞?蓝厂新机发布

昨天晚上蓝厂发布了新机iQOO Neo9s Pro,机子采用了6.78英寸1.5K 8T LTPO直面屏,支持144Hz刷新率。搭载天玑9300+,前置1600万像素,后置IMX920主摄+5000万超广角。电池容量5160mAh,支持120W快充。新增白色版本,用上了白色玻璃后盖,颜值确实提升了不少。不过还是塑料中框+短焦指纹。12+256GB 2699元
AI Agent在哪些行业领域会产生影响? - 天天要闻

AI Agent在哪些行业领域会产生影响?

在如今飞速前进的科技浪潮中,人工智能(AI)技术的创新正以前所未有的速度重塑我们的生活和工作的每一个角落。在这一浪潮中,Agent AI智能体以其卓越的能力脱颖而出,它通过模拟人类智能行为,能够胜任一系列复杂任务,并在多个领域展现出了其无法替代的价值。