Meta 的Make-A-Scene AI将人类和计算机的想象力融合到算法艺术中

2022年07月16日03:40:32 科技 1813

它将尖端的文本到图像生成与手绘草图输入相结合。

Meta 的Make-A-Scene AI将人类和计算机的想象力融合到算法艺术中 - 天天要闻

输入文字生成图像的AI算法目前大热,OpenAI的Craiyon(以前的DALL-E mini)和谷歌的Imagen AI释放出了由人类和计算机想象力合成的奇妙怪异的程序生成艺术的浪潮。本周二,Meta公司透露,它也开发了一个人工智能图像生成引擎,它希望这将有助于在元宇宙中建立沉浸式的世界,并创造出高级数字艺术。

在使用人工智能生成引擎时,仅凭 "医院里有一匹马 "这句话就能创造出一个图像,这需要大量的工作。首先,这句话本身被送入一个转化器模型,这是一个神经网络,可以解析句子中的单词,并对它们之间的关系形成上下文理解。一旦掌握了用户描述的要点,人工智能将使用一组GAN(生成对抗网络)合成一个新的图像。

由于近年来努力在日益扩大的高清晰度图像集上训练ML模型,并对文本描述进行精心策划,今天最先进的人工智能可以创造出逼真的图像,无论你给它们提供什么胡言乱语。不同的人工智能的具体创造过程是不同的。

Meta 的Make-A-Scene AI将人类和计算机的想象力融合到算法艺术中 - 天天要闻

Meta AI

例如,谷歌的Imagen使用扩散模型,根据今年6月的一个关键词博客显示:"它学习将随机点的模式转换为图像。这些图像首先从低分辨率开始,然后逐步提高分辨率"。 另一方面,谷歌的Parti人工智能,"首先将一组图像转换为一连串的代码条目,类似于拼图片。然后将一个给定的文本提示翻译成这些代码条目,并创建一个新的图像"。

虽然这些系统可以创建向其描述的大多数东西,但用户对输出图像的具体方面没有任何控制。Meta首席执行官马克-扎克伯格在周二的博客中表:"为了实现人工智能推动创造性表达的潜力,人们应该能够塑造和控制系统生成的内容。"

该公司的 "探索性人工智能研究概念 "被称为Make-A-Scene,正是通过将用户创建的草图纳入其基于文本的图像生成,输出一个2,048 x 2,048像素的图像。这种组合使用户不仅可以描述他们在图像中想要的东西,而且还可以决定图像的整体构成。扎克伯格说:"它展示了人们如何使用文字和简单的图画来更具体地传达他们的愿景,使用各种元素、形式、安排、深度、构图和结构"。

在测试中,一个人类评估小组压倒性地选择了文字加图画的图像,而不是仅有文字的图像,因为它与原始草图的一致性更好(99.54%的时间),与原始文字描述的一致性更好(66%的时间)。为了进一步发展这项技术,Meta公司与包括Sofia Crespo、Scott Eaton、Alexander Reben和Refik Anadol在内的知名人工智能艺术家分享其Make-A-Scene演示,他们将使用该系统并提供反馈。目前还没有关于该人工智能何时向公众开放的消息。

科技分类资讯推荐

彻底火了,库存告急!订单已排到半月后 - 天天要闻

彻底火了,库存告急!订单已排到半月后

近期,“充电宝召回” 事件引发广泛关注,3C认证已成为消费者衡量充电宝品质的关键指标,国内部分机场也加强了对充电宝3C标识的查验力度。央视财经记者探访发现,线下市场和电商平台带有3C标识的充电宝产品销量都出现增长。
理发店陷入倒闭潮?不是没客人,也不是电商冲击,是自己作垮了 - 天天要闻

理发店陷入倒闭潮?不是没客人,也不是电商冲击,是自己作垮了

很多人抱怨行业不好,再加上电商冲击,所以经营起来也是相当困难。可是有这么一个行业,电商根本进驻不进来。在这个行业,大家经营全靠本事,谁有能力谁赚钱。但是即便是这样,为了赚块钱,行业内的人还是将这个行业给彻底做臭了。各种各样的套路层出不穷,甚
大疆OSMO 360 完整规格 7月29日发布 - 天天要闻

大疆OSMO 360 完整规格 7月29日发布

对于那些一直在等待大疆 Osmo 360 的人来说,听到在本月底7月29日开售的消息,你们一定会很高兴。今天我偶然发现了这两款产品的完整网店描述和图片已经上线。所以,我们先来深入了解一下那款“革命性 8K” Osmo 360 的描述。
iPhone一键降温?苹果这隐藏模式有点过分啊 - 天天要闻

iPhone一键降温?苹果这隐藏模式有点过分啊

为了解决发热这亘古难题,手机厂商绞尽脑汁,往手机里塞散热膜、均热板、填充硅脂,甚至还用上了主动风扇。 但到了夏天三四十度的室外,该发热还是发热,该烫手还是烫手。 国产安卓如此。 ....
三星Galaxy S26Ultra不装了,性能太炸裂了! - 天天要闻

三星Galaxy S26Ultra不装了,性能太炸裂了!

三星Galaxy S26 Ultra即将亮相,带来多方面升级。·该机型将采用6.9英寸QHD+LTPO AMOLED显示屏,支持120Hz自适应刷新率和3000尼特峰值亮度,确保在各种光照条件下都能提供清晰的视觉体验。
中集洋山集装箱第三季度订单饱满 开拓氢能集成装备求新|公司调研 - 天天要闻

中集洋山集装箱第三季度订单饱满 开拓氢能集成装备求新|公司调研

财联社7月5日讯(记者 胡皓琼)中美关税缓和之下,外贸企业对美出货恢复,带动中集洋山集装箱制造订单增长。集装箱制造厂在提升自动化水平的同时,为提高自身抗风险能力,还正布局新赛道。财联社记者近日走访中集集团(000039.SZ)旗下中集洋山,眼见一片片钢板,经历冲压、焊接组装、打砂等一道道工序,逐渐成形。产线上布...