一键换装神器爆火，老黄穿抱抱脸T恤，CEO本人：和他争CEO争不过

2024年04月30日09:51:36 搞笑 2242

西风发自凹非寺

量子位 | 公众号 qbitai

笑不活，最新虚拟试穿神器被网友们玩坏了。

黄院士、马斯克、奥特曼、史密斯等一众大佬衣服集体被扒。

前有老黄卸下皮衣套上糖果包装袋：

后有奥特曼大秀花臂穿cucci：

再有老马变成了蛛蛛侠：

好莱坞巨星史密斯也风格大变：

但说回研究本身，确实正儿八经的研究。

名为idm–vton，由来自韩国科学技术院和omnious.ai公司的研究团队基于扩散模型打造。

目前官方放出了demo，大伙儿可以试玩，推理代码已开源。

除了开头所展示的，抱抱脸研究员也玩的不亦乐乎，给老黄换上了专属战袍。其ceo连忙转发打趣：

我被替代了，没法和他争ceo。

看热闹的网友也是感慨，经过这么多年，终于不用再担心自己“手残”了（ai帮你搞定）。

来玩啊～

我们也赶紧上手体验了一把。demo整个页面是这样婶儿的：

操作起来也是非常简单。

首先上传人物图，可以手动或者自动选择要修改的区域。然后，上传要换的衣服。

直接点击try-on，会自动生成掩模图和换装后的图：

上面这张自动生成的掩模把手也选进去了，所以最后生成的左手效果不好。

我们手动选取涂抹一下，同时人和衣服全部都用我们自己的图。

这次效果大伙儿觉得如何？

再来展示一波网友的试玩成品图。

deepmind联合创始人苏莱曼穿上了微笑面具修格斯联名款t恤：

甚至不少网友真想要这件衣服。

奥特曼再次被网友当成模特：

当然也有翻车的时候，比如马斯克穿的就是山寨cucci。

看完效果后，接着来看idm–vton在技术上是如何实现的。

基于扩散模型

技术方面，idm–vton基于扩散模型，通过设计精细的注意力模块来提高服装图像的一致性，并生成真实的虚拟试穿图像。

模型架构大概包含三部分：

tryonnet：主unet，处理人物图像。

ip-adapter：图像提示适配器，编码服装图像的高级语义。

garmentnet：并行unet，提取服装的低级特征。

在为unet提供输入时，研究人员将人物图片的含噪声潜在特征、分割掩模、带掩蔽的图片和densepose数据整合在一起。

他们还会为服装添加详细描述，例如[v]表示“短袖圆领t恤”。这个描述随后用作garmentnet（例如，“一张[v]的照片”）和tryonnet（例如，“模特正在穿[v]”）的输入提示。

tryonnet和garmentnet产生的中间特征进行了合并，随后传递至自我注意力层。研究人员只使用了来自tryonnet的输出的前半部分。这些输出与文本编码器和ip-adapter的特征一起，通过交叉注意力层进行融合。

最终，研究人员对tryonnet和ip-adapter模块进行了精细调整，并锁定了模型的其它部分。

实验阶段，他们使用viton-hd数据集训练模型，并在viton-hd、dresscode和内部收集的in-the-wild数据集上进行评估。

idm–vton在定性和定量上都优于先前的方法。

idm-vton可以生成真实的图像并保留服装的细粒度细节。

更多细节，感兴趣的家人们可以查看原论文。

项目链接：

[1]https://idm-vton.github.io/?continueflag=589fb545dbbb123446456b65a635d849

[2]https://arxiv.org/abs/2403.05139

[3]https://huggingface.co/spaces/yisol/idm-vton?continueflag=589fb545dbbb123446456b65a635d849

参考链接：

[1]https://twitter.com/multimodalart/status/1782508538213933192

[2]https://twitter.com/fffiloni/status/1783158082849108434

[3]https://twitter.com/clementdelangue/status/1783179067803533577

搞笑

美图秀秀老板，抓住了每一阵风 - 天天要闻

美图秀秀老板，抓住了每一阵风

最近，著名天使投资人、美图公司创始人兼单一最大股东蔡文胜，获香港特区政府委任为“推动Web3 发展专责小组”成员。作为Web3 领域的积极倡导者，蔡文胜近期以 6.5 亿港元打造 CAI 大厦这一“AI-Web3 创业中心。不仅如此，蔡文胜家族也频频出手香港楼市。除了上述他以6.5亿港元购入位于天后的整栋商厦，其家族也有成员在港...

07月02日 4539

英媒：导致希思罗机场附近变电站起火的问题早在七年前就被发现，却一直没修 - 天天要闻

英媒：导致希思罗机场附近变电站起火的问题早在七年前就被发现，却一直没修

【文/观察者网陈思佳】今年3月，英国伦敦希思罗机场因附近变电站发生火灾而陷入瘫痪，超过27万名旅客的行程受到影响。据英国天空新闻网7月2日报道，一份新的调查报告显示，工作人员早在2018年的一次检修中就发现了安全隐患，但问题始终没有被修复，最终引发火灾。英国国家能源系统运营商（NESO）在报告中指出，为机场供电...

07月02日 5530

当代汉奸郭万钧：多次泄露东风导弹机密，因妻子去市场买菜暴露 - 天天要闻

当代汉奸郭万钧：多次泄露东风导弹机密，因妻子去市场买菜暴露

郭万钧从来没有想到，自己有一天会真的面临这个问题。在学校学习的时候，他倒是看过汉奸的例子。在那个时候，他也对汉奸产生了厌恶之情，认为每一个汉奸都该死。

07月02日 2029

曹操把貂蝉送给关羽，为何貂蝉次日就自尽了？关羽对她做了什么？ - 天天要闻

曹操把貂蝉送给关羽，为何貂蝉次日就自尽了？关羽对她做了什么？

三国演义之中，最出名的美人是谁，就不用多说了吧？貂蝉虽然是个虚构人物，但是成功做到了，在网络榜单里常年在四大美人之中，也可以说是一种神奇的现象了。

07月02日 1200

年羹尧从大将军被贬为杭州将军，这是属于什么级别？有多大权力 - 天天要闻

年羹尧从大将军被贬为杭州将军，这是属于什么级别？有多大权力

从很多分析来看，华妃不是不喜欢雍正，相反，她可以说是雍正所有的妃嫔中，对他感情最深的人之一。但是，在雍正眼中，华妃不过是一个政治工具罢了。

07月02日 5392

曹操为什么喜好寡妇？许多人不明白，不得不感叹曹操的智慧 - 天天要闻

曹操为什么喜好寡妇？许多人不明白，不得不感叹曹操的智慧

尽管没有看见儿子是怎么死的，但是在这弥留之际，他看见了儿子一个人挡在乱军之前，然后被人一刀一刀砍成肉酱，曹操不禁流出了眼泪。

07月02日 8000

朱棣造反成功后，意外发现一道圣旨，哭着喊：父亲你害得我好苦 - 天天要闻

朱棣造反成功后，意外发现一道圣旨，哭着喊：父亲你害得我好苦

公元1402年6月，42岁的朱棣重新回到了他熟悉的南京城。多年以前，他离开南京的时候是作为藩王身份。而这次，他回来的时候，依然是以藩王身份回来的，不过，这只是暂时的身份。

07月02日 7084

朱棣登基后，除了朱允炆外，朱标的妻子和其他的子女结局如何？ - 天天要闻

朱棣登基后，除了朱允炆外，朱标的妻子和其他的子女结局如何？

年轻的时候，朱元璋想要当皇帝，因为只要当上了皇帝，富贵可以随便享受，建立一个政治清明的王朝也完全不是问题。但是当上了皇帝，朱元璋才知道，这更是个让人心累的活。

07月02日 9045

张学良被软禁54年，90岁被释放后，直言一生最佩服三个人 - 天天要闻

张学良被软禁54年，90岁被释放后，直言一生最佩服三个人

1928年，张学良接替张作霖成为奉系军阀之主，以迅雷不及掩耳之势改旗易帜，促成了中国表面上的统一；1931年九一八事变后，张学良实行不抵抗政策，使东三省完全落入日本人手中；1936年，张学良与杨虎城发动“西安事变”，促成了国共第二次合作。

07月02日 5189

朱棣油炸铁铉，将景清剥皮，这是真实历史？还是后人黑他？ - 天天要闻

朱棣油炸铁铉，将景清剥皮，这是真实历史？还是后人黑他？

公元1402年，偌大的济南城已经没有之前的繁荣，在这之前，济南城是抵抗叛军的前线，是皇帝建文帝心中的朝廷的坚城要塞。只要有此城，朝廷还能调集军队，还有最后的一战之力。

07月02日 6530