微软演示 VASA-1 深度伪造因效果太好不适合向公众发布

2024年04月29日15:52:38 科技 1179

站长之家(chinaz.com) 4 月 21 日消息:本周,微软演示了 vasa–1,这是一个基于静态图像、音频样本和文本脚本来创建人物讲话视频的框架,微软声称——这是正确的——这个框架太危险了,不适合向公众发布。

微软演示 VASA-1 深度伪造因效果太好不适合向公众发布 - 天天要闻

这些由 ai 生成的视频,可以让人物以克隆的声音令人信服地配合脚本说话,正是美国联邦贸易委员会上个月警告的那种情形,之前已提出规则以防止利用 ai 技术进行冒充诈骗。

微软团队在宣布中就承认了这一点,他们解释说由于伦理考虑,此技术没有发布。他们坚称,他们展示的研究用于生成虚拟互动人物,而不是为了冒充任何人。因此,没有计划推出任何产品或 api。

微软的研究人员声明:“我们的研究重点是为虚拟 ai 化身生成视觉感知技能,以期望正向应用。”他们接着说,“本意并不是创造用来误导或欺骗的内容。

然而,像其他相关的内容生成技术一样,它仍可能被滥用来冒充人类。我们反对任何创建误导或有害真实人物内容的行为,并且对将我们的技术应用于促进伪造检测感到兴趣。”

生物特征认证公司 token 的主席,也是常谈生成 ai 的演讲者 kevin surace 通过电子邮件告诉 the register,虽然之前有技术演示显示了由静态画面和克隆的声音文件动画化的脸,但微软的示范反映了最新技术状态。

“个性化电子邮件和其他商业群众通信的潜力是巨大的,”他认为。“甚至还包括动画化旧照片。从某种程度上说,这只是好玩,另一方面它有我们在未来几个月和几年内都会使用的实际商业应用。”

网络安全公司 deeptrace 在 2019 年进行评估时发现,深度伪造的“乐趣”在于 96% 是非自愿色情内容。

尽管如此,微软的研究人员认为,能够创造出看起来逼真的人物并将文字放到他们嘴里,是有正面用途的。

他们在一篇研究论文中提出,“此类技术有望丰富数字通信,提高那些有沟通障碍者的可及性,通过互动 ai 辅导转变教育方法,以及在医疗保健中提供治疗支持和社交互动。”值得注意的是,该论文中没有提及“色情”或“假信息”。

尽管有争议,ai 生成的视频不完全等同于深度伪造,后者被定义为数字操纵而不是生成方法,但当一个令人信服的假象可以不用剪切粘贴技术而轻易地被使用时,这种区别就变得无关紧要了。

当被问及微软不向公众发布这项技术以防滥用的事实时,surace 对限制的可行性表示怀疑。

他说:“微软和其他公司目前已经暂停,直到他们解决隐私和使用问题。”他问道,“将如何规范那些出于正确理由使用此技术的人?”

surace 补充说,已经有相似精细的开源模型存在,例如 emo。他说:“人们可以从 github 提取源代码并围绕它构建服务,这可能会与微软的输出相匹敌。”他注意到,“因为这个领域的开源特性,不管怎样,规范它都是不可能的。”

尽管如此,世界各地的国家正在尝试规范 ai 伪造的人物。加拿大、英国等国家都有可以应用于深度伪造的规定,其中一些规定满足了更广泛的政治目标。正是这个星期,英国刚刚使未经同意制作色情深度伪造图像成为非法行为。在英国的 2023 年在线安全法下,分享此类图片已是不允许的。

今年 1 月,美国两党议员提出了 2024 年打击显著伪造图像和非自愿编辑行为法案(defiance act),该法案为非自愿深度伪造图像的受害者在法庭上提起民事诉讼创造了途径。

以及在周二,4 月 16 日,美国参议院司法委员会隐私、技术与法律小组委员会举行了题为“人工智能监管:选举深度伪造”的听证会。

在准备好的声明中,deepmedia 的 ceo rijul gupta 说道:

“深度伪造最令人担忧的方面是,它们能够为坏人提供合理的否认理由,使他们能够将真正的内容视为假的。公众信任的这种侵蚀打击了我们社会结构的核心和民主的基础。人类的大脑天生就相信所见所闻,因此特别容易受到深度伪造的欺骗。随着这些技术变得越来越复杂,它们有可能破坏我们社会所依赖的共同现实感,营造出一种不确定和怀疑的氛围,让公民质疑他们遇到的每一条信息的真实性。

科技分类资讯推荐

她搞砸派对自责痛哭,机器人自信接手,转头敲下代码直接解决 - 天天要闻

她搞砸派对自责痛哭,机器人自信接手,转头敲下代码直接解决

本故事纯属虚构故事,故事中的人名、事件均为虚构,图片为网图,地名使用目的仅为情节描述所需,方便阅读理解,如有雷同,纯属巧合。2077年的赛博镇,光芒四射,科技的边界似乎已经触碰到了未知的宇宙尽头。在这个光怪陆离的世界中,有一所高科技学院矗立着,它不仅是知识的殿堂,也是未来的摇篮。
OpenAI一夜改写历史,GPT-4o震撼登场,语音助手再升级! - 天天要闻

OpenAI一夜改写历史,GPT-4o震撼登场,语音助手再升级!

龙门山之巅,一个划时代的科技突破正在悄然发生。由OpenAI公司研发的GPT-4o问世,威力无穷,即将颠覆整个语音助手市场。在这个辉煌的时刻,GPT-4o以其细腻而真实的表达,横扫所有竞争对手,将我们带入了一个全新的人工智能时代!
华为举办夏季全场景新品发布会,HarmonyOS 4.2已升级用户超2000万 - 天天要闻

华为举办夏季全场景新品发布会,HarmonyOS 4.2已升级用户超2000万

华为今天举办夏季全场景新品发布会,带来了包括华为MateBook 14、华为MatePad 11.5“S、华为WATCH FIT 3、华为儿童手表5 Pro、华为Vision智慧屏 4、华为智能眼镜2等在内的多款全场景新品、以及华为MatePad Pro 13.2英寸、华为FreeClip 耳夹耳机等多款热销产品的全新配色,持续为消费者打造极致的全场景智慧生
全球单机容量最大海上风电机组将在粤并网测试 - 天天要闻

全球单机容量最大海上风电机组将在粤并网测试

5月15日是今年的全国“低碳日”。当天,在广东汕头的全国首个风电临海试验基地,一个巨型风电机组塔筒正在紧锣密鼓地进行吊装。该风电机组为东方电气风电股份有限公司(以下简称“东方电气”)研制的机型,容量达18兆瓦,是目前全球已经开始安装的最大功率等级海上风电机组,即将于5月底开展并网测试。据悉,本次安装的机组...
2024款iPad Pro首发M4芯片,11英寸256GB定价很苹果! - 天天要闻

2024款iPad Pro首发M4芯片,11英寸256GB定价很苹果!

在大部分用户的认知里iPhone手机的销量才是苹果硬件产品的重中之重,像iPad Pro、MacBook等产品则在销量上没法跟iPhone手机相比,事实确实如此,但断然不能忽视iPad Pro和MacBook这些设备的贡献度。甚至在相应的细分市场里也属于头部了。
不再喊“遥遥领先”,华为余承东低调一个月后,宣传问界新M5“闭眼入” - 天天要闻

不再喊“遥遥领先”,华为余承东低调一个月后,宣传问界新M5“闭眼入”

红星资本局5月15日消息,今日,问界新M5正式开启全国大规模交付。华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东发文表示:截至目前,问界M5系列累计交付超过13万辆。“上月底刚发布的问界新M5全系标配华为高阶智驾,带来全维安全,是一款可以“闭眼入”的好车!”从“遥遥领先”到 “闭眼入”,余承东只低调...
智慧养老是什么?华为全屋智能AI康养解决方案重磅来袭 - 天天要闻

智慧养老是什么?华为全屋智能AI康养解决方案重磅来袭

目前,我国社会人口朝着老龄化趋势发展,如何更好地为家中老人打造舒适的生活环境,或者说如何才能时时刻刻照顾到他们是绝大多数中年人都发愁的问题。毕竟要是送往养老院、养老社区,经济负担大不说,护工也不会时刻在身边看着,照顾不全面也是常有的事情。
华为首发云晰柔光屏,学习成长必备的实力护眼平板 - 天天要闻

华为首发云晰柔光屏,学习成长必备的实力护眼平板

作为一位全职兼数码博主的妈妈,我日常不仅要照顾孩子的饮食起居,还要在琐碎的日常中进行内容创作以及找到自我提升的空间。最近,我发现了华为MatePad 11.5"S这款平板,它简直成了我学习、记录、创作的得力助手。今天,就来跟大家分享一下这款平板给我的生活带来的变化吧!首先,我要说的是华为MatePad 11.5"S的屏幕,云晰...