将短期回报置于长期创新之上!中国人工智能道路或许并不平坦

中国科技公司急于匹配 Stable Diffusion 和 DALL-E 2,但艰难摆在面前

机器学习模型在过去几年中展现出的巨大技术飞跃让每个人都对人工智能的未来感到兴奋——但同时也对其令人不安的后果感到紧张。在 Stability AI 和 OpenAI 的文本转图像工具成为热门话题后,ChatGPT 进行智能对话的能力成为各行各业的新宠儿。

OpenAI CEO 发推警告称 AI 工具 ChatGPT 存在明显局限性

中国科技界一直密切关注西方的进步,企业家、研究人员和投资者正在寻找在生成人工智能领域取得进展的方法。科技公司正在设计基于开源模型的工具,以吸引消费者和企业客户。个人正在从 AI 生成的内容中获利。一系列管理规定迅速做出反应,定义了文本、图像和视频合成的使用方式。与此同时,美国的技术制裁引发了人们对中国能否跟上人工智能进步的担忧。

随着生成式人工智能在 2022 年底席卷全球,让我们来看看这项爆炸性技术如何在中国掀起波澜。

中国特色

得益于像 Stable Diffusion 和 DALL-E 2 这样的“艺术”创作平台,生成式 AI 突然出现在每个人的嘴边。中国的科技巨头也以其同类产品吸引了公众,为迎合中国的品味增添了新意。

百度在搜索引擎中名声大噪,近年来一直在加强其在自动驾驶领域的竞争,运营着ERNIE-ViLG,这是一个在 1.45 亿个中文图像文本对的数据集上训练100 亿参数的模型。这款模型与美国同行相比如何?以下是在Stable Diffusion模型中搜索“kids eating shumai in New York Chinatown”的结果,与在ERNIE-ViLG模型中搜索(纽约唐人街小孩子吃烧卖)的结果。

Stable Diffusion

对于上面两个结果,结果可以说是平手,都没有吃到正确的烧卖,快速测试反映了当所使用的数据集存在固有偏差时捕捉文化细微差别的困难——假设稳定扩散将有更多关于中国侨民的数据,而 ERNIE-ViLG 可能接受了更多种类的烧麦图像的训练,这些图像在中国以外更为罕见。

另一个引起轰动的中国工具是腾讯的二次元生照片成器:. “异次元的我”,它可以将人物照片变成动漫人物,但人工智能生成器表现出自己的偏见:它面向中国用户,在南美等其他喜欢动漫的地区出人意料地走红。但用户很快意识到该平台无法识别黑人和大码个体,这些群体在日本动漫中明显缺失,导致人工智能生成的结果令人反感。

除了ERNIE-ViLG,另一个大型中文文本到图像模型是Taiyi,它是IDEA的心血结晶,IDEA 是由著名计算机科学家 Harry Shum 领导的研究实验室,他与他人共同创立了微软在美国以外最大的研究分支 Microsoft Research。开源 AI 模型在 2000 万个经过过滤的中文图像文本对上进行训练,具有 10 亿个参数。

与百度和其他以利润为导向的科技公司不同,IDEA 是近年来由地方政府支持的少数几个从事尖端技术研究的机构之一。这意味着该中心可能享有更多的研究自由,而没有推动商业成功的压力。总部位于深圳的科技中心,并得到中国最富裕城市之一的支持,这是一家值得关注的崭露头角的公司。

人工智能规则

中国的生成式人工智能工具的特点不仅仅在于它们从国内数据中学习,它们也受当地法律的约束。正如《麻省理工科技评论》指出的那样,百度的文本转图像模型过滤掉了部分关键词,这是预料之中的。

对这个新兴领域的未来更重要的是针对所称的“深度合成技术”的一套新监管措施,它指的是“使用深度学习、虚拟现实和其他合成算法生成文本、图像、音频、视频和虚拟场景。”,与中国其他类型的互联网服务一样,从游戏到社交媒体,用户在使用生成的 AI 应用程序之前被要求验证他们的名字,提示可以追溯到一个人的真实身份这一事实不可避免地对用户行为产生限制性影响。

Deepfake进行人脸伪造

但从好的方面来看,这些规则可能会导致更负责任地使用生成式人工智能,它已经在其他地方被滥用,以制造 NSFW 和性别歧视的内容。例如,中国的法规明确禁止人们生成和传播人工智能制造的假新闻。但是,如何实施取决于服务提供商。

“It’s interesting that China is at the forefront of trying to regulate [generative AI] as a country,” said Yoav Shoham, founder of AI21 Labs, an Israel-based OpenAI rival, in an interview. “There are various companies that are putting limits to AI… Every country I know of has efforts to regulate AI or to somehow make sure that the legal system, or the social system, is keeping up with the technology, specifically about regulating the automatic generation of content.”

“有趣的是,中国处于试图规范 [生成人工智能] 作为一个国家的最前沿,”,总部位于以色列的 OpenAI 竞争对手 AI21 Labs 的创始人 Yoav Shoham在接受采访时说。“有各种各样的公司正在限制人工智能......我所知道的每个国家都在努力规范人工智能或以某种方式确保法律体系或社会体系跟上技术的发展,特别是在规范自动化的内容。”

但是对于应该如何管理这个瞬息万变的领域,目前还没有达成共识。“我认为这是我们共同学习的一个领域,”,“这必须是一种协作努力。它必须让真正了解该技术及其能做什么和不能做什么的技术专家、公共部门、社会科学家、受技术影响的人以及政府,包括商业和法律部门共同努力。”

人工智能货币化

随着艺术家们担心被强大的人工智能所取代,中国许多人都在利用机器学习算法以多种方式赚钱,他们不是来自最精通技术的人群。相反,她们是机会主义者或寻找额外收入来源的兼职人员。他们意识到,通过改进提示,他们可以使得 AI 制作富有创意的表情符号或令人惊叹的壁纸,他们可以将其发布在社交媒体上以增加广告收入或直接收取下载费用,真正熟练的人也会向其他想加入赚钱游戏的人出售他们的提示——甚至收费培训他们。

像世界其他地方一样,中国工作者正在他们的正式工作中使用人工智能。例如,轻小说作家可以廉价地为他们的作品制作插图,这是一种比小说更短且通常以插图为特色的类型。一个可能会颠覆制造业领域的有趣用例是使用 AI 设计 T 恤、美甲和其他消费品的印花。通过快速生成大批量原型,制造商可以节省设计成本并缩短生产周期

现在了解生成式人工智能在中国和西方的发展有何不同还为时过早。但是企业家们已经根据他们早期的观察做出了决定。一些创始人告诉我,企业和专业人士普遍乐于为 AI 付费,因为他们看到了直接的投资回报,因此初创公司急于开拓行业用例。一个聪明的应用来自红杉中国支持的Surreal(后来更名为 Movio)和高瓴资本支持的 ZMO.ai,这两家公司致力于开发生成各种形状、颜色和种族的时装模特的算法。

但一些企业家不相信他们的人工智能 产品会像西方同行(如Jasper和Stability AI)正在享受的估值飞涨和飞速增长。多年来,无数中国创业公司有同样的担忧:中国的企业客户普遍不如发达经济体的企业客户愿意为SaaS付费,这就是为什么他们中的许多人开始向海外扩张的原因。

中国 SaaS 领域的竞争也是激烈的。“在美国,你可以通过构建以产品为主导的软件来做得很好,这种软件并不依赖人工服务来获取或留住用户。但在中国,即使你有一个伟大的产品,你的竞争对手也可能在一夜之间窃取你的源代码并雇佣数十名客户支持人员来超越你,这些员工的成本并不高,”中国一家生成人工智能初创公司的创始人说。

销售智能初创公司 FlashCloud的创始人兼首席执行官施毅同意中国公司通常将短期回报置于长期创新之上。“在人才培养方面,中国科技公司往往更注重应用技能和快速赚钱,”他说。一位不愿透露姓名的上海投资者表示,他“对今年生成人工智能领域的重大突破都发生在中国以外感到有点失望。”

前方的障碍

即使中国科技公司想要投资训练大型神经网络,他们也可能缺乏最好的工具。2022年9月,美国对中国实施高端人工智能芯片出口管制虽然许多中国 AI 初创公司专注于应用领域,不需要处理海量数据的高性能半导体,但对于那些从事基础研究的人来说,使用功能较弱的芯片意味着计算时间更长、成本更高,好消息是,从长远来看,美国制裁正在推动中国投资先进技术。

百度执行副总裁兼人工智能云集团负责人表示,作为一家自称为中国人工智能领域领导者的公司,美国芯片制裁对其人工智能业务的影响在短期和长期内都是“有限的” ,这是因为“很大一部分”百度的 AI 云业务“并没有过多依赖高度先进的芯片”。在它确实需要高端芯片的情况下,它“实际上已经有足够的库存来支持我们在短期内的业务。”

未来呢?“从中长期来看,我们其实有自己研发的AI芯片,取名昆仑。”,“通过在大型语言模型中使用我们的昆仑芯片 ,在我们的 AI 平台上执行文本和图像识别任务的效率提高了 40%,总成本降低了 20% 至 30%。”

时间会证明昆仑和其他本土人工智能芯片是否会给中国在生成人工智能竞赛中带来优势。