Meta推出开源大模型Llama 3:最大底牌4000亿参数,性能直逼GPT-4

划重点:

腾讯科技讯 4月19日消息,据国外媒体报道,美国科技巨头meta推出了其最强大的开源人工智能(ai)模型llama 3,以追赶行业领导者openai。meta首席执行官扎克伯格表示,llama 3有8b和70b两个版本,大版本的llama 3将有超过4000亿参数。由于预训练和指令微调,llama 3相比llama 2有了极大的改进。

此外,meta还同时发布了ai助手的更新版本。该助手将在meta的facebook、instagram、whatsapp和messenger应用以及一个新设立的独立网站meta.ai中获得更突出的地位,让llama 3能够更直接地与微软支持的openai的热门产品chatgpt竞争。

meta在去年7月份发布了llama 2。此后,包括谷歌、马斯克旗下的xai与mistral等在内的数家公司发布了开源的大语言模型,竞争十分激烈。

llama 3直接对标openai的gpt-4,后者已经成为一个强大的多模态模型,不仅能够处理更长的文本,还支持图像输入。meta此前已推出三个版本的llama 2,其中最大的一个拥有700亿个参数,另外两个版本分别拥有130亿和70亿个参数。

在宣布这一消息之际,meta一直在努力向其数十亿用户推广生成式人工智能产品,包括对计算基础设施进行全面改造,以及整合此前截然不同的研究和产品团队,从而挑战openai在该技术上的领先地位。

开源的llama是meta人工智能战略的重要组成部分。这家社交媒体巨头希望利用人工智能来提高其广告工具的效率,并增强其社交媒体应用的吸引力。meta首席执行官马克·扎克伯格(mark zuckerberg)在本月初向投资人表示,今年的主要关注领域包括推出llama 3和“扩大meta ai助手的实用性”。

追赶gpt-4

meta希望llama 3能赶上openai的gpt-4。不过知情人士透露,因为研究人员尚未开始对llama 3进行微调,所以尚未决定llama 3是否将是多模态模型。微调是开发人员为现有模型提供额外数据的过程,以便它可以学习新信息或任务。较大的模型通常会提供更高质量的答复,而较小的模型往往会更快的提供答复。有消息称,正式版的llama 3将会在今年7月正式推出。

meta首席产品官克里斯·考克斯(chris cox)在接受采访时表示,该公司为llama 3植入了全新的计算机编码功能,如今它不仅可以输出文本,还可以输出图像。他补充说,更高级的推理,如制定更长的多步计划的能力,将在后续版本中推出。meta在官方博客中表示,计划在未来几个月发布的正式版也将具有“多模态”能力,这意味着它可以生成文本和图像。

考克斯说:“最终的目标是帮助用户摆脱烦心事。无论是与企业互动,无论是写东西,还是计划旅行,让他们的生活更轻松。”他还表示,将图像纳入llama 3的训练将增强今年推出的新一代雷朋meta智能眼镜的功能,让meta ai能够识别使用者看到的物体并回答有关它们的问题。

meta还宣布与alphabet的谷歌建立新的合作伙伴关系,在助手的答复中包括实时搜索结果,作为与微软必应现有合作的补充。随着此次更新,meta ai助手正在扩展到美国以外的十多个市场,包括澳大利亚、加拿大、新加坡、尼日利亚和巴基斯坦。考克斯说,meta“仍在努力以正确的方式在欧洲做到这一点”。欧洲的隐私规定更加严格,即将出台的人工智能法案也准备提出披露模型训练数据等要求。

生成式人工智能模型对数据的巨大需求已开始限制该技术的发展。作为追赶努力的一部分,meta一直在发布像llama 3这样的模型供开发人员免费商业使用,因为强大的免费模型的成功可能会阻碍竞争对手从其专有技术中赚取收入的计划。

扎克伯格周四在发布会上称meta ai是“你可以自由使用的最智能的人工智能助手”。他表示,最大版本的llama 3目前正在用4000亿个参数进行训练,在mmlu(大规模多任务语言理解)测试中得分为85分。他表示,推出的两个较小版本现在分别有80亿个参数和700亿个参数,后者mmlu的得分为82分。(编译/无忌)