消息称OpenAI正在开发AI语音助理,GPT-5或年底前发布

2024年05月11日09:22:27 科技 4157

划重点

消息称OpenAI正在开发AI语音助理,GPT-5或年底前发布 - 天天要闻

腾讯科技讯 5月11日消息,据国外媒体报道,在追求开发能像人类一样交流的人工智能的竞赛中,openai又有了新动作。该公司准备揭示一种全新的人机对话技术,该技术能同时使用声音和文本,并具备识别物体和图像的能力。据两位有幸目睹这款新型人工智能的人士披露,chatgpt的开发团队已经向特定客户展示了其部分功能,其中包括比现有产品更为出色的逻辑推理能力。

这一技术成果是openai首席执行官山姆·奥特曼(sam altman)宏伟愿景中的又一重要进化。他的最终目标是开发出一种类似于斯派克·琼斯(spike jones)执导的电影《她》(her)中的虚拟助手那样的先进人工智能,并努力使现有的语音助手,如苹果的siri,变得更加实用和智能。

据一位内部消息人士透露,openai可能最早在下周一的一次公开活动中预览这款升级后的人工智能。这一时间比谷歌i/o开发者大会早一天,此举意在抢在谷歌发布一系列人工智能产品之前,占据市场先机。

消息称OpenAI正在开发AI语音助理,GPT-5或年底前发布 - 天天要闻

openai认为,具备视觉和音频功能的智能助手有可能像智能手机一样,引发一场科技革命。从理论上讲,这样的助手将能胜任许多目前难以想象的任务,例如担任学生撰写论文或解决数学问题的导师,或在人们需要时提供周围环境的信息,如翻译路标或解释如何修理汽车故障等。

由于这项新技术的规模庞大,目前还无法在个人设备上运行。然而,在不久的将来,客户将能够通过云端的版本来改进openai软件已有的功能,例如自动客户服务代理。据一位知情人士透露,新软件的音频功能将帮助这些代理更好地理解呼叫者的语气,甚至能察觉到他们在提出要求时是否带有讽刺意味。

openai已经开发出可以转录音频和将文本转换为语音的软件,但这些功能是通过独立的会话ai模型实现的。而新模型则将这些功能融为一体,从而使得新的多模态模型在理解图像和音频方面表现更佳,并且相比功能较弱的模型,使用起来更为迅捷。

作为openai的最大资助者,微软有权自由使用openai的技术。微软可以利用openai的新型人工智能来改进自家的语音助手,或者尝试将其缩小规模,以便在小型设备上运行,这包括带有前置摄像头的可穿戴设备,这些设备能够捕捉客户周围的环境信息。

目前尚不清楚openai何时会向付费用户提供这些新功能。但据一位使用过聊天机器人chatgpt的人士表示,openai最终计划将这些功能整合到其聊天机器人的免费版本中。该人士还透露,openai的目标是使支持这些功能的新型ai模型比该公司目前销售的最先进的gpt-4 turbo更为经济实惠。在回答某些类型的问题时,新模型的表现甚至已经超越了gpt-4 turbo。然而,值得注意的是,新模型仍然会犯下错误,即出现所谓的“幻觉”现象。

gpt-5年底前发布?

与此同时,谷歌的高管们也怀揣着利用人工智能开发卓越助手的宏伟愿景。去年12月,谷歌展示了其对话式人工智能gemini的视频,它能实时响应语音指令,并识别出人们正在注视的图像。然而,随后该公司澄清,这些高级功能实际上需要研究人员使用图像和文本进行模型提示,而非视频演示中展示的简单对话。

消息称OpenAI正在开发AI语音助理,GPT-5或年底前发布 - 天天要闻

此外,除了图像和文本处理,gemini虽然增添了音频分析能力,但它在理解许多传统语音命令上仍有局限,也无法像siri或谷歌助手(google assistant)等传统语音助手那样流畅地与用户交流。

openai同样在奋力前行,以保持其相对于meta等竞争对手的领先地位。今年4月,meta发布了开源人工智能模型llama 3,其性能超越了当前许多会话式人工智能模型,并赢得了人工智能应用开发者的广泛赞誉。

openai即将推出的这款具备音频和视觉功能的新模型,只是其众多研发项目中的冰山一角。外媒消息称,该公司正致力于开发一款与谷歌竞争的网络搜索引擎,并研发名为计算机使用代理的自动化软件,旨在加速软件开发及其他基于计算机的任务。此外,尽管尚未公开,但openai已经发布了人工智能视频生成器sora的预览版本,这一创新在好莱坞引起了巨大轰动。

尤为引人注目的是,openai正全力以赴开发gpt-5,并期望它能比一年多前发布的gpt-4实现重大飞跃。据与openai高层有过深入讨论的人士透露,该公司有望在年底前完成gpt-5的训练并公之于众。

openai的产品和人工智能模型开发速度相当快,这导致了一些先前宣布的项目并未得到足够的关注。例如,尽管openai曾向开发者承诺,到今年第一季度,他们能够通过为其商店开发定制聊天机器人来实现盈利,但至今该公司尚未推出具体的实施方案。

然而,提升视觉和音频功能有望助力openai在数百万乃至数十亿台苹果设备上运行其对话式人工智能。近几个月来,苹果与openai就下一代iphone操作系统如何整合openai的模型进行了深入探讨。然而,这位chatgpt的制造者面临着激烈的竞争,苹果同时也在与谷歌进行类似的谈判。

据悉,openai的ceo山姆·奥特曼(sam altman)还与知名iphone设计师乔尼·艾维(jony ive)携手合作,共同研发一款人工智能消费设备。这款设备有望从艾默生集团和thrive capital等投资者那里筹集高达10亿美元的资金。这一举措意味着,奥特曼将加入大型科技公司和初创企业的行列,竞相发布人工智能设备和可穿戴设备。

然而,目前最先进的人工智能模型由于体积庞大,必须在云端运行,并依赖互联网连接才能正常工作。因此,开发具备复杂视觉和音频功能的对话式人工智能可能需要数月甚至数年的时间,才能将其缩小到足以在设备上运行的尺寸。

分级定价策略

据一位与openai高管密切交流的人士透露,openai今年有望创造数十亿美元收入,该公司正计划推出一种全新的定价模式。若客户选择预付费预订token(用于大语言模型处理或生成的单词),该公司将提供高达50%的折扣。

目前,openai主要采取按需定价策略,其大语言模型每生成百万token的费用在几美分至120美元不等,而一些大型客户则能享受到批量折扣的优惠。提前付款以获取折扣的策略在云计算领域已相当普遍,如微软azure、谷歌云和亚马逊aws的客户,均能通过提前预订服务器容量来显著降低成本。

通过引入更灵活的定价机制,openai旨在与其他模型开发商以及旨在协助开发者以更低成本运行开源模型的初创公司展开更有力的竞争。这些初创公司,通常被称为人工智能服务器经销商或推理服务提供商,他们对成本效率的重视有时会导致他们以越来越低的价格提供同样的大模型服务,有时甚至低于成本价。

为了进一步帮助开发者降低成本,openai已通过批处理api(batch api)为开发者提供了一种经济高效的解决方案。这是openai在4月份推出的一种应用程序编程接口,允许开发者批量上传模型查询,并在愿意等待长达24小时响应的前提下,享受更为优惠的价格。而像together ai和anyscale这样的人工智能服务器经销商则声称,在他们的平台上运行开源模型比使用openai的模型要便宜六倍之多。(编译/金鹿)

科技分类资讯推荐

探秘vivo影像之美,与X系列技术沟通会共同见证卓越蓝图 - 天天要闻

探秘vivo影像之美,与X系列技术沟通会共同见证卓越蓝图

前段时间的vivo X系列新品发布让我们记忆深刻,而刚刚结束结束的“影像新蓝图X系列技术沟通会”也十分精彩,这次沟通会不仅告诉了大家vivo在影像领域的最新成果,也让粉丝们对vivo影像背后的故事有更多了解,在vivo影像的发展历程中可以分成两方面,一方面,vivo通过自主研发,不断提升自身的影像技术实力,另一方面,vivo...
华为再次亮剑,鸿蒙系统亮点多多 - 天天要闻

华为再次亮剑,鸿蒙系统亮点多多

5月15日,华为夏季全场景新品发布会简直是一场视觉与科技的盛宴,看得我热血沸腾!不得不说,华为这次真的是大招频出,新品多到让人眼花缭乱!先说说那个华为MatePad 11.5 ” S吧,一亮相就让人眼前一亮!它的设计简约而不失时尚,屏幕清晰得让人仿佛置身其中。
【新机】升级了个寂寞?蓝厂新机发布 - 天天要闻

【新机】升级了个寂寞?蓝厂新机发布

昨天晚上蓝厂发布了新机iQOO Neo9s Pro,机子采用了6.78英寸1.5K 8T LTPO直面屏,支持144Hz刷新率。搭载天玑9300+,前置1600万像素,后置IMX920主摄+5000万超广角。电池容量5160mAh,支持120W快充。新增白色版本,用上了白色玻璃后盖,颜值确实提升了不少。不过还是塑料中框+短焦指纹。12+256GB 2699元
AI Agent在哪些行业领域会产生影响? - 天天要闻

AI Agent在哪些行业领域会产生影响?

在如今飞速前进的科技浪潮中,人工智能(AI)技术的创新正以前所未有的速度重塑我们的生活和工作的每一个角落。在这一浪潮中,Agent AI智能体以其卓越的能力脱颖而出,它通过模拟人类智能行为,能够胜任一系列复杂任务,并在多个领域展现出了其无法替代的价值。
续航王者vivo Y200系列掀起购机狂潮,618购机可享多重福利优惠 - 天天要闻

续航王者vivo Y200系列掀起购机狂潮,618购机可享多重福利优惠

智能手机的选择五花八门,但有一条赛道被vivo独占,那就是长续航。刚刚发布的vivo Y200系列凭借其超长的续航能力和轻薄的设计,一经推出便受到广大用户的关注和好评,彻底改变了行业续航的基准线。如今Y200系列新品已正式开启预售及首销,期间购机可享多重福利优惠。
【现场】人工关节集采续约开标:企业代表“不紧张”,多家报价压线进 - 天天要闻

【现场】人工关节集采续约开标:企业代表“不紧张”,多家报价压线进

界面新闻记者 | 唐卓雅界面新闻编辑 | 谢欣5月21日,国家组织人工关节集中带量采购协议期满接续采购(下称“人工关节续采”)在天津东丽湖恒大酒店国际会议中心开标。此次续标的产品范围与2021年的首轮集采相同,包括髋关节(陶瓷-陶瓷类、陶瓷-聚乙烯类和合金-聚乙烯类)和膝关节,采购周期由两年延长为三年,采购需求量为...
产品经理谈一谈:水果店应该怎么开 - 天天要闻

产品经理谈一谈:水果店应该怎么开

这几年,不少人都计划着整个副业,或者以后被毕业了去做什么。有准备摆摊的,有准备开咖啡店开书店的,也有人准备开水果店的。只是工作这么久了,相关的经验能否平移过去?如果用产品思维来看,我们做一个店面,需要怎么做呢?