豆包实时语音大模型正式上线!端到端语音对话 情商智商双高

2025年01月23日09:20:36 科技 3881

快科技1月20日消息,今日,字节跳动豆包大模型团队宣布,豆包实时语音大模型今日正式上线,并在豆包app全量开放,将app升级至7.2.0版本即可体验。

据介绍,豆包实时语音大模型是一款语音理解和生成一体化的模型,实现了端到端语音对话。

相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性,号称“情商智商双高”。

该模型是真正意义上的端到端语音系统,主要面向中文语境和场景(可进行英语对话,暂不支持多语种)。

豆包表示,依托于语音和语义联合建模,豆包实时语音大模型拥有丰富表现力,呈现出接近真人的语音表达水准。

豆包实时语音大模型正式上线!端到端语音对话 情商智商双高 - 天天要闻

通过学习角色语音和情感特点,模型具备强大讲故事能力,在对话或内容演绎中,可生动切换成不同角色/状态,配合不同情绪表达,增强交互趣味性和沉浸感。

联合建模后,模型涌现出超出预期的指令理解、声音扮演和声音控制能力。

比如,目前模型部分方言和口音,主要源自于pretrain阶段数据泛化,而非针对性训练。

豆包实时语音大模型输出语音表现力高度逼近真人,包括类人的副语言特征(如语气词、停顿思考等),同时赋予模型实时联网功能,能根据问题,动态获取最新信息,对时效问题给到精准、及时的回应。

从豆包发布的技术展示来看,该模型语音语气自然度和情绪饱满度逼近真人,对话风格更加拟人,情感理解更加深刻,对用户的情绪做到较好承接。

豆包大模型团队也坦言,现阶段的模型主要支持中文,其他语种尚未较好支持,中文范围内,模型也仅支持小部分方言和地方口音的理解和表达。

科技分类资讯推荐

特斯拉官宣Model 3长续航全轮驱动版28.55万起售 - 天天要闻

特斯拉官宣Model 3长续航全轮驱动版28.55万起售

7月1日,特斯拉官方微博宣布Model 3长续航全轮驱动版车型升级,CLTC续航升至753公里,百公里加速升至3.8秒,售价28.55万元起。特斯拉表示,7月31日(含)前下单,还可享8000元限时保险补贴、5年0息、8000元车漆选装金等购车优惠政策。...
央视新闻报道:全国加能站充电桩配置率达45% - 天天要闻

央视新闻报道:全国加能站充电桩配置率达45%

报名 | 扫描上图二维码,锁定超级沙龙重庆站席位 产品 | 扫描上方二维码提交需求 可高效对接 本文来源 | 中国石油石化6月28日,2025能源产业生态论坛在北京召开。论坛上发布了《中国加油(能)站发展蓝皮书2024-2025》,数据显示,当前,传统加油站正从单一能源供给,向综合服务生态深度转型。《蓝皮书》显示,截至2024年底...
韦东奕,民族的脊梁,崇尚他,国家民族更有前途和希望 - 天天要闻

韦东奕,民族的脊梁,崇尚他,国家民族更有前途和希望

最近,北大韦神韦东奕又“霸屏”了。这位北京大学助理教授、数学科学学院微分方程教研室研究员,因开通个人网络账号,两天涨粉两千万。这是什么概念?一般头部网络主播,即便有团队共同打造账号,要涨粉两千万,没有几年时间也难以达成。这说明什么?
厉害!荣耀400系列三周激活量超70万台 - 天天要闻

厉害!荣耀400系列三周激活量超70万台

上周行业消息显示荣耀400系列全球激活量已经突破100万台,还引起了行业的热议。大家都在讲这一次荣耀400系列的销量确实牛,市场认可度确实高。不过当时给出的是全球数据,并不知道国内与海外的占比。
YU7销量为何没受前段时间小米负面的影响? - 天天要闻

YU7销量为何没受前段时间小米负面的影响?

为什么前段时间小米负面不断,但是现在SU7发布之后,一样是卖爆了呢?其实我之前就说过了,这些负面不会影响到小米的销量。互联网是健忘的。之前那个小米手机发生高速车祸,很多人在说小米的自驾问题。但是实际上大家要明白,真正会去买小米这个汽车的人,他们的侧重点是什么?
华为发布新一代OceanStor Dorado 3000融合全闪存存储:最高1600块SSD、8PiB容量 - 天天要闻

华为发布新一代OceanStor Dorado 3000融合全闪存存储:最高1600块SSD、8PiB容量

快科技6月30日消息,华为今日正式发布新一代OceanStor Dorado 3000融合全闪存存储。最大支持2 TB内存、1600块SSD,提供高达8 PiB(‌1PiB=1024TB)可用容量,单系统最大可扩展到16个控制器。具有以下三大优势:全新融合:华为新一代OceanStor Dorado 3000采用原生块、文件、对象并行架构,一套存储满足多种业