豆包实时语音大模型正式上线!端到端语音对话 情商智商双高

2025年01月23日09:20:36 科技 3881

快科技1月20日消息,今日,字节跳动豆包大模型团队宣布,豆包实时语音大模型今日正式上线,并在豆包app全量开放,将app升级至7.2.0版本即可体验。

据介绍,豆包实时语音大模型是一款语音理解和生成一体化的模型,实现了端到端语音对话。

相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性,号称“情商智商双高”。

该模型是真正意义上的端到端语音系统,主要面向中文语境和场景(可进行英语对话,暂不支持多语种)。

豆包表示,依托于语音和语义联合建模,豆包实时语音大模型拥有丰富表现力,呈现出接近真人的语音表达水准。

豆包实时语音大模型正式上线!端到端语音对话 情商智商双高 - 天天要闻

通过学习角色语音和情感特点,模型具备强大讲故事能力,在对话或内容演绎中,可生动切换成不同角色/状态,配合不同情绪表达,增强交互趣味性和沉浸感。

联合建模后,模型涌现出超出预期的指令理解、声音扮演和声音控制能力。

比如,目前模型部分方言和口音,主要源自于pretrain阶段数据泛化,而非针对性训练。

豆包实时语音大模型输出语音表现力高度逼近真人,包括类人的副语言特征(如语气词、停顿思考等),同时赋予模型实时联网功能,能根据问题,动态获取最新信息,对时效问题给到精准、及时的回应。

从豆包发布的技术展示来看,该模型语音语气自然度和情绪饱满度逼近真人,对话风格更加拟人,情感理解更加深刻,对用户的情绪做到较好承接。

豆包大模型团队也坦言,现阶段的模型主要支持中文,其他语种尚未较好支持,中文范围内,模型也仅支持小部分方言和地方口音的理解和表达。

科技分类资讯推荐

特斯拉中国宣布:涨价 - 天天要闻

特斯拉中国宣布:涨价

(文/观察者网周盛明 编辑/高莘)2025年7月1日,特斯拉中国宣布,Model 3长续航全轮驱动版车型售价上涨1万元,至28.55万元。 特斯拉中国 在涨价的同时,该车型的续航和加速得到了提升——CLTC续航由713km提升至753km,百公里加速时间由4.4秒提升至3.8秒。值得注意的是,特斯拉Model 3的其他两个版本售价不变。Model 3后轮驱.
储能与锂电领域动态频出:巨头竞逐、项目签约与跨界调整并行 - 天天要闻

储能与锂电领域动态频出:巨头竞逐、项目签约与跨界调整并行

【环球网财经综合报道】近期,储能与锂电领域动态不断。阳光电源(300274.SZ)与宁德时代(300750.SZ)围绕第三代储能电芯定义权展开激烈争夺。6月,阳光电源发布搭载684Ah电芯的新款储能系统,电芯由欣旺达供应;宁德时代宣布587Ah电芯于4月投产。当前储能行业处于二代向三代电芯过渡期,二代容量为314Ah,两大阵营分化明...
亚马逊CEO:生成式AI或致员工数量减少,但也将带来新机遇 - 天天要闻

亚马逊CEO:生成式AI或致员工数量减少,但也将带来新机遇

【环球网财经综合报道】亚马逊CEO安迪·贾西周一表示,生成式人工智能的快速推出,意味着公司未来或需更少员工完成计算机可处理的工作,如同每次技术转型,一些工作将因自动化而用人减少,但也会有新工作产生。东方IC尽管人工智能会消除部分职位需求,贾西称亚马逊仍会在人工智能、机器人等领域招聘更多员工。不过,本月早...
25万起售的小米YU7,三分钟大定20万台,数据是真的吗? - 天天要闻

25万起售的小米YU7,三分钟大定20万台,数据是真的吗?

相信这几天小米YU7的火爆程度大家都看到了,这款车发布后开启预定,打开预定通道后不久,小米官方就公布了一个数据,3分钟大定超20万台。没过多久,小米官方又公布了一个更炸裂的数据,小米YU7在1小时内,大定已突破289000万台。
邹晖出任格力集团董事长 - 天天要闻

邹晖出任格力集团董事长

本文来源:时代财经 珠海格力集团官网更新信息显示,邹晖已正式出任该集团党委书记、董事长。公开资料显示,邹晖于1982年生,本科学历。邹晖曾担任珠海市人大常委会农村农业工作委员会副主任,后转任珠海市国资委副主任。此次调整后,格力集团领导班子为:邹晖担任集团党委书记、董事长,王轶任党委副书记、董事、总裁,吴...
【产业互联网周报】阿里合伙人名单最新变动:9人已退出;美团在AI投入超百亿元;黄仁勋:机器人技术是芯片制造商继AI之后的最大机遇 - 天天要闻

【产业互联网周报】阿里合伙人名单最新变动:9人已退出;美团在AI投入超百亿元;黄仁勋:机器人技术是芯片制造商继AI之后的最大机遇

图片系AI生成【产业互联网周报是由钛媒体TMTpost发布的特色产品,将整合本周最重要的企业级服务、云计算、大数据领域的前沿趋势、重磅政策及行研报告。】国内资讯北京经信局:北京累计备案上线大模型132款,全国占比35%在2025全球数字经济大会新闻发布会上,北京市经济和信息化局党组成员、副局长、新闻发言人刘维亮表示,...