6月11日,字节跳动旗下火山引擎发布豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型,并升级了Agent开发平台等AI云原生服务。
豆包1.6模型披露了多项权威测评成绩,在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上,豆包1.6-thinking的表现已跻身全球前列。
据火山引擎总裁谭待介绍,豆包1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题。演示案例显示,豆包1.6可自动操作浏览器完成酒店预定,识别购物小票并整理成Excel表格等任务。
豆包视频生成模型Seedance 1.0 pro也在火山引擎Force大会亮相。该模型支持文字与图片输入,可生成多镜头无缝切换的1080P高品质视频,主体运动稳定性与画面自然度较高。在国际知名评测榜单 Artificial Analysis 上,Seedance在文生视频、图生视频两项任务上均排名首位,超越Veo3、可灵2.0等优秀模型。
目前,豆包大模型已涵盖多模态、视频、图像、语音、音乐等模型品类,在中国公有云大模型市场份额排名第一,占比高达46.4%(IDC数据)。
通过技术和商业的双重创新,豆包1.6首创按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的0-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,为行业最低。
为了更好地支持Agent开发与应用,火山引擎AI云原生全栈服务升级,发布了火山引擎MCP服务、PromptPilot 智能提示工具、AI知识管理系统、veRL强化学习框架等产品,并推出多模态数据湖、AICC私密计算、大模型应用防火墙,以及一系列AI Infra套件。
字节跳动技术副总裁洪定坤表示,随着模型能力的持续进步,AI有机会成为调度者,通过调用不同的 Agent 和工具,让软件开发“all in one”,更大幅度地降低开发门槛,提升开发效率。豆包1.6模型在编程能力上进步很大,已经接入字节的AI编程产品TRAE内测,新模型将很快推送给用户。
谭待认为,技术主体经历了三个时代变化,AI时代会推动开发范式与技术架构全面升级。他说:“PC时代主体是Web,移动时代是APP,AI时代则是Agent。Agent能够自主感知、规划和反思,完成复杂任务。从被动工具转变为主动执行者。豆包大模型和AI云原生将持续迭代,助力企业构建和大规模应用Agent。”