单次支持超38万字符输入,单图30秒生成3D模型……腾讯披露混元大模型进展

红星资本局5月17日消息,今日,在“腾讯云生成式AI产业应用峰会”上,腾讯对外披露了混元大模型的最新升级进展,并推出多款智能工具和场景应用。

腾讯表示,腾讯混元大模型目前整体性能已居国内第一梯队,部分中文能力已追平GPT-4。腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,已经支持16s视频生成。腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。

在腾讯云上,混元大模型也提供了万亿参数hunyuan-pro、千亿参数hunyuan-standard、百亿参数hunyuan-lite等多种尺寸的模型服务,目前已面向企业及个人开发者全量开放。其中,hunyuan-standard最新上线了支持256k超长上下文窗口的长文模型,具备单次处理超过38万字符的超长文本能力,

据悉,多种尺寸的腾讯混元MoE模型也即将对外开源,可分别支持手机端、PC端、云/数据中心等多样化的部署场景。

此外,腾讯云推出了三款PaaS产品——“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”。其中的知识引擎,在RAG(检索增强生成)技术架构基础上,整合了OCR文档解析、向量检索、大语言模型、多模态大模型等技术,为企业打造使用门槛低的模型应用开发平台。

大模型落地加速,“产业实用”成为发展共识。“大模型的打造只是起点,把技术落地到产业场景、创造价值才是目标。”腾讯集团高级执行副总裁、云与智慧产业事业群(CSIG)CEO汤道生表示,腾讯始终将“产业实用”作为发展大模型的核心战略。

据悉,目前混元大模型已经在腾讯内部600多个业务和场景中落地测试,包括微信读书腾讯会议等产品都已接入。

腾讯副总裁蒋杰还宣布,基于混元大模型研发的C端App腾讯元宝将于5月30号发布。

此外,全球首个大熊猫行为智能识别模型及智慧管理系统在会上正式亮相,该系统可以连续24小时记录大熊猫进食喝水等行为,减轻饲养员大量重复工作。未来还能基于监测行为自动生成分析表格,为饲养员提供大熊猫当天的健康提示和饲养建议。

“我们对(落地)进展保持充分乐观”,腾讯云副总裁吴运声在会后采访中称,“技术的突破一定会带来更多商业化机会,甚至是跨越式的增长。”

红星新闻记者 王田

编辑 杨程

(下载红星新闻,报料有奖!)