单次支持超38万字符输入，单图30秒生成3D模型……腾讯披露混元大模型进展

分类：科技

浏览数：1746

2024-05-17

红星资本局5月17日消息，今日，在“腾讯云生成式AI产业应用峰会”上，腾讯对外披露了混元大模型的最新升级进展，并推出多款智能工具和场景应用。

腾讯表示，腾讯混元大模型目前整体性能已居国内第一梯队，部分中文能力已追平GPT-4。腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力，已经支持16s视频生成。腾讯混元已布局文/图生3D，单图仅需30秒即可生成3D模型。

在腾讯云上，混元大模型也提供了万亿参数hunyuan-pro、千亿参数hunyuan-standard、百亿参数hunyuan-lite等多种尺寸的模型服务，目前已面向企业及个人开发者全量开放。其中，hunyuan-standard最新上线了支持256k超长上下文窗口的长文模型，具备单次处理超过38万字符的超长文本能力，

据悉，多种尺寸的腾讯混元MoE模型也即将对外开源，可分别支持手机端、PC端、云/数据中心等多样化的部署场景。

此外，腾讯云推出了三款PaaS产品——“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”。其中的知识引擎，在RAG（检索增强生成）技术架构基础上，整合了OCR文档解析、向量检索、大语言模型、多模态大模型等技术，为企业打造使用门槛低的模型应用开发平台。

大模型落地加速，“产业实用”成为发展共识。“大模型的打造只是起点，把技术落地到产业场景、创造价值才是目标。”腾讯集团高级执行副总裁、云与智慧产业事业群（CSIG）CEO汤道生表示，腾讯始终将“产业实用”作为发展大模型的核心战略。

据悉，目前混元大模型已经在腾讯内部600多个业务和场景中落地测试，包括微信读书、腾讯会议等产品都已接入。

腾讯副总裁蒋杰还宣布，基于混元大模型研发的C端App腾讯元宝将于5月30号发布。

此外，全球首个大熊猫行为智能识别模型及智慧管理系统在会上正式亮相，该系统可以连续24小时记录大熊猫进食喝水等行为，减轻饲养员大量重复工作。未来还能基于监测行为自动生成分析表格，为饲养员提供大熊猫当天的健康提示和饲养建议。

“我们对（落地）进展保持充分乐观”，腾讯云副总裁吴运声在会后采访中称，“技术的突破一定会带来更多商业化机会，甚至是跨越式的增长。”

红星新闻记者王田

编辑杨程

（下载红星新闻，报料有奖！）

“单次支持超38万字符输入，单图30秒生成3D模型……腾讯披露混元大模型进展”相关视频

科技分类资讯推荐