【环球网科技报道 记者 勃潺】11月12日,阿里云通义大模型团队宣布开源通义千问代码模型全系列,共6款qwen2.5-coder模型。基于qwen2.5-coder,ai编程性能和效率均实现大幅提升,编程“小白”也可轻松生成网站、数据图表、简历、游戏等各类应用。
编程语言是高度逻辑化和结构化的,代码模型要求理解、生成和处理这些复杂的逻辑关系和结构,通常也被认为是大模型逻辑能力的基础来源之一,对于整体提升大模型推理能力至关重要。qwen2.5-coder基于qwen2.5基础大模型进行初始化,使用源代码、文本代码混合数据、合成数据等5.5t tokens的数据持续训练,实现了代码生成、代码推理、代码修复等核心任务性能的显著提升。
此次开源,qwen2.5-coder推出0.5b/1.5b/3b/7b/14b/32b 等6个尺寸的全系列模型,每个尺寸都开源了base 和 instruct 模型,其中,base模型可供开发者微调,instruct模型则是开箱即用的官方对齐模型。
qwen2.5-coder全系列开源,可适配更多应用场景,无论在端侧还是云上,都可以让ai大模型更好地协助开发者完成编程开发,即便是编程“小白”,也可基于内置qwen2.5-coder的代码助手和可视化工具,用自然语言对话生成网站、数据图表、简历和游戏等各类应用。
截至目前,qwen2.5已开源100多个大语言模型、多模态模型、数学模型和代码模型,几乎所有模型都实现了同等尺寸下的最佳性能。据了解,全球基于qwen系列二次开发的衍生模型数量9月底突破7.43万,超越llama系列衍生模型的7.28万。