2457亿参数量!全球最大AI巨量模型王者问世,浪潮“源1.0”到底有多强?

2021年09月29日22:31:08 科技 1526

9月28日,浪潮人工智能研究院在京发布人工智能巨量模型“源1.0”,这是目前为止全球最大的人工智能巨量模型。据悉,它的参数量达2457亿,训练采用的中文数据集达5000GB,相比于美国的GPT-3模型1750亿参数量和570GB训练数据集,源1.0参数规模领先40%,训练数据集规模领先近10倍,荣膺世界第一。

2457亿参数量!全球最大AI巨量模型王者问世,浪潮“源1.0”到底有多强? - 天天要闻

算法、数据、算力三大层面均实现超大规模

据了解,“源1.0”不管在算法、数据还是算力上,都做到了超大规模和巨量化。

首先,算法方面,相比于1750亿参数的英文语言模型GTP-3,“源1.0”共包含了2457亿个参数,是前者参数量的1.404倍。而且最重要的是,“源1.0”和GPT-3一样都是单体模型,而不是由很多小模型堆砌起来。就单单在这一方面,“源1.0”就可以荣登全球最大的自然语言理解模型之位。

其次,在数据方面,“源1.0”几乎是把近5年整个中文互联网的浩瀚内容全部读完。通过自研的文本分类模型,获得了5TB高质量中文数据集,在训练数据集规模上领先近10倍。“源1.0”还阅读了大约2000个亿词。这是什么概念呢?假如人一个月能读十本书,一年读一百本书,读50年,一生也就读5000本书,一本书假如20万字,加起来也只有10亿字,需要一万年才能读完2000亿词。在如此大规模的数据加持下,“源1.0”的数据集也自然成为了全球最大的高质量中文数据集。

此外,算力方面,“源1.0”共消耗约4095PD(PetaFlop/s-day)。相对于GPT-3消耗3640PD计算量得到1750亿参数,计算效率大幅提升。若让“源1.0”一天24小时不间断“阅读”的话,只需要16天就可以看完近五年中文互联网的几乎全部内容。

全球最大跻身全球最强 刷新多项世界纪录

CLUE作为目前公认最权威的中文语言模型评估基准,“源1.0”占据其零样本学习(zero-shot)和小样本学习(few-shot)2项榜单的榜首,在零样本学习榜单中,“源1.0”超越业界最佳成绩18.3%,在文献分类、新闻分类,商品分类、原生中文推理、成语阅读理解填空、名词代词关系6项任务中获得冠军;在小样本学习的文献分类、商品分类、文献摘要识别、名词代词关系等4项任务获得冠军。在成语阅读理解填空项目中,源1.0的表现已超越人类得分。

2457亿参数量!全球最大AI巨量模型王者问世,浪潮“源1.0”到底有多强? - 天天要闻

同时,在对“源1.0”进行的“图灵测试”中,将源1.0模型生成的对话、小说续写、新闻、诗歌、对联与由人类创作的同类作品进行混合并由人群进行分辨。测试结果表明,人群能够准确分辨人与“源1.0”作品差别的成功率已低于50%。

目前,浪潮“源1.0”大模型只是一个开始,它只是提供一片广阔的肥沃土壤,为诸多应用任务泛化支持提供统一强大的算法支撑。未来,浪潮源“源1.0”大模型将推动创新企业及个人开发者基于大模型构建智能化水平更高的场景应用,赋能实体经济智能化升级,促进数字经济高质量发展。

科技分类资讯推荐

iPhone一键降温?苹果这隐藏模式有点过分啊 - 天天要闻

iPhone一键降温?苹果这隐藏模式有点过分啊

为了解决发热这亘古难题,手机厂商绞尽脑汁,往手机里塞散热膜、均热板、填充硅脂,甚至还用上了主动风扇。 但到了夏天三四十度的室外,该发热还是发热,该烫手还是烫手。 国产安卓如此。 ....
三星Galaxy S26Ultra不装了,性能太炸裂了! - 天天要闻

三星Galaxy S26Ultra不装了,性能太炸裂了!

三星Galaxy S26 Ultra即将亮相,带来多方面升级。·该机型将采用6.9英寸QHD+LTPO AMOLED显示屏,支持120Hz自适应刷新率和3000尼特峰值亮度,确保在各种光照条件下都能提供清晰的视觉体验。
中集洋山集装箱第三季度订单饱满 开拓氢能集成装备求新|公司调研 - 天天要闻

中集洋山集装箱第三季度订单饱满 开拓氢能集成装备求新|公司调研

财联社7月5日讯(记者 胡皓琼)中美关税缓和之下,外贸企业对美出货恢复,带动中集洋山集装箱制造订单增长。集装箱制造厂在提升自动化水平的同时,为提高自身抗风险能力,还正布局新赛道。财联社记者近日走访中集集团(000039.SZ)旗下中集洋山,眼见一片片钢板,经历冲压、焊接组装、打砂等一道道工序,逐渐成形。产线上布...
数据宝一体机实机首秀2025生态文明贵阳国际论坛 - 天天要闻

数据宝一体机实机首秀2025生态文明贵阳国际论坛

7月5日至6日,2025年生态文明贵阳国际论坛召开,数据宝携其AI技术领先成果重磅亮相论坛人工智能展区,并以“企业私域业务模型一体机”实机首秀,现场演绎数据资产与AI深度赋能绿色发展的创新融合实践。数据宝“企业私域业务模型一体机”。
登上C909样机,听听中国商飞工程总师怎么说?《明青讲习所》又上新了 - 天天要闻

登上C909样机,听听中国商飞工程总师怎么说?《明青讲习所》又上新了

名师金课《明青讲习所》今又上新,这期节目《“科学家精神”的回响》聚焦于“科学家精神的时代传承”,定于7月5日(周六)19:30 在上海教育电视台首播。陈明青老师带领华东师范大学第一附属中学、上海市鲁迅中学、上海南湖职业技术学院的学生们,踏上沉浸式学习之旅,走进钱学森图书馆、中国商飞上海飞机设计研究院、上海科...