2457亿参数量!全球最大AI巨量模型王者问世,浪潮“源1.0”到底有多强?

2021年09月29日22:31:08 科技 1526

9月28日,浪潮人工智能研究院在京发布人工智能巨量模型“源1.0”,这是目前为止全球最大的人工智能巨量模型。据悉,它的参数量达2457亿,训练采用的中文数据集达5000GB,相比于美国的GPT-3模型1750亿参数量和570GB训练数据集,源1.0参数规模领先40%,训练数据集规模领先近10倍,荣膺世界第一。

2457亿参数量!全球最大AI巨量模型王者问世,浪潮“源1.0”到底有多强? - 天天要闻

算法、数据、算力三大层面均实现超大规模

据了解,“源1.0”不管在算法、数据还是算力上,都做到了超大规模和巨量化。

首先,算法方面,相比于1750亿参数的英文语言模型GTP-3,“源1.0”共包含了2457亿个参数,是前者参数量的1.404倍。而且最重要的是,“源1.0”和GPT-3一样都是单体模型,而不是由很多小模型堆砌起来。就单单在这一方面,“源1.0”就可以荣登全球最大的自然语言理解模型之位。

其次,在数据方面,“源1.0”几乎是把近5年整个中文互联网的浩瀚内容全部读完。通过自研的文本分类模型,获得了5TB高质量中文数据集,在训练数据集规模上领先近10倍。“源1.0”还阅读了大约2000个亿词。这是什么概念呢?假如人一个月能读十本书,一年读一百本书,读50年,一生也就读5000本书,一本书假如20万字,加起来也只有10亿字,需要一万年才能读完2000亿词。在如此大规模的数据加持下,“源1.0”的数据集也自然成为了全球最大的高质量中文数据集。

此外,算力方面,“源1.0”共消耗约4095PD(PetaFlop/s-day)。相对于GPT-3消耗3640PD计算量得到1750亿参数,计算效率大幅提升。若让“源1.0”一天24小时不间断“阅读”的话,只需要16天就可以看完近五年中文互联网的几乎全部内容。

全球最大跻身全球最强 刷新多项世界纪录

CLUE作为目前公认最权威的中文语言模型评估基准,“源1.0”占据其零样本学习(zero-shot)和小样本学习(few-shot)2项榜单的榜首,在零样本学习榜单中,“源1.0”超越业界最佳成绩18.3%,在文献分类、新闻分类,商品分类、原生中文推理、成语阅读理解填空、名词代词关系6项任务中获得冠军;在小样本学习的文献分类、商品分类、文献摘要识别、名词代词关系等4项任务获得冠军。在成语阅读理解填空项目中,源1.0的表现已超越人类得分。

2457亿参数量!全球最大AI巨量模型王者问世,浪潮“源1.0”到底有多强? - 天天要闻

同时,在对“源1.0”进行的“图灵测试”中,将源1.0模型生成的对话、小说续写、新闻、诗歌、对联与由人类创作的同类作品进行混合并由人群进行分辨。测试结果表明,人群能够准确分辨人与“源1.0”作品差别的成功率已低于50%。

目前,浪潮“源1.0”大模型只是一个开始,它只是提供一片广阔的肥沃土壤,为诸多应用任务泛化支持提供统一强大的算法支撑。未来,浪潮源“源1.0”大模型将推动创新企业及个人开发者基于大模型构建智能化水平更高的场景应用,赋能实体经济智能化升级,促进数字经济高质量发展。

科技分类资讯推荐

充电易爆炸?多所高校禁用!罗马仕紧急声明 - 天天要闻

充电易爆炸?多所高校禁用!罗马仕紧急声明

近日,多位网友反映收到学校下发的排查通知,称“20000毫安的罗马仕牌充电器在充电时易发生爆炸”。6月14日早间,相关词条冲上热搜榜第一。6月14日下午,@ROMOSS罗马仕 发布公开声明:对于近期“北京多所高校禁用罗马仕充电宝”事件的讨论,我们就给师生及公众带来的困扰致以诚挚歉意,在此郑重承诺:任何经权威机构鉴定存...
20000毫安罗马仕充电宝易爆炸,被北京多所高校禁用?公司致歉:承诺经鉴定存缺陷的产品将担责 - 天天要闻

20000毫安罗马仕充电宝易爆炸,被北京多所高校禁用?公司致歉:承诺经鉴定存缺陷的产品将担责

近日,多位网友反映收到学校下发的排查通知,称“20000毫安的罗马仕牌充电器在充电时易发生爆炸”。 今早(6月14日),相关词条冲上热搜榜第一。 今天下午,涉事品牌方公开声明称,已第一时间展开核查,后续进展将会通过官方渠道通知。 事件相关截图。 6月14日下午,ROMOSS罗马仕在官方微博上发布公开声明称,对于近期“北...
终结西方超豪华品牌垄断,尊界S800重塑智能豪华新标准 - 天天要闻

终结西方超豪华品牌垄断,尊界S800重塑智能豪华新标准

何以为旗舰级轿车?在我的理解中,它应该是汽车科技创新的集大成者,是工业体系的技术结晶,是工业上的皇冠明珠。放在燃油车时代,聊到高端旗舰级轿车,多数人意识浮现的还是进口品牌,代表者如奔驰、宝马、奥迪,它们把机械玩出了艺术,打造出非常多豪华经典的车型,如今迈入了新
“充电宝易爆炸,多高校禁用”,冲上热搜第一!罗马仕发道歉声明 - 天天要闻

“充电宝易爆炸,多高校禁用”,冲上热搜第一!罗马仕发道歉声明

来源:@ROMOSS罗马仕、红星新闻、南方都市报版权归原作者所有,如有侵权请及时联系近日,多位网友反映收到学校下发的排查通知,称“20000毫安的罗马仕牌充电器在充电时易发生爆炸”。事件相关截图今天,相关词条冲上热搜榜第一。今天下午,@ROMOSS罗马仕 发布公开声明:对于近期“北京多所高校禁用罗马仕充电宝”事件的讨论...
2025莲花杯单一品牌赛开启 F1冠军级实力打造国家级赛车晋级平台 - 天天要闻

2025莲花杯单一品牌赛开启 F1冠军级实力打造国家级赛车晋级平台

5月30日,成都天府国际赛道——随着引擎轰鸣划破长空,2025莲花杯单一品牌赛揭幕战正式拉开帷幕。这场由中国汽车摩托车运动联合会认证、莲花品牌与铭泰集团联合打造的国家级 GT单一品牌赛,依托77年赛道基因沉淀与F1尖端技术传承,成为国内具备国际C级赛照升级资质
70.8万起售!尊界S800的“尊”在这些细节上 - 天天要闻

70.8万起售!尊界S800的“尊”在这些细节上

5月30日,尊界S800终于揭开了它最后一层“面纱”,新车共推出纯电、增程两个动力版本共4款配置,售价区间为70.8万-101.8万元。上市权益包括30000元的ADS智能辅助系统高阶包、30000元的选配金、4000元的智能辅助驾驶无忧服务权益和40000元
松下Panasonic sx电机抽搐不能加载的解决办法 - 天天要闻

松下Panasonic sx电机抽搐不能加载的解决办法

松下Panasonic sx系列有名的抖音王,打理起来极为简单,要么简单地换皮带完事,要么简单的丢掉了事。硬着头皮查电路,得不偿失,超薄时期的松下,在电路上极尽变态之能事,恨不得在针眼里做道场,像我这种显微镜加放大镜式的的眼睛,也不能凭肉眼