2457億參數量!全球最大AI巨量模型王者問世,浪潮“源1.0”到底有多強?

2021年09月29日22:31:08 科技 1526

9月28日,浪潮人工智能研究院在京發布人工智能巨量模型“源1.0”,這是目前為止全球最大的人工智能巨量模型。據悉,它的參數量達2457億,訓練採用的中文數據集達5000GB,相比於美國的GPT-3模型1750億參數量和570GB訓練數據集,源1.0參數規模領先40%,訓練數據集規模領先近10倍,榮膺世界第一。

2457億參數量!全球最大AI巨量模型王者問世,浪潮“源1.0”到底有多強? - 天天要聞

算法、數據、算力三大層面均實現超大規模

據了解,“源1.0”不管在算法、數據還是算力上,都做到了超大規模和巨量化。

首先,算法方面,相比於1750億參數的英文語言模型GTP-3,“源1.0”共包含了2457億個參數,是前者參數量的1.404倍。而且最重要的是,“源1.0”和GPT-3一樣都是單體模型,而不是由很多小模型堆砌起來。就單單在這一方面,“源1.0”就可以榮登全球最大的自然語言理解模型之位。

其次,在數據方面,“源1.0”幾乎是把近5年整個中文互聯網的浩瀚內容全部讀完。通過自研的文本分類模型,獲得了5TB高質量中文數據集,在訓練數據集規模上領先近10倍。“源1.0”還閱讀了大約2000個億詞。這是什麼概念呢?假如人一個月能讀十本書,一年讀一百本書,讀50年,一生也就讀5000本書,一本書假如20萬字,加起來也只有10億字,需要一萬年才能讀完2000億詞。在如此大規模的數據加持下,“源1.0”的數據集也自然成為了全球最大的高質量中文數據集。

此外,算力方面,“源1.0”共消耗約4095PD(PetaFlop/s-day)。相對於GPT-3消耗3640PD計算量得到1750億參數,計算效率大幅提升。若讓“源1.0”一天24小時不間斷“閱讀”的話,只需要16天就可以看完近五年中文互聯網的幾乎全部內容。

全球最大躋身全球最強 刷新多項世界紀錄

CLUE作為目前公認最權威的中文語言模型評估基準,“源1.0”佔據其零樣本學習(zero-shot)和小樣本學習(few-shot)2項榜單的榜首,在零樣本學習榜單中,「源1.0」超越業界最佳成績18.3%,在文獻分類、新聞分類,商品分類、原生中文推理、成語閱讀理解填空、名詞代詞關係6項任務中獲得冠軍;在小樣本學習的文獻分類、商品分類、文獻摘要識別、名詞代詞關係等4項任務獲得冠軍。在成語閱讀理解填空項目中,源1.0的表現已超越人類得分。

2457億參數量!全球最大AI巨量模型王者問世,浪潮“源1.0”到底有多強? - 天天要聞

同時,在對“源1.0”進行的“圖靈測試”中,將源1.0模型生成的對話、小說續寫、新聞、詩歌、對聯與由人類創作的同類作品進行混合併由人群進行分辨。測試結果表明,人群能夠準確分辨人與“源1.0”作品差別的成功率已低於50%。

目前,浪潮“源1.0”大模型只是一個開始,它只是提供一片廣闊的肥沃土壤,為諸多應用任務泛化支持提供統一強大的算法支撐。未來,浪潮源“源1.0”大模型將推動創新企業及個人開發者基於大模型構建智能化水平更高的場景應用,賦能實體經濟智能化升級,促進數字經濟高質量發展。

科技分類資訊推薦

7款新品!華為這次的瓜,真的太大了! - 天天要聞

7款新品!華為這次的瓜,真的太大了!

時間已經來到了5月份,距離華為新品發布會的召開已經正式進入倒計時。華為官方之前就已經宣布,在5月份會發布新品。比如華為鴻蒙PC,還有尊界S800。那麼,5月份的華為新品發布會,到底會發布哪幾款新品呢?在這裡,毒哥和大家盤點一下。第一款新品,
華為Mate80Pro如果長成這樣,肯定再次賣爆! - 天天要聞

華為Mate80Pro如果長成這樣,肯定再次賣爆!

作為華為年度壓軸大戲,華為Mate80的消息也越來越多了。有網友投稿了一組華為Mate80Pro的渲染設計圖,想讓毒哥和大家分享一下。毒哥看了之後,覺得這個創意設計確實非常哦漂亮。那麼,在這裡毒哥結合渲染設計圖,和大家匯總一下目前華為Mat
769元!華為這款1TB新品,是來搗亂的嗎? - 天天要聞

769元!華為這款1TB新品,是來搗亂的嗎?

前幾天,毒哥給大家介紹了華為新上架的一款固態硬盤嘛。這款固態硬盤,全稱叫做華為坤靈eKitStor Xtreme 200 SSD,售價為599元。華為這款固態硬盤的優勢也很明顯,M.2 2280的外形設計,兼容性很好。支持NVMe 2.0協
5月又一款新機官宣:5月8日,正式發布 - 天天要聞

5月又一款新機官宣:5月8日,正式發布

隨着新機市場不斷更新,今年所發布的新機大部分圍繞着影像和遊戲方面,並且湧現出不少核心技術,主要是提升定向性能。影像核心有影像系統、影像芯片、AI影像功能等,而遊戲同樣推出遊戲芯片、性能引擎、獨顯芯片等,向著專業級別發展,提升新機競爭力。
守護袁昆:企業互聯網營銷推廣有什麼絕招? - 天天要聞

守護袁昆:企業互聯網營銷推廣有什麼絕招?

(文/守護袁昆)經常有朋友問到互聯網營銷推廣有什麼絕招,現在做互聯網營銷有什麼新技巧和新渠道。每次遇到這樣的問題,解釋的太多最後得到一個反饋結果:有絕招不願意公開。互聯網營銷推廣有技巧和方法嗎?這是肯定的。互聯網營銷推廣有絕招嗎?什麼才算絕
假期 我選擇在家當“賽博熊貓飼養員” - 天天要聞

假期 我選擇在家當“賽博熊貓飼養員”

五一朋友圈攝影大賽已經開賽,本“前參賽選手”選擇提前退賽。與其去景區表演“人類遷徙”,不如宅家干點別的。玩手機、打遊戲、看電影?格局打開,我選擇在家當“賽博熊貓飼養員”。宅家往沙發上一躺,身邊還有隻圓滾滾的電子熊貓24小時待命,治癒值直接拉
這個五一,用長虹熊貓AI TV rua熊貓可太香了! - 天天要聞

這個五一,用長虹熊貓AI TV rua熊貓可太香了!

五一正確的打開方式:在家沉浸式吸熊貓,這可太香了!長虹電視不久前發布了新品長虹熊貓AI TV,本熊貓愛好者正好想買新電視,美美下單。沒想到,五一派上了大用場。不得不說,長虹真可以,我願稱它為“沉浸式熊貓周邊”。
小米又一款頂配Ultra終於來了,有點刺激啊 - 天天要聞

小米又一款頂配Ultra終於來了,有點刺激啊

最近機哥經常聊到,下半年會出很多旗艦小平板。 9 英寸不到可以一手掌握的大小,對於遊戲黨來說,確實比常規大屏舒服太多。 但有的機友覺得,小平板看視頻不得勁,問機哥有沒有更大更猛的....