2457億參數量!全球最大AI巨量模型王者問世,浪潮「源1.0」到底有多強?

2021年09月29日22:31:08 科技 1526

9月28日,浪潮人工智能研究院在京發佈人工智能巨量模型「源1.0」,這是目前為止全球最大的人工智能巨量模型。據悉,它的參數量達2457億,訓練採用的中文數據集達5000GB,相比於美國的GPT-3模型1750億參數量和570GB訓練數據集,源1.0參數規模領先40%,訓練數據集規模領先近10倍,榮膺世界第一。

2457億參數量!全球最大AI巨量模型王者問世,浪潮「源1.0」到底有多強? - 天天要聞

算法、數據、算力三大層面均實現超大規模

據了解,「源1.0」不管在算法、數據還是算力上,都做到了超大規模和巨量化。

首先,算法方面,相比於1750億參數的英文語言模型GTP-3,「源1.0」共包含了2457億個參數,是前者參數量的1.404倍。而且最重要的是,「源1.0」和GPT-3一樣都是單體模型,而不是由很多小模型堆砌起來。就單單在這一方面,「源1.0」就可以榮登全球最大的自然語言理解模型之位。

其次,在數據方面,「源1.0」幾乎是把近5年整個中文互聯網的浩瀚內容全部讀完。通過自研的文本分類模型,獲得了5TB高質量中文數據集,在訓練數據集規模上領先近10倍。「源1.0」還閱讀了大約2000個億詞。這是什麼概念呢?假如人一個月能讀十本書,一年讀一百本書,讀50年,一生也就讀5000本書,一本書假如20萬字,加起來也只有10億字,需要一萬年才能讀完2000億詞。在如此大規模的數據加持下,「源1.0」的數據集也自然成為了全球最大的高質量中文數據集。

此外,算力方面,「源1.0」共消耗約4095PD(PetaFlop/s-day)。相對於GPT-3消耗3640PD計算量得到1750億參數,計算效率大幅提升。若讓「源1.0」一天24小時不間斷「閱讀」的話,只需要16天就可以看完近五年中文互聯網的幾乎全部內容。

全球最大躋身全球最強 刷新多項世界紀錄

CLUE作為目前公認最權威的中文語言模型評估基準,「源1.0」佔據其零樣本學習(zero-shot)和小樣本學習(few-shot)2項榜單的榜首,在零樣本學習榜單中,「源1.0」超越業界最佳成績18.3%,在文獻分類、新聞分類,商品分類、原生中文推理、成語閱讀理解填空、名詞代詞關係6項任務中獲得冠軍;在小樣本學習的文獻分類、商品分類、文獻摘要識別、名詞代詞關係等4項任務獲得冠軍。在成語閱讀理解填空項目中,源1.0的表現已超越人類得分。

2457億參數量!全球最大AI巨量模型王者問世,浪潮「源1.0」到底有多強? - 天天要聞

同時,在對「源1.0」進行的「圖靈測試」中,將源1.0模型生成的對話、小說續寫、新聞、詩歌、對聯與由人類創作的同類作品進行混合併由人群進行分辨。測試結果表明,人群能夠準確分辨人與「源1.0」作品差別的成功率已低於50%。

目前,浪潮「源1.0」大模型只是一個開始,它只是提供一片廣闊的肥沃土壤,為諸多應用任務泛化支持提供統一強大的算法支撐。未來,浪潮源「源1.0」大模型將推動創新企業及個人開發者基於大模型構建智能化水平更高的場景應用,賦能實體經濟智能化升級,促進數字經濟高質量發展。

科技分類資訊推薦

充電易爆炸?多所高校禁用!羅馬仕緊急聲明 - 天天要聞

充電易爆炸?多所高校禁用!羅馬仕緊急聲明

近日,多位網友反映收到學校下發的排查通知,稱「20000毫安的羅馬仕牌充電器在充電時易發生爆炸」。6月14日早間,相關詞條衝上熱搜榜第一。6月14日下午,@ROMOSS羅馬仕 發佈公開聲明:對於近期「北京多所高校禁用羅馬仕充電寶」事件的討論,我們就給師生及公眾帶來的困擾致以誠摯歉意,在此鄭重承諾:任何經權威機構鑒定存...
20000毫安羅馬仕充電寶易爆炸,被北京多所高校禁用?公司致歉:承諾經鑒定存缺陷的產品將擔責 - 天天要聞

20000毫安羅馬仕充電寶易爆炸,被北京多所高校禁用?公司致歉:承諾經鑒定存缺陷的產品將擔責

近日,多位網友反映收到學校下發的排查通知,稱「20000毫安的羅馬仕牌充電器在充電時易發生爆炸」。 今早(6月14日),相關詞條衝上熱搜榜第一。 今天下午,涉事品牌方公開聲明稱,已第一時間展開核查,後續進展將會通過官方渠道通知。 事件相關截圖。 6月14日下午,ROMOSS羅馬仕在官方微博上發佈公開聲明稱,對於近期「北...
終結西方超豪華品牌壟斷,尊界S800重塑智能豪華新標準 - 天天要聞

終結西方超豪華品牌壟斷,尊界S800重塑智能豪華新標準

何以為旗艦級轎車?在我的理解中,它應該是汽車科技創新的集大成者,是工業體系的技術結晶,是工業上的皇冠明珠。放在燃油車時代,聊到高端旗艦級轎車,多數人意識浮現的還是進口品牌,代表者如奔馳、寶馬、奧迪,它們把機械玩出了藝術,打造出非常多豪華經典的車型,如今邁入了新
「充電寶易爆炸,多高校禁用」,衝上熱搜第一!羅馬仕發道歉聲明 - 天天要聞

「充電寶易爆炸,多高校禁用」,衝上熱搜第一!羅馬仕發道歉聲明

來源:@ROMOSS羅馬仕、紅星新聞、南方都市報版權歸原作者所有,如有侵權請及時聯繫近日,多位網友反映收到學校下發的排查通知,稱「20000毫安的羅馬仕牌充電器在充電時易發生爆炸」。事件相關截圖今天,相關詞條衝上熱搜榜第一。今天下午,@ROMOSS羅馬仕 發佈公開聲明:對於近期「北京多所高校禁用羅馬仕充電寶」事件的討論...
2025蓮花杯單一品牌賽開啟 F1冠軍級實力打造國家級賽車晉級平台 - 天天要聞

2025蓮花杯單一品牌賽開啟 F1冠軍級實力打造國家級賽車晉級平台

5月30日,成都天府國際賽道——隨着引擎轟鳴劃破長空,2025蓮花杯單一品牌賽揭幕戰正式拉開帷幕。這場由中國汽車摩托車運動聯合會認證、蓮花品牌與銘泰集團聯合打造的國家級 GT單一品牌賽,依託77年賽道基因沉澱與F1尖端技術傳承,成為國內具備國際C級賽照升級資質
70.8萬起售!尊界S800的「尊」在這些細節上 - 天天要聞

70.8萬起售!尊界S800的「尊」在這些細節上

5月30日,尊界S800終於揭開了它最後一層「面紗」,新車共推出純電、增程兩個動力版本共4款配置,售價區間為70.8萬-101.8萬元。上市權益包括30000元的ADS智能輔助系統高階包、30000元的選配金、4000元的智能輔助駕駛無憂服務權益和40000元
松下Panasonic sx電機抽搐不能加載的解決辦法 - 天天要聞

松下Panasonic sx電機抽搐不能加載的解決辦法

松下Panasonic sx系列有名的抖音王,打理起來極為簡單,要麼簡單地換皮帶完事,要麼簡單的丟掉了事。硬着頭皮查電路,得不償失,超薄時期的松下,在電路上極盡變態之能事,恨不得在針眼裡做道場,像我這種顯微鏡加放大鏡式的的眼睛,也不能憑肉眼