2457億參數量!全球最大AI巨量模型王者問世,浪潮「源1.0」到底有多強?

2021年09月29日22:31:08 科技 1526

9月28日,浪潮人工智能研究院在京發佈人工智能巨量模型「源1.0」,這是目前為止全球最大的人工智能巨量模型。據悉,它的參數量達2457億,訓練採用的中文數據集達5000GB,相比於美國的GPT-3模型1750億參數量和570GB訓練數據集,源1.0參數規模領先40%,訓練數據集規模領先近10倍,榮膺世界第一。

2457億參數量!全球最大AI巨量模型王者問世,浪潮「源1.0」到底有多強? - 天天要聞

算法、數據、算力三大層面均實現超大規模

據了解,「源1.0」不管在算法、數據還是算力上,都做到了超大規模和巨量化。

首先,算法方面,相比於1750億參數的英文語言模型GTP-3,「源1.0」共包含了2457億個參數,是前者參數量的1.404倍。而且最重要的是,「源1.0」和GPT-3一樣都是單體模型,而不是由很多小模型堆砌起來。就單單在這一方面,「源1.0」就可以榮登全球最大的自然語言理解模型之位。

其次,在數據方面,「源1.0」幾乎是把近5年整個中文互聯網的浩瀚內容全部讀完。通過自研的文本分類模型,獲得了5TB高質量中文數據集,在訓練數據集規模上領先近10倍。「源1.0」還閱讀了大約2000個億詞。這是什麼概念呢?假如人一個月能讀十本書,一年讀一百本書,讀50年,一生也就讀5000本書,一本書假如20萬字,加起來也只有10億字,需要一萬年才能讀完2000億詞。在如此大規模的數據加持下,「源1.0」的數據集也自然成為了全球最大的高質量中文數據集。

此外,算力方面,「源1.0」共消耗約4095PD(PetaFlop/s-day)。相對於GPT-3消耗3640PD計算量得到1750億參數,計算效率大幅提升。若讓「源1.0」一天24小時不間斷「閱讀」的話,只需要16天就可以看完近五年中文互聯網的幾乎全部內容。

全球最大躋身全球最強 刷新多項世界紀錄

CLUE作為目前公認最權威的中文語言模型評估基準,「源1.0」佔據其零樣本學習(zero-shot)和小樣本學習(few-shot)2項榜單的榜首,在零樣本學習榜單中,「源1.0」超越業界最佳成績18.3%,在文獻分類、新聞分類,商品分類、原生中文推理、成語閱讀理解填空、名詞代詞關係6項任務中獲得冠軍;在小樣本學習的文獻分類、商品分類、文獻摘要識別、名詞代詞關係等4項任務獲得冠軍。在成語閱讀理解填空項目中,源1.0的表現已超越人類得分。

2457億參數量!全球最大AI巨量模型王者問世,浪潮「源1.0」到底有多強? - 天天要聞

同時,在對「源1.0」進行的「圖靈測試」中,將源1.0模型生成的對話、小說續寫、新聞、詩歌、對聯與由人類創作的同類作品進行混合併由人群進行分辨。測試結果表明,人群能夠準確分辨人與「源1.0」作品差別的成功率已低於50%。

目前,浪潮「源1.0」大模型只是一個開始,它只是提供一片廣闊的肥沃土壤,為諸多應用任務泛化支持提供統一強大的算法支撐。未來,浪潮源「源1.0」大模型將推動創新企業及個人開發者基於大模型構建智能化水平更高的場景應用,賦能實體經濟智能化升級,促進數字經濟高質量發展。

科技分類資訊推薦

英特爾酷睿 5 120F 處理器曝光:6 個 P 核 12 線程、睿頻 4.5GHz - 天天要聞

英特爾酷睿 5 120F 處理器曝光:6 個 P 核 12 線程、睿頻 4.5GHz

IT之家 6 月 14 日消息,科技媒體 WccFtech 今天(6 月 14 日)發佈博文,分享了英特爾酷睿 5 120F 處理器的規格信息,擁有 6 個 P 核和 12 線程,基礎頻率為 2.5 GHz,睿頻為 4.5GHz。IT之家援引博文介紹,酷睿 5 120F 處理器隸屬於 Bartlett Lake 系列,該系列僅採用 P 核(Performan
這次波音787為何沒有全球停飛? - 天天要聞

這次波音787為何沒有全球停飛?

不進行全球停飛,也許是其一種態度。文 | 海上客印度航空當地時間6月12日空難,着着實實是創了不少紀錄的。人員傷亡方面,不僅機上兩百餘人僅一位存活,且飛機墜落後砸中了古吉拉特邦艾哈邁達巴德機場附近一所醫學院學生宿舍,又帶走了幾十人的性命!工作人員抬走遇難者屍體不僅如此——這一發生在印度總理莫迪家鄉的空難,...
剛剛,國務院開會,優化耗材集采 - 天天要聞

剛剛,國務院開會,優化耗材集采

器械之家醫療器械媒體報道先鋒分享專業醫療器械知識關注來源:新華社、國家醫保局今日(6月13日),國家醫保局轉發新華社文章,國務院總理李強6月13日主持召開國務院常務會議,部署中國(上海)自由貿易試驗區試點措施複製推廣工作,聽取構建房地產發展新模式和推進好房子建設有關情況彙報,審議通過《關於進一步完善信用修...
光伏清洗機械人履帶:提升清潔效率的核心部件 - 天天要聞

光伏清洗機械人履帶:提升清潔效率的核心部件

光伏面板作為太陽能發電系統的核心組件,長期暴露在戶外環境中,表面極易積聚灰塵、污垢等雜質,嚴重影響發電效率。隨着自動化技術的快速發展,光伏清洗機械人已成為越來越多發電站的清潔方案。在這一過程中,光伏清洗機械人履帶作為關鍵部件,其性能直接影響
如何讓區塊鏈技術更好賦能實體經濟 - 天天要聞

如何讓區塊鏈技術更好賦能實體經濟

區塊鏈是數據共享和價值流通的重要基礎設施,是下一代價值互聯網絡的核心技術。隨着區塊鏈技術在多場景積極落地,釋放出顯著的市場價值。實踐證明,區塊鏈只有深深紮根在具體應用場景中,才能夠真正發揮出重要作用。在「十五五」期間,要更好推動區塊鏈技術賦能實體經濟,加快與場景融合發展。堅持系統性思維一方面,要用整...
通訊|中企助力尼日利亞水電樞紐重獲新生 - 天天要聞

通訊|中企助力尼日利亞水電樞紐重獲新生

新華社阿布賈6月10日電 通訊|中企助力尼日利亞水電樞紐重獲新生 新華社記者楊喆 朱悅 在尼日利亞中北部尼日爾州新布薩以東約17公里,非洲第三長河尼日爾河流經卡因吉大壩,發出轟隆隆巨響,向下游傾瀉而去。 這是2025年6月1日在尼日利亞尼日爾州拍攝的卡因吉水電站內的水電機組。新華社發(中國電建華東院公司供圖) 坐落...