超級計算機是一種超大型電子計算機,超級計算機是獲得超高運算性能、解決大型 科學計算和海量信息處理問題的重要工具,用超級計算機來進行高精度、高速度的數值計算模擬,對解決實際問題所發揮的作用是無與倫比的。有賴於超級計算機解決的挑戰性問題,涵蓋核試驗模擬、石油勘探、氣象預報、農業育種、醫療服務、新葯研製、動漫渲染、材料設計、金融計算等人類科學和生活的每一個領域。
美國禁售超級計算機
1964年,世界第一台向量超級計算機CDC6600橫空出世。這一安裝了35萬個晶體管的龐然大物,運算速度達300萬次/秒,是其他電腦的10倍。
1975 年開始,中國開始研製超級計算機,經過 8 年漫長的研製,「銀河一號」終於誕生,中國成為世界上第3個研製出超級計算機的國家,使超算家族首次出現「中國面孔」。
隨後的幾十年里,這張「面孔」不斷刷新,一次又一次地向世界超算家族貢獻出自己的智慧。
2009 年,「天河一號」誕生,天河一號突破了一系列關鍵技術,創造性地採用了多陣列、可配置、協同並行的體系結構,其峰值運算速度達4700萬億次/秒,這是我國首台千萬億次超級計算機,也是繼美國之後第二能夠研製千萬億次超級計算機的國家,可以說打破了美國的長期壟斷。
2010年,在最新全球超級計算機500強排行榜,經過技術升級的中國「天河一號」二期系統(天河-1A)雄居首位。它運算1小時,相當於13億人同時計算340年以上。
中國在超級計算機上的發展,引起了美國的憂慮,2015年4月份美國政府宣布,禁止向中國 4 家國家超級計算機中心出售「至強」(XEON) 芯 片, 理由是使用了兩款英特爾微處理器晶元的天河二號系統和早先的天河 1 號A 系統,「據信被用於核爆炸模擬」。除此之外,國家超級計算長沙中心、國家超級計算廣州中心、國家超級計算天津中心和國防科技大學,被美國列入「堅持違背美國國家安全或者外交利益的實體名單」。
中國突破封鎖,全面開花
美國的禁令封殺了中國繼續獲得Intel高性能晶元的可能。但也促進了中國超級計算機的進一步發展,其實早在美國制裁之前,無錫江南計算機研究所很早就已經預料到美國可能會限制中國超級計算機的發展,開始自研晶元——申威。
江南計算所選擇了沒落的Alpha架構,指令集也是基於Alpha進行擴展。申威早期的技術來源是於DEC的Alpha 21164。DEC的技術實力很強,但商業模式不如人而失敗,Alpha也被幾經轉手,後來更是被束之高閣,指令集和微結構都已經不再更新,技術專利大多已過期或快過期了。這也是為什麼江南計算所選擇Alpha架構的原因——美國沒有辦法支持,申威是目前Alpha陣營中僅存的碩果,擁有自主擴展指令和發展路線的自主權。
申威以Alpha指令集為基礎,擴展出自己的指令集,並在2006年設計出具有自主微結構的申威1,申威1是一款130nm製程工藝的單核心CPU,主頻900MHz,集成5700萬晶體管。2008年完成的申威2,是一款130nm製程工藝的雙核CPU,主頻1.4GHz。
而申威1600 是江南計算所研製申威系列的第三代處理器,內建 16 個 RISC 64 位核心,65nm 製程工藝及 975-1200MHz 工作頻率,浮點運算能力高達 140.88GFLOPS(1.1GHz 工作頻率表現),搭載了神威藍光超算,還使用了國產神威睿思操作系統,實現了軟體和硬體全部國產化。
神威藍光超算其總功耗只有 1074KW,是天河的功耗 4 兆瓦的四分之一。神威藍光 LINPACK 效率為 74%,與當時美國最快的計算機美洲虎超級計算機效率相當。
後來,成都申威科技推出了第四代申威晶元——申威26010,申威26010並沒有Alpha指令集,耳屎採用自己研發的指令集,這是他們專為高性能計算研發的指令集。
申威2610處理器的頻率1.45GHz,申威26010異構眾核處理器的晶元結構與性能 指標世界領先。它集成了4個運算控制核心和256個運算核心,運算控制核心和運算核心均採用申威指令系統,基礎指令集實現了兼容,運算核心和運算控制核心根據需求擴展了 256位向量指令集
搭載申威26010的就是神威·太湖之光,「神威•太湖之光」是一台運算速度超過每秒十億 億次浮點數運算的超大規模並行處理計算機系統,採用基於高密度彈性超節點和高流量複合網路的高效能體系結構。「神威•太湖之光」的軟體系統由國產眾核CPU 基礎軟體、並行操作系統環境、高性能存儲管理系統、並 行語言及編譯環境、並行開發環境等部分組成。實現了軟硬體的全國產。
2016年6月20日,搭載了申威SW26010的神威·太湖之光毫無疑問拿下來全球超級計算機第一的位置,並且實現了4連冠,神威·太湖之光更是世界上首台峰值計算速度超過十億億次的超級計算機,其峰值計算速度達每秒12.54億億次。
除了「神威」系列,中國超級計算機還要「天河」系列和「曙光」系列,天河二號原本使用的是Intel Xeon E5-2692 12核處理器及Xeon Phi 31S1P加速卡,因為美國禁令,2017年9月份,廣州超算中心使用國產加速器Matrix 2000取代原本的Intel Xeon Phi加速器。每個加速卡使用了4顆Matrix 2000晶元,每個Matrix 2000由128個內核組成,頻率1.2GHz,每周期能執行16個雙精度運算,處理器峰值性能為2.45TFLOPS。
而「曙光」系列超級計算機則是使用海光負責製造的中國國產Dhyana(禪定)x86處理器開始啟動生產。不過,這款晶元是根據AMD Zen微架構開發的。
可以說,在美國的制裁下,中國不僅沒有退步,反而在超級計算機晶元的發展上實現了遍地開花,中國超級計算機更是實現了全國產。
E級超算——下一決賽點
目前,中美正在全力博弈超級計算機下一個賽道——E級超算,。E 級超算是指每秒可進行百億億次數學運算的超級計算機,被全世界公認為「超級計算機界的下一頂皇冠」。
E級超級計算機的研製是國際上高端信息技術創新和競爭的前沿領域,美國、日本和歐盟均已提出E級超級計算機的研製計劃,幾乎都是在2021年左右完成。(因為疫情的原因,估計要到2022年)
目前,中國已經研發了3台E級超算原型機,分別是神威E級,曙光E級和天河三號,神威E級由完全自主研發的神威睿思操作系統、神威睿智編譯器等構建。運算系統全部採用「神威26010+」眾核處理器,高速互連網路系統全部採用申威網路交換晶元、申威消息處理晶元,這些關鍵部件均具備完全自主知識產權。存儲和管理系統由申威多核處理器構建,實現對該領域產品的全國產化替代。
而天河三號則自主設計了三款晶元:「邁創」眾核處理器(Matrix-2000+)、互連介面晶元、路由器晶元,實現了算系統的自主可控。2021年,「天河」E級(百億億次)計算機關鍵技術驗證系統,獲得SSSP Graph500(單源最短路徑)榜單世界第一和BIG Data Green Graph500(大數據圖計算能效)榜單世界第一的佳績。
目前,美國也在E級超算上發力,想要實現對中國的領先優勢,美國能源部此前已宣布將建造「極光」和「前沿」2台E級超算,其浮點運算速度將分別超過每秒100億億次和150億億次。
讓我們也期待在這場超算美日大戰中,中國可以再次實現對美國的超越!