2015年,美国对中国禁售超算芯片,中国突破封锁,重登全球第一

超级计算机是一种超大型电子计算机,超级计算机是获得超高运算性能、解决大型 科学计算和海量信息处理问题的重要工具,用超级计算机来进行高精度、高速度的数值计算模拟,对解决实际问题所发挥的作用是无与伦比的。有赖于超级计算机解决的挑战性问题,涵盖核试验模拟、石油勘探、气象预报、农业育种、医疗服务、新药研制、动漫渲染、材料设计、金融计算等人类科学和生活的每一个领域。




美国禁售超级计算机

1964年,世界第一台向量超级计算机CDC6600横空出世。这一安装了35万个晶体管的庞然大物,运算速度达300万次/秒,是其他电脑的10倍。



1975 年开始,中国开始研制超级计算机,经过 8 年漫长的研制,“银河一号”终于诞生,中国成为世界上第3个研制出超级计算机的国家,使超算家族首次出现“中国面孔”。

随后的几十年里,这张“面孔”不断刷新,一次又一次地向世界超算家族贡献出自己的智慧。

2009 年,“天河一号”诞生,天河一号突破了一系列关键技术,创造性地采用了多阵列、可配置、协同并行的体系结构,其峰值运算速度达4700万亿次/秒,这是我国首台千万亿次超级计算机,也是继美国之后第二能够研制千万亿次超级计算机的国家,可以说打破了美国的长期垄断。



2010年,在最新全球超级计算机500强排行榜,经过技术升级的中国“天河一号”二期系统(天河-1A)雄居首位。它运算1小时,相当于13亿人同时计算340年以上。

中国在超级计算机上的发展,引起了美国的忧虑,2015年4月份美国政府宣布,禁止向中国 4 家国家超级计算机中心出售“至强”(XEON) 芯 片, 理由是使用了两款英特尔微处理器芯片的天河二号系统和早先的天河 1 号A 系统,“据信被用于核爆炸模拟”。除此之外,国家超级计算长沙中心、国家超级计算广州中心、国家超级计算天津中心和国防科技大学,被美国列入“坚持违背美国国家安全或者外交利益的实体名单”。




中国突破封锁,全面开花

美国的禁令封杀了中国继续获得Intel高性能芯片的可能。但也促进了中国超级计算机的进一步发展,其实早在美国制裁之前,无锡江南计算机研究所很早就已经预料到美国可能会限制中国超级计算机的发展,开始自研芯片——申威

江南计算所选择了没落的Alpha架构,指令集也是基于Alpha进行扩展。申威早期的技术来源是于DEC的Alpha 21164。DEC的技术实力很强,但商业模式不如人而失败,Alpha也被几经转手,后来更是被束之高阁,指令集和微结构都已经不再更新,技术专利大多已过期或快过期了。这也是为什么江南计算所选择Alpha架构的原因——美国没有办法支持,申威是目前Alpha阵营中仅存的硕果,拥有自主扩展指令和发展路线的自主权。

申威以Alpha指令集为基础,扩展出自己的指令集,并在2006年设计出具有自主微结构的申威1,申威1是一款130nm制程工艺的单核心CPU,主频900MHz,集成5700万晶体管。2008年完成的申威2,是一款130nm制程工艺的双核CPU,主频1.4GHz。

申威1600 是江南计算所研制申威系列的第三代处理器,内建 16 个 RISC 64 位核心,65nm 制程工艺及 975-1200MHz 工作频率,浮点运算能力高达 140.88GFLOPS(1.1GHz 工作频率表现),搭载了神威蓝光超算,还使用了国产神威睿思操作系统,实现了软件和硬件全部国产化。



神威蓝光超算其总功耗只有 1074KW,是天河的功耗 4 兆瓦的四分之一。神威蓝光 LINPACK 效率为 74%,与当时美国最快的计算机美洲虎超级计算机效率相当。

后来,成都申威科技推出了第四代申威芯片——申威26010,申威26010并没有Alpha指令集,耳屎采用自己研发的指令集,这是他们专为高性能计算研发的指令集。

申威2610处理器的频率1.45GHz,申威26010异构众核处理器的芯片结构与性能 指标世界领先。它集成了4个运算控制核心和256个运算核心,运算控制核心和运算核心均采用申威指令系统,基础指令集实现了兼容,运算核心和运算控制核心根据需求扩展了 256位向量指令集



搭载申威26010的就是神威·太湖之光,“神威•太湖之光”是一台运算速度超过每秒十亿 亿次浮点数运算的超大规模并行处理计算机系统,采用基于高密度弹性超节点和高流量复合网络的高效能体系结构。“神威•太湖之光”的软件系统由国产众核CPU 基础软件、并行操作系统环境、高性能存储管理系统、并 行语言及编译环境、并行开发环境等部分组成。实现了软硬件的全国产。



2016年6月20日,搭载了申威SW26010的神威·太湖之光毫无疑问拿下来全球超级计算机第一的位置,并且实现了4连冠,神威·太湖之光更是世界上首台峰值计算速度超过十亿亿次的超级计算机,其峰值计算速度达每秒12.54亿亿次。

除了“神威”系列,中国超级计算机还要“天河”系列和“曙光”系列,天河二号原本使用的是Intel Xeon E5-2692 12核处理器及Xeon Phi 31S1P加速卡,因为美国禁令,2017年9月份,广州超算中心使用国产加速器Matrix 2000取代原本的Intel Xeon Phi加速器。每个加速卡使用了4颗Matrix 2000芯片,每个Matrix 2000由128个内核组成,频率1.2GHz,每周期能执行16个双精度运算,处理器峰值性能为2.45TFLOPS。



而“曙光”系列超级计算机则是使用海光负责制造的中国国产Dhyana(禅定)x86处理器开始启动生产。不过,这款芯片是根据AMD Zen微架构开发的。

可以说,在美国的制裁下,中国不仅没有退步,反而在超级计算机芯片的发展上实现了遍地开花,中国超级计算机更是实现了全国产。


E级超算——下一决赛点

目前,中美正在全力博弈超级计算机下一个赛道——E级超算,。E 级超算是指每秒可进行百亿亿次数学运算的超级计算机,被全世界公认为“超级计算机界的下一顶皇冠”。

E级超级计算机的研制是国际上高端信息技术创新和竞争的前沿领域,美国、日本和欧盟均已提出E级超级计算机的研制计划,几乎都是在2021年左右完成。(因为疫情的原因,估计要到2022年)

目前,中国已经研发了3台E级超算原型机,分别是神威E级,曙光E级和天河三号,神威E级由完全自主研发的神威睿思操作系统、神威睿智编译器等构建。运算系统全部采用“神威26010+”众核处理器,高速互连网络系统全部采用申威网络交换芯片、申威消息处理芯片,这些关键部件均具备完全自主知识产权。存储和管理系统由申威多核处理器构建,实现对该领域产品的全国产化替代。




而天河三号则自主设计了三款芯片:“迈创”众核处理器(Matrix-2000+)、互连接口芯片、路由器芯片,实现了算系统的自主可控。2021年,“天河”E级(百亿亿次)计算机关键技术验证系统,获得SSSP Graph500(单源最短路径)榜单世界第一和BIG Data Green Graph500(大数据图计算能效)榜单世界第一的佳绩。

目前,美国也在E级超算上发力,想要实现对中国的领先优势,美国能源部此前已宣布将建造“极光”和“前沿”2台E级超算,其浮点运算速度将分别超过每秒100亿亿次和150亿亿次。

让我们也期待在这场超算美日大战中,中国可以再次实现对美国的超越!