RISC-V高性能時代已來,玄鐵再亮劍

歷經十多年的厚積薄發,RISC-V已完成了從新興勢力到中堅力量的蛻變。

一方面,越來越多原本只專註於其他架構的大廠進入這個賽道,並交出了可觀的成績。如高通在截止2023年年底,就已經出貨了6.5億個RISC-V內核。英偉已經累計量產了約30億顆基於RISC-V內核的芯片;

另一方面,除了在MCU市場勢如破竹以外,RISC-V還在AI芯片市場找到了一席之地。無論是由Jim Keller等傳奇芯片工程師成立的公司,還是類似Meta這樣的巨頭,都不約而同地看好RISC-V在AI市場的潛力。當然,國內外新成立的RISC-V公司也不勝枚舉。在他們的共同推動下,這個新架構在消費電子、汽車、工業、PC甚至服務器市場開闢了新天地。

經過15年的發展,RISC-V終於來到了高性能時代。

站在這個風口上,阿里巴巴旗下擁有先發優勢的達摩院玄鐵團隊正在RISC-V方面全力以赴。2月28日,玄鐵團隊在北京舉辦了RISC-V生態大會,不僅透露了行業第一代服務器級CPU的突破性進展,更展示了高性能生態的全圖景。

這是一步關鍵的先手棋。

RISC-V邁向高端,處理器全線升級

作為阿里巴巴達摩院旗下的知名品牌,玄鐵是國內最早投入RISC-V 架構的技術創新及生態建設的團隊之一。

具體到產品方面,全系列處理器是玄鐵的基本盤。自2019年推出第一款RISC-V處理器玄鐵C910以來,達摩院玄鐵團隊打造了涵蓋高性能、高能效和高實時的C(C910、C906、C907、C908、C920)系列、E(E902、E906、E907)系列和R系列(R908,R910)的玄鐵處理器家族產品,以覆蓋全場景的性能需求。應用方面也涵蓋了智能終端、網絡通訊、Al智算、服務器及周邊等多個熱門場景。

領先的競爭力反映在市場上。在去年的生態大會上,阿里達摩院院長張建鋒就透露,搭載玄鐵RISC-V內核的處理器出貨量已超40億顆,這也讓玄鐵成為國內RISC-V領域市場最受歡迎的處理器IP系列之一。

誠然,在行業發展的這個階段,玄鐵的RISC-V內核大多應用於類似MCU的嵌入式場景。但玄鐵對高性能的情懷和野心早在C910已經埋下,那是一顆打破當時RISC-V性能天花板的處理器,是全球範圍內探索高性能RISC-V的起點,在過去的幾年裡持續孵化出創新應用。

可以預見,玄鐵即將交付的高性能處理器C930,將會成為RISC-V發展歷程上的又一個里程碑。

因為歷史發展原因,過去的高性能處理器市場主要由X86架構,甚至更早之前的IBM Power架構主導。但進入近年,多年嘗試進入這個市場未果的Arm終於也找到了機會,在服務器芯片市場強勢崛起。包括亞馬遜、微軟、谷歌在內的雲服務廠商,也都紛紛推出了自研的高性能Arm服務器芯片,力求在這個原本由英特爾主導市場中分一杯羹,並已經取得了不錯的成果。

由此,在很多人看來,和Arm同樣是精簡指令集、且還擁有高度可定製的特點的RISC-V也能站在巨人肩膀上,迅速在高性能處理器市場站穩腳跟。這也正是包括達摩院玄鐵在內的團隊大力推動RISC-V走向高端的的原因之一。

據悉,即將交付的玄鐵下一代旗艦處理器C930是一款可媲美Arm Neoverse系列的處理器,採用15級亂序超標量流水線設計,支持CHI協議,以及多核多cluster可擴展,6譯碼寬度和10+發射寬度。憑藉這些卓越設計,其SPECint 2006高達15分/GHz以上,達到服務器級別應用的水準,能夠滿足PC、邊緣服務器和自動駕駛等高性能計算場景的需求。

在性能方面打下新標杆的同時,玄鐵這次也透露正在研發C908X、R908A、XL200等新產品,向AI加速、車載、高速互聯等方向持續發展。其中,C908X支持RVV1.0矢量擴展並增加至4096bit超長數據位寬,是玄鐵首款AI專用處理器;R908A是一款可虛擬化的多核硬實時處理器,適用於車載場景的高可靠需求;XL200則能提供更高性能的多核多簇互聯解決方案。

玄鐵RISC-V的根基扎得更廣、更深了。

生態並進,加快RISC-V挺進“高性能”深水區

眾所周知,硬件需要軟件,也需要有良好的生態助力其擴展應用並服務多樣化場景。換而言之,能否將這些處理器更好地用起來,是有意轉向RISC-V開發者所關注的重點。因此,除了在處理器的廣度和深度上發力外,玄鐵也在RISC-V的應用和生態上齊頭並進。

據介紹,團隊正在構建起以玄鐵 RISC-V 為核心的高性能生態體系,與生態夥伴協同推動 RISC-V 芯片、開發工具、操作系統、應用解決方案等不同層面的軟硬一體化發展,全力推動 RISC-V 軟硬全棧技術多領域發展落地。

例如,圍繞玄鐵高性能RISC-V處理器,勞特巴赫提升了問題診斷和性能優化效率,兆松科技支持了編譯優化,Arteris的NoC互聯IP提供了高性能互聯,紐創信安則提供eHSM模塊和完整的安全啟動流程。

以上各方強強聯手,為的就是方便行業真正開發出高性能的玄鐵RISC-V芯片。

在應用方面,去年的技術生態大會上,中國科學院軟件研究所(以下簡稱軟件所)宣布基於玄鐵C910打造的業界首款開源RISC-V筆記本“如意BOOK甲辰本”。據介紹,該本子在openEuler操作系統上可流暢運行釘釘、Libre Office等大型辦公軟件。隨着這個本子的發布,代表着RISC-V生態對通用計算支持能力的提升,也首次打通了從底層芯片到操作系統,再到商用軟件的RISC-V全鏈路。

進入今年的技術大會,軟件所透露,“如意BOOK甲辰本”已成功實現量產落地,他們也將推出內置64核玄鐵C920處理器的RISC-V PC“如意BOOK乙巳本”。據介紹,該本子的AI算力較上一代提升3.8倍。

同時,軟件所還帶來了智能機器人、AI PC等RISC-V高性能應用。其中,基於玄鐵C920處理器的AI PC概念機已經跑通Llama、Qwen、DeepSeek等開源模型,打通從開源硬件架構到開源操作系統、再到開源AI模型的“開源AI全鏈路”,單位計算能耗降低30%,支持AI個人助手、AI編程、AI視覺等能力,這也代表了RISC-V處理器在AI方面的又一次突破。

來到生態合作模式層面,在去年的玄鐵RISC-V生態大會上,達摩院發起了RISC-V業內的一次全新嘗試——聯合頭部企業及機構成立“無劍聯盟”,具體而言就是基於玄鐵處理器深度推進IP協同、工具鏈優化、操作系統適配、解決方案拓展、應用推廣等工作,以持續降低RISC-V開發成本,縮短RISC-V產品及應用上市時間。

“無劍聯盟”讓這些頭部玩家真正深度融合,碰撞出新的火花:

一方面,新思科技為C910處理器的設計、實現與功能驗證提供了 VC Formal、VC PS、Fusion Compiler 等工具,達到了最佳的 PPA 指標,並與玄鐵聯合推出深度融合的“無劍300”芯片設計平台,助力芯片廠商縮短開發周期;

另一方面,Arteris的互聯主線與玄鐵高性能處理器完成適配,有望向更多高性能處理器客戶複製推廣。

歷經過去一年的發展,也有首批RISC-V芯片自無劍聯盟誕生:中國電信研究院基於TH1520芯片原型,打造業界首個RISC-V視頻轉碼卡TeleVPU。據介紹,該卡成本較業界方案降低20%,具備20T AI算力和40路1080p高清視頻編解碼能力,單卡顯存高達40G,並且已在現網部署。

有了這些樣板,“無劍聯盟”在今年又迎來了新成員的加入。

隨着西門子EDA和Cadence主動加入,“EDA三巨頭”在“無劍聯盟”齊聚一堂;經緯恆潤將基於RISC-V提供芯片定義、AUTOSAR基礎軟件和自研工具鏈開發,構建從芯片到軟件的完整車規級解決方案;普華基礎軟件發布的首個規模化、量產級開源安全車控操作系統小滿(EasyXMen)已完成與RISC-V架構適配,並將持續跟蹤支持最新RISC-V架構相關規範,共建軟硬協同的技術生態,推動RISC-V“上車”;此外,聯盟還吸收了網易有道和國網南瑞,他們將各自在教育硬件和電網領域優先選擇RISC-V架構推動相關的數智化升級。

在軟件工具層面,玄鐵也實現了重要整合,公司基於Android、Linux和RTOS三套操作系統適配,推出相應的三套SDK,將多年來積澱的玄鐵軟件能力全面整合,以更完整、便捷、穩定的方式向行業輸出。特別是,玄鐵Linux SDK提供包括Hypervisor虛擬化、CoVE安全框架、玄鐵AI框架、高性能算子庫在內的豐富子系統,助力RISC-V在高性能和AI場景的開發啟航。

畢竟,硬件就是一個IP,但軟件是一堆的軟件棧和庫,一個公司不能把所有的事情做完。大家取自於生態,讓客戶真正從中受惠,然後再把它回饋到生態中,這才是RISC-V發展的長久之道。

DeepSeek引發思考,開源的偉大

曾幾何時,我們對於處理器的期待,都是以追求更強性能與更優體驗為目標,這也正是達摩院玄鐵團隊不斷衝擊RISC-V高端處理器,並推出C930的原因之一。

C930跨過SPECint2006 15分這個分水嶺之後,可能充分發揮面積小、功耗低的優勢,滲透到服務器場景。也許,行業能在兩三年後能看到基於C930的一個雲實例。

在可見的未來,RISC-V仍會向高端化繼續發力。英偉達的成功和路線圖,也證明了這條路的正確性。但在去年底,本土大模型DeepSeeK橫空出世,並以黑馬之姿領跑全球的時候,引發了大家對人工智能以及芯片未來發展的一些全新思考:

一方面,和谷歌和OpenAI不一樣,DeepSeeK是一個開源模型。一個開源模型能獲得這樣的成功,讓大家看到了開源的價值和領先性。就連以打造閉源模型著稱的OpenAI公司首席執行官Sam Altman也首次承認:“我個人認為,我們在這裡站在了歷史的錯誤一邊,需要找出一個不同的開源策略。OpenAI中並非所有人都認同這一觀點,這也不是我們當前的最高優先事項。”

作為主流指令集架構中唯一“生而開源”的,RISC-V的潛力令人期待。

DeepSeek帶來的另一方面思考是——低算力也能讓大模型成為可能。有了解過DeepSeek底層原理的讀者知道,這個模型實際上是用更低的激活比去實現更低算力的成本,讓單機部署也成為可能,而不再需要大型的服務器。正是這樣的設計,打破了對傳統架構的“迷信”。

算力架構,面臨重新洗牌。

過去,大家認為並行計算只能用GPU去做。現在不光是GPU能做,基本市面上所有的計算體系架構都可以跟DeepSeek適配。CPU在AI領域的價值,值得被重估一次。

基於這些思考,達摩院玄鐵在打造包括高性能處理器在內的多系列RISC-V處理器的同時,還考慮了原生AI算力的結合。為此,C930除了對標服務器級應用的通用高性能,也率先搭載了8 TOPS Matrix引擎,與前一代Vector引擎的AI算力相比實現飛躍。

與此同時,玄鐵還在布局AI專用處理器,C908X就是其中一個代表。該處理器支持了超寬的矢令矢量指令集(可以達到4096 bits),讓有需要的客戶有餘量去加一些非常寬的自定義指令集。

也給玄鐵RISC-V預備了無限寬闊的AI未來。

寫在最後

在談到對未來發展規劃的時候,玄鐵表示,公司在堅持走好高性能和AI這兩條路的同時,還將集中精力去迭代其處理器產品線,以滿足開發者的多樣化需求。

而作為對RISC-V基金會投入最大的中國機構,達摩院玄鐵還將在聯合國際頭部合作夥伴,在完善高性能和AI新興場景所需的軟件生態的同時,對標準建設做出更多的貢獻。率先提出了Matrix擴展指令,就是玄鐵又一“敢為天下先”的代表作。

毫無疑問,RISC-V的高性能時代已然到來,玄鐵團隊也正在以技術創新為劍,以生態建設為盾,引領這一開源架構邁向新的高峰。