一家德國創業公司Semron正在開發一種名為“3D堆棧”的芯片,以便直接在智能手機、耳機、VR頭戴式設備和其他移動設備上運行人工智能模型。
由德累斯頓工業大學工程系畢業生Kai-Uwe Demasius和Aron Kirschen共同創立的Semron芯片使用電場而非傳統處理器的電流來進行運算,Kirschen聲稱此舉可提高能源效率並降低生產成本。
Kirschen在接受採訪時表示:“由於預期人AI算資源將出現短缺,許多依賴於這些能力的商業模式的公司面臨著生存風險——例如,那些訓練自己模型的大型初創公司。我我們技術的獨特功能將使我們能夠達到當今消費電子設備芯片的價格點,儘管我們的芯片能夠運行先進的AI,而其他公司則不能。”
Semron的芯片使用一種稱為“記憶電容器”的特殊組件進行運算,Demasius和Kirschen在2016年(成立Semron四年前)就為此提交了初步專利。大多數計算機芯片都是由晶體管製成,與電容器不同,晶體管無法存儲能量,它們只是充當“開/關”開關,控制電流的通過與否。
Semron的記憶電容器由傳統半導體材料製成,利用化學中稱為電荷遮罩的原理工作。記憶電容器通過一個“遮罩層”控制頂部電極和底部電極之間的電場。遮罩層反過來由芯片的內存控制,該內存可以存儲人工智能模型的不同“權重”。(權重基本上充當模型中的旋鈕,在模型訓練和處理數據時控制和微調其性能。)
電場方法將芯片等級的電子移動降到最低,進而降低了能量消耗和熱量。Semron旨在利用電場的散熱特性將多達數百層的記憶電容器放置在單個芯片上,大大提高運算能力。
Semron 3D AI芯片設計示意圖。
Kirschen補充道:“我們利用這個特性作為一個平台,在固定硅面積上部署數百倍的計算資源。你可以想象它就像就像一個封裝中有數百個芯片一樣。”
在2021年發表在《自然電子期刊》的一項研究中,Semron和馬克斯普朗克微結構物理研究所的研究人員成功訓練了一個計算機視覺模型,其能源效率超過3,500 TOPS/W,是現有技術的35到300倍。TOPS/W是一個有點模糊的指標,但結論是記憶電容器可以大大降低人工智能模型訓練時的能量消耗。
目前,Kirschen表示Semron仍處於“產品前”階段,並且幾乎沒有收入。通常,芯片創業公司最困難的部分是大規模製造和獲得有意義的客戶群,儘管不一定按此順序。
對Semron來說更加困難的是,它在像Kneron、EnCharge和Tenstorrent這樣的定製芯片企業中面臨著激烈的競爭,這些公司總共籌集了數千萬美元的風險資本。與Semron一樣,EnCharge也在設計使用電容器而非晶體管的計算機芯片,但使用不同的基板架構。
然而,擁有11人團隊的Semron計划到今年年底將團隊擴大到大約25人,已成功吸引來自Join Capital、SquareOne、OTB Ventures和Onsight Ventures等投資者的資金。迄今為止,這家創業公司已籌集到1000萬歐元(約1081萬美元)。
SquareOne合伙人Georg Stockinger通過電子郵件表示:
“計算資源將成為21世紀的“石油”。隨着大型語言模型佔據世界,摩爾定律接近物理極限,未來幾年計算資源將會出現巨大瓶頸。缺乏對運算基礎設施的訪問將大大降低公司和整個國家的生產力和競爭力。Semron將通過提供一種專門用於運算人工智能模型的革命性新芯片來解決這一問題,成為解決方案的關鍵要素。它打破了傳統基於晶體管的運算典範,並將特定運算任務的成本和能源消耗降低至少20倍。”