芯片良率危機凸顯

2022年07月07日18:37:35 科技 1409
芯片良率危機凸顯 - 天天要聞

圖片來源@視覺中國

文 | 半導體產業縱橫

近期,半導體業倍受關注的一大熱點事件是三星官宣量產3nm製程芯片。實際上,在官方消息發出之前,業界就一直在議論此事,焦點就是良率問題。由於在追趕台積電的道路上不遺餘力,三星幾乎用盡渾身解數,這一次,在台積電即將於下半年量產3nm製程之前,搶先宣布量產,比拼的意味濃厚。但從近些年的情況來看,在先進製程工藝方面,屢屢被台積電碾壓,一個很重要的原因就是三星難以保證良率,這在獲取客戶信心方面是個很大的減分項。

前些年,在10nm和7nm製程剛量產的時候,高通驍龍845 SoC由三星代工生產,驍龍855、865則由台積電7nm製程工藝生產,英偉達原計劃由三星生產的7nm製程GPU芯片,也轉移到了台積電。那時,三星在良率方面就落後於台積電,訂單量明顯少於對手。

2021年,4nm製程興起,高通將驍龍 8 Gen1 Plus的生產訂單轉給了台積電,很重要的原因就是三星4nm製程工藝的良率僅為35%左右,與台積電超過70%的良率相比差太多。

今年2月,據韓媒Infostock DAIly報道,三星電子懷疑旗下晶圓代工廠的產量及良率報告存在造假行為,因此,三星DS部門受到了管理諮詢部門對其晶圓代工廠5nm製程良率的調查,緊隨其後的將是4nm和3nm調查。該事件的起因是,三星晶圓代工業務飽受低良率之苦,特別是4/5nm製程量產後,出現了良率極其低下的情況,交貨時間不斷延後,招致了三星高層的懷疑。一位熟悉三星電子內部情況的高管表示:“由於晶圓代工業務交付的數量難以滿足最近的訂單需求,我們對非內存工藝的良率表示懷疑,眾所周知,基於該良率(指此前良率報告的數據)是可以滿足訂單交付的。”管理諮詢部門的懷疑對象是DS部門現任及前任高管,調查內容包括:之前遞交的良率報告是否真實,用於提升良率的資金究竟流向何方。

今年6月,三星任命了內存製造技術中心副總裁Kim Hong-shik領導晶圓代工技術創新團隊。通過改組,三星調動存儲芯片專家來領導代工業務的核心部門。此次,晶圓代工部門的重組,也是為了改善3nm芯片良率,努力反超台積電。

台積電之所以能在先進制程方面領先全球,高良率是殺手鐧。據悉,該公司7nm製程在量產開始3個季度後,其不良率降至每平方厘米0.09,5nm製程量產初期,不良率低於同期的7nm,缺陷密度大約為每平方厘米0.10~0.11,隨着5nm芯片量產進程的推進,不良率降至0.10以下。

另一大芯片巨頭英特爾也飽受良率困擾,2020年7月,該公司發布消息稱,原計劃於2021年底上市的7nm芯片,因工藝存在缺陷,導致良率下降,發布時間推遲6個月。在此之前,英特爾在10nm製程的研發過程中就遇到了很多困難,多次延期,2019年初才實現量產。

綜上,芯片良率的重要性可見一斑。

芯片良率簡析

簡單的說,芯片良率就是晶圓上合格芯片數量與芯片總數的比值,這個數值越大,說明有用芯片數量越多,浪費越少,成本也就越低,利潤越高。

良率還可以細分為wafer(硅晶圓)良率、die良率和封測良率,這三種良率的乘積則是總良率。總良率是所有晶圓廠的核心機密,外界很難知曉。它可以反應出這家晶圓廠製造芯片的總體水平和營收能力。

芯片製造的每一個階段,從晶圓製造、中測、封裝到成測,每一步都會對總良率產生影響,其中,晶圓製造是影響良率的主要因素。

良率還受設備、原材料等因素影響,要想達到較高水平,需要穩定工藝設備,定期做工藝能力恢復。另外,環境因素對以上提到的三種良率都會產生影響,如塵埃、濕度、溫度和光照亮度等,芯片製造和封測過程需要在超潔凈的工作環境中進行。

另外,wafer的尺寸會直接影響良率,一般情況下,中心區域的良率較高,邊緣區域的良率較低(這是由製造工藝決定的)。wafer尺寸越大,中心區面積佔總面積比例也大,良率越高。

良率不是一成不變的,它會隨着工藝技術的不斷成熟而提升。一般情況下,新製程工藝剛量產的時候,良率比較低,隨着生產的推進,以及導致低良率的因素被發現和改進,良率會不斷提升,較為成熟的產線良率可以達到95%以上。

很多半導體公司都有專門從事良率提升工作的工程師,在晶圓廠,有專門的良率提高(YE)部門,良率工程師負責提高晶圓良率;在IC設計企業,運營部門有專業的產品工程師(PE)負責提高良率。

拿什麼拯救你,我的良率

芯片良率如此重要,全行業都非常關注,晶圓廠、IC設計企業、半導體設備和材料廠商,以及行業科研機構都在進行各種研究探索,為提升芯片良率添磚加瓦。

當然,提升良率的主戰場依然是晶圓廠(IDM廠或晶圓代工廠)。要提升良率,首先需要深入研究芯片良率與可靠性之間的關係,而可靠性與芯片缺陷有直接關係,因此,減少芯片生產過程中的缺陷數量可以提升基準良率,同時可以提高器件的可靠性。

為了提高可靠性,需要投入時間、資金和相關資源,以提高良率,這就需要進行權衡,因為不同類型芯片對可靠性的要求不同,與之對應的資源投入也不同,這也會直接影響利潤。例如,消費類電子產品用芯片對可靠性要求沒有那麼高(與工業和汽車芯片相比),因此,對於這類芯片,達到一定良率之後,晶圓廠不會做再高的追求,而是將資源分配到開發下一個節點的製程和設備,這樣可以提高成熟節點的盈利能力。而對於高可靠性要求的芯片(如車用芯片,其可靠性要求比消費類芯片高兩至三個數量級),晶圓廠必須追求更高的基準良率水平,也就需要在製程工藝和設備方面投入更多資源。不過,高性能與高良率之間是存在矛盾關係的,很難兼顧。

對於晶圓廠而言,大多數影響良率的系統性問題都已解決,實際良率損失主要是由製程設備或環境的隨機缺陷造成的。為了檢測出可靠性缺陷,晶圓廠的產線必須具備相應的製程控制設備和檢測取樣機制,採用的缺陷檢測系統必須具備所需的缺陷靈敏度,並維護良好且達到規格。檢測取樣必須針對製程步驟達到足夠的頻次,以快速檢測到製程或設備的偏移。此外,必須有足夠的檢測產能用以支持加速異常偵測。

在實際操作過程中,常見的難點是精確找出基準缺陷的出處,有時,缺陷產生之後經過多個製程步驟才被檢測到,這對設備監控系統和機制的要求很高,做不好的話,常常找不出問題的根源在哪。為了解決這個問題,系統會先檢測一片晶圓,使其在指定的製程設備中運行,然後再次檢測,第二次檢測發現的任何新缺陷必定是由該指定的製程設備產生的,這樣,就可以找出缺陷的根源所在。因此,設置好一套靈敏的檢測機制,可以揭示源自每個製程設備的隨機良率損失並將其解決。

此外,晶圓廠可以對每個設備上出現的缺陷進行分類,並生成資料庫,可作為現場故障的失效分析參考。這種方法需要非常頻繁的設備認證(至少每天一次)。

通過以上這些措施和方法,晶圓廠可以有效控制缺陷,從而提升芯片良率水平。當然,除了這些,晶圓廠還有其它提升良率的方式方法,這裡就不再贅述了。

除了晶圓廠產線的流程控制,產業鏈上游的半導體材料廠商,特別是硅晶圓廠商,也可以通過創新技術,在晶圓層面為提升良率提供保障。

例如,來自韓國科學與信息通信技術部下屬的韓國機械與材料研究所(KIMM)和新加坡南洋理工大學(NTU)的科學家開發了一種技術——新型納米轉移印刷技術(Nanotransfer-basedprinting),它可以製造出高度均勻的硅晶圓。他們將無化學粘合劑打印技術與金屬輔助化學蝕刻相結合,可以用於增強表面對比度以使納米結構可見。

這種納米轉移印刷技術是通過在相對低溫(160°C)下將金(Au)納米結構層轉移到硅襯底上,形成具有納米線(nanowires)的高度均勻的晶圓,以實現在製造過程中控制所需的厚度。這種技術允許快速、均勻、大規模製造晶圓,同時,製造的晶圓幾乎沒有缺陷,生產出的芯片良率非常高。在實驗室測試中,能夠將99%的20nm厚Au薄膜轉移到6英寸晶圓上。當採用該方法加工6英寸晶圓時,結果顯示印刷層保持完整,在蝕刻過程中彎曲最小,證明該Nanotransfer-basedprinting技術具有出色的均勻性和穩定性。

KIMM-NTU團隊認為該技術可以很容易地擴展到12英寸晶圓上,而這是三星,英特爾、台積電和GlobalFoundries等晶圓廠產線中的主流晶圓尺寸。

性能與良率之爭

談到芯片良率,就不能不談性能,因為這兩者之間是存在矛盾關係的。在消費類電子產品芯片大行其道的時代,良率占絕對上風,因為消費電子產品對性能的要求沒那麼高。但隨着近些年消費電子市場的疲軟,相應地,高性能計算(HPC)、汽車電子市場快速發展,且潛力巨大,而這些類型的芯片對性能要求極高,此時,良率就不得不做些讓步了,因為在絕對高性能的量產要求下,良率不可能做得像消費類芯片那麼高。

這樣,各種新型芯片架構就湧現了出來。最具代表性的,也是最極端的就是Cerebras的晶圓級大芯片。

2019年8月,人工智能初創公司Cerebras Systems發布了Cerebras Wafer Scale Engine(WSE)處理器,這是一個超大芯片,由一個12英寸晶圓製成。而傳統芯片則很小,一個12英寸晶圓可以製造出三、四百個芯片。

WSE擁有1.2萬億個晶體管,專門面向AI任務開發,這顆巨型芯片,面積達到42225平方毫米

通常情況下,晶圓廠不會製造這麼大的芯片,因為在單個晶圓的加工過程中通常會出現一些雜質,雜質會直接影響芯片良率,而單個芯片越大,整體良率越低。像Cerebras這麼大的芯片,其良率保障是個凸出的問題。不過,Cerebras Systems公司表示,其設計的芯片留有冗餘,一種雜質不會導致整個芯片都不能用。

2021年4月,Cerebras Systems公司又推出了WSE的升級版WSE-2,集成了2.6萬億個晶體管。該公司稱設計出了一個可以繞過任何製造缺陷的系統來實現100%的良率,最初,Cerebras有1.5%的額外內核允許缺陷的存在。

之所以會出現WSE這樣的超大芯片,原因在於,高性能計算市場對性能的敏感度高於價格,高性能計算市場的主要客戶並非C端,而是B端的行業客戶,他們對成本不敏感,最關心的是性能。特別是近些年,AI在雲計算市場的應用風起雲湧,雲端AI芯片的客戶主要是谷歌這樣的互聯網巨頭,在這些巨頭眼裡,算力就是王道,它們對算力的追求幾乎是無止境的,這一點和信奉“夠用就好”的消費電子市場完全不同。

當然,像Cerebras Systems公司這樣的芯片屬於極端案例,大多數情況下,高性能計算市場的芯片尺寸還是在傳統範圍以內。但良率與性能之間的矛盾問題還是有增無減。需要有新的解決方案。

此時,Chiplet應運而生,它在兼顧性能和良率方面有獨到之處。如果要提升性能就必須減少片外通信,而想提升良率則必須保證單一芯片面積不能太大。Chiplet方案恰恰能同時兼顧這兩點。Chiplet可將單一芯粒(die)面積做小(確保良率),並用高級封裝技術把不同的芯粒集成在一起。這樣,芯粒之間的通信並不需要走PCB板,可以在封裝內進行,這就大大降低了片外通信的開銷。AMD最先在數據中心商用了Chiplet方案,且取得了良好的效果,看到商機後,英特爾也在跟進,開發了一整套先進制程工藝和封裝技術。

總之,在先進制程不斷迭代的今天,芯片良率問題變得越來越突出,與此同時,高性能需求也在給良率找麻煩。一切都好難,能夠玩轉這些的廠商恐怕會越來越少。

科技分類資訊推薦

華為mate60Pro+掉到了七千!這是給後面的70讓步嗎? - 天天要聞

華為mate60Pro+掉到了七千!這是給後面的70讓步嗎?

mate60Pro+起售價是8999,而現在第三方平台來到了七千左右[靈光一閃]也是情理之中,畢竟再過四個月mate70系列就要和大家見面了[呲牙]mate60系列賣的最好的就是Pro了,而Pro+對比Pro其實提升不大[捂臉]性價比並不高
絲杠加工設備行業研究:雄關漫道,邁步而越 - 天天要聞

絲杠加工設備行業研究:雄關漫道,邁步而越

(報告出品方/作者:華創證券,范益民、胡明柱)一、絲杠加工工藝及核心設備(一)滾珠/柱絲杠加工工藝過程磨削為精密絲杠的主要加工方式,核心工序包括螺紋加工、絲杠校直及熱處理。絲杠的 加工方式有磨削和冷軋兩種,兩者區別在於絲杠的加工,螺母加工都
年度“十大新興技術”如何出爐? - 天天要聞

年度“十大新興技術”如何出爐?

6月26日,2024大連夏季達沃斯論壇上一個30分鐘的會議,高效率地向觀眾將其25日發布的《十大新興技術報告》作以解讀。會議信息顯示,這十大新興技術實際是從首批篩選出的70個新興技術中二次被篩選出的。目前針對新興技術全球領域的投融資早已風雲際會。融資主要來源於美國,中國正在奮起直追,英國、澳大利亞緊隨其後。《十...
5G基站總數全球佔比達60% 上海移動今年將建成1.4萬個5G-A站點 - 天天要聞

5G基站總數全球佔比達60% 上海移動今年將建成1.4萬個5G-A站點

圖為MWC上海中國移動展台現場/採訪對象供圖       新民晚報訊(記者 葉薇)2024上海世界移動通信大會(MWC上海)於6月26日至6月28日舉行。全球移動通信系統協會(GSMA)透露,中國是全球最大的5G市場,預計今年年底中國5G連接數將突破10億大關。此外,會議還透露,截至2024年5月底,中國累計建成5G基站總數達383.7萬個...
黑莓第一財季虧損4200萬美元小於預期,盈利之路漸顯曙光 - 天天要聞

黑莓第一財季虧損4200萬美元小於預期,盈利之路漸顯曙光

IT之家 6 月 27 日消息,黑莓公司周三公布了最新財季報告,但虧損金額小於預期,該公司正努力恢復調整後盈利能力。這家目前專註於物聯網和網絡安全領域的公司公布的財報顯示,第一財季凈虧損為 4200 萬美元(IT之家備註:當前約 3.06
血淚教訓:以後視頻號別發這種內容 - 天天要聞

血淚教訓:以後視頻號別發這種內容

關注盧鬆鬆,會經常給你分享一些我的經驗和觀點。確切的說沒被封,而是帳號被停止推薦。這是一個血淚教訓啊,正好利用這個機會,給大家分析一下原因,給各位做短視頻的通同學學習下,也能規避一下風險。
《機器人之夢》:如果我們不再重逢 - 天天要聞

《機器人之夢》:如果我們不再重逢

電影《機器人動畫》中的兩位主人公,小狗和機器人。資料圖很難解釋看完《機器人之夢》結局時那種要躲開旁人哭一會兒的情緒涌動。這部動畫作品沒有對白,但幾乎感覺不到語言的缺位,僅用神情和動作就傳達了豐富多變的情感。主人公是一隻生活在紐約的孤獨小狗,它購買了一隻陪伴機器人,它們很快過着形影不離的快樂生活,卻在...