技術文章:編譯器的寄存器分配

2022年07月04日18:36:25 科技 1923

因為存儲速度成本之間的問題,電腦的整個存儲系統按照CPU從近到遠可以分為4級:寄存器、cache緩存、主內存、硬盤。

離CPU最近的寄存器,讀寫速度最快

離CPU最遠的硬盤,讀寫速度最慢。

包括C語言在內的大多數語言,是不需要關注寄存器怎麼分配的。這部分的工作被編譯器處理了。

當然,彙編語言是需要手動分配寄存器的。

程序員在寫彙編時,會按照自己的直覺給出一個寄存器分配方案。

例如 5 / 3 = 1;彙編是這麼寫的:

mov 5, eax

xor edx, edx

mov 3, ecx

div ecx

這時,在eax里,餘數在edx里。英特爾的CPU就是這麼設計除法指令的。

除法使用固定的寄存器eax和edx,是CISC架構的缺點,讓寄存器的分配變得麻煩。

如果是int a = 5, b = 3, c = a / b;

那麼就要盡量給c分配寄存器eax,因為除法的商默認就在eax里,這樣可以提高生成的彙編碼的效率

如果是c = a % b,那麼就要盡量給c分配寄存器edx,因為餘數默認就在edx里。

因為寄存器只有16個,在程序規模較大的時候,是沒法這麼理想的分配寄存器的。

編譯器里,寄存器的分配是根據變量之間的活躍度來的:同時活躍變量不能使用同一個寄存器,否則數據就互相覆蓋了。

c = a / b這行代碼的被除數a和除數b肯定是同時活躍的,在除法指令運行的那一刻它們必須同時有效(而且互相覆蓋)。

c與a、b並不是同時活躍的,它是在除法運行之後開始活躍。

如果變量a在這行代碼之後不再使用,那麼c和a是可以共用eax的。

如果後續還要使用a,那麼就不能共用eax。例如:

int a = 5, b = 3;

int c = a / b;

c += a; // a在這裡還是活躍的,不能在第二行c = a / b時被覆蓋。

這時就只能給c分配eax,同時edx除法指令佔用,所以a和b只能使用ecx和ebx

以上代碼翻譯成彙編:

mov 5, ecx // a使用ecx

mov 3, ebx // b使用ebx

mov ebx, eax // 加載被除數的最低32位到eax

xor edx, edx // 被除數的高32位清零

div ebx // 真正的除法運算只是這一條

add ecx, eax // c += a

技術文章:編譯器的寄存器分配 - 天天要聞

上面2行代碼c = a / b, c += a的寄存器衝突圖,如上。

給這個圖的3個頂點a、b、c着色,被衝突線連接兩個頂點不能是同一個顏色,即不能分配同一個寄存器

因為CISC的除法使用edx,我們把它也作為一個約束條件添加到這個圖裡:變量a是不能使用它的,因為它會被除法運算的餘數覆蓋,而a在c += a這行代碼還要使用。

c可以使用它,但c作為除法運算的商應該優先分配eax,否則就還需要多1條mov eax, edx的彙編碼。

技術文章:編譯器的寄存器分配 - 天天要聞

64位寄存器的位元組分配

實際CPU的寄存器是個64位的寄存器組,它的最低8位AL、次低8位AH、最低16位AX、最低32位EAX、整個寄存器RAX的關係如圖。

al和rax是衝突的:

char buf[8] = {0};

char c = 'A';

char* p = buf;

*p += c;

如果指針p使用了rax,那麼char類型的變量c就不能再使用al,反之也一樣。

代碼 *p += c里,指針變量p和字符變量c是同時活躍的。

這種情況可以通過掩碼來判斷,可以用1個二進制表示寄存器的1個位元組

1,RAX是8位元組的寄存器,掩碼就是0xff。

2,al是1位元組的寄存器,掩碼就是0x1。

3,ah的掩碼是0x2,因為它使用的是第2個位元組。

4,ax的掩碼是0x3,2個位元組。

5,eax的掩碼是0xf,4個位元組。

如果掩碼的與運算不為0,就是互相衝突的寄存器,不能用於同一個變量。

當然不是同一個寄存器組的寄存器,肯定是不衝突的。

ah和al是不衝突的,因為0x2 & 0x1 == 0。

ah和ax是衝突的,因為0x2 & 0x3 != 0。

技術文章:編譯器的寄存器分配 - 天天要聞

科技分類資訊推薦

【芯片】Tensor G5曝光,Pixel10工程機現身海鮮市場 - 天天要聞

【芯片】Tensor G5曝光,Pixel10工程機現身海鮮市場

近日谷歌Pixel 10 Pro Fold出現在了GeekBench跑分數據庫中:新機搭載了谷歌全新的Tensor G5處理器,據悉這代終於是告別了三星工藝,轉而擁抱台積電N3E工藝。從顯示信息來看,Tensor G5採用了1+5+2的八核CPU架構,1*3.78GHz X4超大核+5*3.05GHz A725大核+2*2.25GHz A520小核構成。單核
【新機】2K屏+潛望長焦,iQOO 15曝光 - 天天要聞

【新機】2K屏+潛望長焦,iQOO 15曝光

說到iQOO的數字旗艦系列,這代iQOO13相機被刀還是挺可惜的,主要也是為了避免和老大哥X200產生衝突。今天@數碼閑聊站曝光了下代iQOO旗艦的信息:新機可能會跳過iQOO 14,直接命名為iQOO 15,這代將會有中杯/大杯兩個杯型。新機將會採用6.85英寸2K LIPO三星定製直面屏,屏幕邊框極窄,支持Pol-less去偏光技術,還具有AR抗眩...
清華專家破百年陳規!滬上論壇曝電力革新,陳磊構想太敢了 - 天天要聞

清華專家破百年陳規!滬上論壇曝電力革新,陳磊構想太敢了

聽說了嗎?清華大學的專家居然說要徹底打破電力系統運行了上百年的規矩!就在上海那場新能源論壇上,陳磊研究員拋出個重磅觀點 —— 以後用電不用再看頻率臉色,有功功率想咋調就咋調!這事兒要是真能成,咱們家裡的空調、電動車充電可就再也不會因為電網不
消費活力釋放,上海零售商業形態向「文商旅體展」融合演進 - 天天要聞

消費活力釋放,上海零售商業形態向「文商旅體展」融合演進

2025年二季度,在上海市政府經濟刺激方案推動下,上海商業市場消費活力逐步釋放,但零售物業租賃指標的復蘇態勢仍顯平緩。核心商圈平均租金為1877元/平方米/月,平均出租率為94.71%,整體表現與去年同期持平,其中徐家匯、陸家嘴等商圈憑藉成熟商業生態,表現相對突出。但與非核心商圈相比,從存量、新增供應、凈吸納量等指...
OPPO K13 Turbo 系列真機曝光,7 月 21 日發佈 - 天天要聞

OPPO K13 Turbo 系列真機曝光,7 月 21 日發佈

IT之家 7 月 11 日消息,博主 @i冰宇宙 今日分享了一款帶保密殼的新機真機圖,配備 RGB 燈效以及主動散熱風扇,預計為剛剛官宣的 OPPO K13 Turbo 系列。IT之家注意到,OPPO K13 Turbo 系列將於 7 月 21 日發佈,在 GeekBench 6.3.0 中單核成績為 2156 分,多核成績為 6652 分,預計搭載高通驍龍