技术文章:编译器的寄存器分配

2022年07月04日18:36:25 科技 1923

因为存储速度成本之间的问题,电脑的整个存储系统按照CPU从近到远可以分为4级:寄存器、cache缓存、主内存、硬盘。

离CPU最近的寄存器,读写速度最快

离CPU最远的硬盘,读写速度最慢。

包括C语言在内的大多数语言,是不需要关注寄存器怎么分配的。这部分的工作被编译器处理了。

当然,汇编语言是需要手动分配寄存器的。

程序员在写汇编时,会按照自己的直觉给出一个寄存器分配方案。

例如 5 / 3 = 1;汇编是这么写的:

mov 5, eax

xor edx, edx

mov 3, ecx

div ecx

这时,在eax里,余数在edx里。英特尔的CPU就是这么设计除法指令的。

除法使用固定的寄存器eax和edx,是CISC架构的缺点,让寄存器的分配变得麻烦。

如果是int a = 5, b = 3, c = a / b;

那么就要尽量给c分配寄存器eax,因为除法的商默认就在eax里,这样可以提高生成的汇编码的效率

如果是c = a % b,那么就要尽量给c分配寄存器edx,因为余数默认就在edx里。

因为寄存器只有16个,在程序规模较大的时候,是没法这么理想的分配寄存器的。

编译器里,寄存器的分配是根据变量之间的活跃度来的:同时活跃变量不能使用同一个寄存器,否则数据就互相覆盖了。

c = a / b这行代码的被除数a和除数b肯定是同时活跃的,在除法指令运行的那一刻它们必须同时有效(而且互相覆盖)。

c与a、b并不是同时活跃的,它是在除法运行之后开始活跃。

如果变量a在这行代码之后不再使用,那么c和a是可以共用eax的。

如果后续还要使用a,那么就不能共用eax。例如:

int a = 5, b = 3;

int c = a / b;

c += a; // a在这里还是活跃的,不能在第二行c = a / b时被覆盖。

这时就只能给c分配eax,同时edx除法指令占用,所以a和b只能使用ecx和ebx

以上代码翻译成汇编:

mov 5, ecx // a使用ecx

mov 3, ebx // b使用ebx

mov ebx, eax // 加载被除数的最低32位到eax

xor edx, edx // 被除数的高32位清零

div ebx // 真正的除法运算只是这一条

add ecx, eax // c += a

技术文章:编译器的寄存器分配 - 天天要闻

上面2行代码c = a / b, c += a的寄存器冲突图,如上。

给这个图的3个顶点a、b、c着色,被冲突线连接两个顶点不能是同一个颜色,即不能分配同一个寄存器

因为CISC的除法使用edx,我们把它也作为一个约束条件添加到这个图里:变量a是不能使用它的,因为它会被除法运算的余数覆盖,而a在c += a这行代码还要使用。

c可以使用它,但c作为除法运算的商应该优先分配eax,否则就还需要多1条mov eax, edx的汇编码。

技术文章:编译器的寄存器分配 - 天天要闻

64位寄存器的字节分配

实际CPU的寄存器是个64位的寄存器组,它的最低8位AL、次低8位AH、最低16位AX、最低32位EAX、整个寄存器RAX的关系如图。

al和rax是冲突的:

char buf[8] = {0};

char c = 'A';

char* p = buf;

*p += c;

如果指针p使用了rax,那么char类型的变量c就不能再使用al,反之也一样。

代码 *p += c里,指针变量p和字符变量c是同时活跃的。

这种情况可以通过掩码来判断,可以用1个二进制表示寄存器的1个字节

1,RAX是8字节的寄存器,掩码就是0xff。

2,al是1字节的寄存器,掩码就是0x1。

3,ah的掩码是0x2,因为它使用的是第2个字节。

4,ax的掩码是0x3,2个字节。

5,eax的掩码是0xf,4个字节。

如果掩码的与运算不为0,就是互相冲突的寄存器,不能用于同一个变量。

当然不是同一个寄存器组的寄存器,肯定是不冲突的。

ah和al是不冲突的,因为0x2 & 0x1 == 0。

ah和ax是冲突的,因为0x2 & 0x3 != 0。

技术文章:编译器的寄存器分配 - 天天要闻

科技分类资讯推荐

【芯片】Tensor G5曝光,Pixel10工程机现身海鲜市场 - 天天要闻

【芯片】Tensor G5曝光,Pixel10工程机现身海鲜市场

近日谷歌Pixel 10 Pro Fold出现在了GeekBench跑分数据库中:新机搭载了谷歌全新的Tensor G5处理器,据悉这代终于是告别了三星工艺,转而拥抱台积电N3E工艺。从显示信息来看,Tensor G5采用了1+5+2的八核CPU架构,1*3.78GHz X4超大核+5*3.05GHz A725大核+2*2.25GHz A520小核构成。单核
【新机】2K屏+潜望长焦,iQOO 15曝光 - 天天要闻

【新机】2K屏+潜望长焦,iQOO 15曝光

说到iQOO的数字旗舰系列,这代iQOO13相机被刀还是挺可惜的,主要也是为了避免和老大哥X200产生冲突。今天@数码闲聊站曝光了下代iQOO旗舰的信息:新机可能会跳过iQOO 14,直接命名为iQOO 15,这代将会有中杯/大杯两个杯型。新机将会采用6.85英寸2K LIPO三星定制直面屏,屏幕边框极窄,支持Pol-less去偏光技术,还具有AR抗眩...
清华专家破百年陈规!沪上论坛曝电力革新,陈磊构想太敢了 - 天天要闻

清华专家破百年陈规!沪上论坛曝电力革新,陈磊构想太敢了

听说了吗?清华大学的专家居然说要彻底打破电力系统运行了上百年的规矩!就在上海那场新能源论坛上,陈磊研究员抛出个重磅观点 —— 以后用电不用再看频率脸色,有功功率想咋调就咋调!这事儿要是真能成,咱们家里的空调、电动车充电可就再也不会因为电网不
消费活力释放,上海零售商业形态向“文商旅体展”融合演进 - 天天要闻

消费活力释放,上海零售商业形态向“文商旅体展”融合演进

2025年二季度,在上海市政府经济刺激方案推动下,上海商业市场消费活力逐步释放,但零售物业租赁指标的复苏态势仍显平缓。核心商圈平均租金为1877元/平方米/月,平均出租率为94.71%,整体表现与去年同期持平,其中徐家汇、陆家嘴等商圈凭借成熟商业生态,表现相对突出。但与非核心商圈相比,从存量、新增供应、净吸纳量等指...
OPPO K13 Turbo 系列真机曝光,7 月 21 日发布 - 天天要闻

OPPO K13 Turbo 系列真机曝光,7 月 21 日发布

IT之家 7 月 11 日消息,博主 @i冰宇宙 今日分享了一款带保密壳的新机真机图,配备 RGB 灯效以及主动散热风扇,预计为刚刚官宣的 OPPO K13 Turbo 系列。IT之家注意到,OPPO K13 Turbo 系列将于 7 月 21 日发布,在 GeekBench 6.3.0 中单核成绩为 2156 分,多核成绩为 6652 分,预计搭载高通骁龙