当前位置: 开发笔记 > 小程序 > 正文

为什么我的“=r”（var）输出没有选择与“a”（var）输入相同的寄存器？

作者：蛋狗酱_972 | 来源：互联网 | 2022-10-12 13:48

如何解决《为什么我的“=r”（var）输出没有选择与“a”（var）输入相同的寄存器？》经验，为你挑选了1个好方法。

我正在学习如何__asm__ volatile在GCC中使用，并提出了一个问题。我想实现一个执行原子比较和交换并返回先前存储在目标中的值的函数。

为什么"=a"(expected)输出约束起作用，但是"=r"(expected)约束使编译器生成不起作用的代码？

情况1。

#include 
#include 
#include 

uint64_t atomic_cas(uint64_t * destination, uint64_t expected, uint64_t value){
    __asm__ volatile (
        "lock cmpxchgq %3, %1":
        "=a" (expected) :
        "m" (*destination), "a" (expected), "r" (value) :
        "memory"
    );

    return expected;
}

int main(void){
    uint64_t v1 = 10;
    uint64_t result = atomic_cas(&v1, 10, 5);
    printf("%" PRIu64 "\n", result);           //prints 10, the value before, OK
    printf("%" PRIu64 "\n", v1);               //prints 5, the new value, OK
}

它按预期工作。现在考虑以下情况：

情况2

#include 
#include 
#include 

uint64_t atomic_cas(uint64_t * destination, uint64_t expected, uint64_t value){
    __asm__ volatile (
        "lock cmpxchgq %3, %1":
        "=r" (expected) ://<----- I changed a with r and expected GCC understood it from the inputs 
        "m" (*destination), "a" (expected), "r" (value) :
        "memory"
    );

    return expected;
}

int main(void){
    uint64_t v1 = 10;
    uint64_t result = atomic_cas(&v1, 10, 5);
    printf("%" PRIu64 "\n", result);            //prints 5, wrong
    printf("%" PRIu64 "\n", v1);                //prints 5, the new value, OK 
}

我检查了生成的程序集并注意到以下内容：

I.在两种情况下，功能代码都是相同的，看起来像

   0x0000555555554760 <+0>:     mov    rax,rsi
   0x0000555555554763 <+3>:     lock cmpxchg QWORD PTR [rdi],rdx
   0x0000555555554768 <+8>:     ret

二。GCC内联时出现了问题，atomic_cas因此在以后的情况下，正确的值没有传递给printf函数。这是有关的片段disas main：

0x00000000000005f6 <+38>:    lock cmpxchg QWORD PTR [rsp],rdx
0x00000000000005fc <+44>:    lea    rsi,[rip+0x1f1]        # 0x7f4
0x0000000000000603 <+51>:    mov    rdx,rax ;  <-----This instruction is absent in the Case 2.
0x0000000000000606 <+54>:    mov    edi,0x1
0x000000000000060b <+59>:    xor    eax,eax

问：为什么会出现替代rax（a用任意寄存器（） r）产生错误的结果？我希望这在两种情况下都能奏效？

UPD。我用以下标志编译-Wl,-z,lazy -Warray-bounds -Wextra -Wall -g3 -O3

1> interjay..：

该cmpxchg指令总是把结果在rax寄存器中。因此，您需要使用a约束条件来告知GCC从该寄存器中移出。在情况2中，您通过使用告诉GCC使用任意寄存器，而不是r在该寄存器中放置任何内容。

如果要使用r，则必须添加一条mov指令以将结果从rax移至该寄存器（movq %%rax, %0）。您还必须告诉GCC指令更改了rax寄存器，例如，将其添加到asm语句的“ clobbers”部分。对于您的情况，没有理由以这种方式使事情复杂化。

推荐阅读

mpx
Windows 10 系统资源需求详解

本文详细介绍了安装和运行 Windows 10 所需的最低硬件配置，包括处理器、内存、硬盘空间、显卡等具体要求。 ... [详细]

蜡笔小新 2024-12-13 10:13:24
mpx
深入解析Bagging与Boosting算法原理及应用

本文通过详细分析Bagging与Boosting两种集成学习技术的基本概念、工作原理及其在实际项目中的应用案例，帮助读者深入了解这两种强大的机器学习方法。同时，提供相关资源链接以供进一步学习。 ... [详细]

蜡笔小新 2024-12-06 10:47:27
mpx
caffe win 还是 linux,caffe的windows版本安装，超级简单

该楼层疑似违规已被系统折叠隐藏此楼查看此楼错误72error:ErroropeningoutputfileC:Users林鑫辰AppDataLocalTemptmpxft_0000 ... [详细]

蜡笔小新 2023-10-13 13:35:00
mpx
【ORA】ORA01033，ORA09968，ORA01102

[oracle@oracle~]$impxxxx/userfile=/usr/local/src/666.dmpfull=ybuffer=40960000Import: ... [详细]

蜡笔小新 2023-10-13 13:03:01
mpx
PostgresX2 MPP部署试验

2019独角兽企业重金招聘Python工程师标准MPP结构：129GTM节点，130coordinator、gtm_proxy、datanode& ... [详细]

蜡笔小新 2023-10-12 18:49:46
mpx
DeaDBeeF(音频播放器)v1.8.0官方PC版

DeaDBeeF音频播放器是一款来自国外的强大音乐播放软件，使用这款完全中文的DeaDBeeF音频播放器可以让你随时编辑本地的音乐文件标签和属性，根据不同的音乐文件配置不同的音色输出 ... [详细]

蜡笔小新 2023-10-12 10:21:48
mpx
Matlab：数学之美绘制分形图形

Matlab：数学之美–绘制分形图形学习最好的动力是兴趣，所以我们先看看效果：这一篇与Java学习日记：数学之美-分形图形绘制有共同之处，只是所用的工具不同。clear;%不同的参 ... [详细]

蜡笔小新 2023-10-11 15:36:53
mpx
第六周周赛题解

A题这题贼水，直接暴力就可以了。用个bool数组记录一下，如果某一天，当前剩下的最大的出现了的话，就输出一段。1#include<stdio.h>2intn;3boolvi ... [详细]

蜡笔小新 2023-10-11 15:01:52
mpx
python与开源gis电子书_python 与开源Gis 书本知识点测试

#-*-coding:utf-8-*-print(upython与开源QGis课题研究组)#print(汉字)##创建矢量数据文件#try:fromosgeoimporto ... [详细]

蜡笔小新 2023-10-11 07:51:54
mpx
一个全面获取Intel CPUID的代码

主函数：CStringGetCPUIDString()Copyright(C)shangweixiao2011 ... [详细]

蜡笔小新 2023-10-10 21:37:36
mpx
java SE1.6中的Synchronized原理

1引言在多线程并发编程中Synchronized一直是元老级角色，很多人都会称呼它为重量级锁，但是随着JavaSE1.6对Synchronized进行 ... [详细]

蜡笔小新 2023-09-25 10:24:49
mpx
dump备份不影响数据库正常运行,mysqldump数据库备份

本文目录一览：1、\mysybase.dump对数据库正常使用有影响吗 ... [详细]

蜡笔小新 2023-09-25 08:09:01
mpx
html显示屏幕中心1,HTML中常见的长度单位

8种机械键盘轴体对比本人程序员，要买一个写代码的键盘，请问红轴和茶轴怎么选？THML中常见的8种长度1、常见的单位px：像素 ... [详细]

蜡笔小新 2023-09-24 09:43:18
mpx
xmake0

xmake-ftmpxxx.luaxmake--filexxx.lua最简单:--添加名为demo的目标到工程target(demo)--设置目标程序类型为二进制,一般为 ... [详细]

蜡笔小新 2023-09-24 08:32:23
mpx
linux dump备份

我是这么写的， ... [详细]

蜡笔小新 2023-09-24 04:47:29

蛋狗酱_972

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章