C语言的原子操作

2019独角兽企业重金招聘Python工程师标准>>>

###gcc内建函数内建gcc在4.0.1版本后就通过其内建函数支持原子操作。在这之前编程真必须要通过参考各种cpu的指令操作手册&＃xff0c;用其汇编指令编写原子操作。而gcc通过内建函数屏蔽了这些差异。gcc支持如下原子操作&＃xff1a;

#if (GCC_VERSION >&＃61; 40100) /* 内存访问栅 */#define barrier() (__sync_synchronize()) /* 原子获取 */#define AO_GET(ptr) ({ __typeof__(*(ptr)) volatile *_val &＃61; (ptr); barrier(); (*_val); }) /*原子设置&＃xff0c;如果原值和新值不一样则设置*/#define AO_SET(ptr, value) ((void)__sync_lock_test_and_set((ptr), (value))) /* 原子交换&＃xff0c;如果被设置&＃xff0c;则返回旧值&＃xff0c;否则返回设置值 */#define AO_SWAP(ptr, value) ((__typeof__(*(ptr)))__sync_lock_test_and_set((ptr), (value))) /* 原子比较交换&＃xff0c;如果当前值等于旧值&＃xff0c;则新值被设置&＃xff0c;返回旧值&＃xff0c;否则返回新值*/#define AO_CAS(ptr, comp, value) ((__typeof__(*(ptr)))__sync_val_compare_and_swap((ptr), (comp), (value))) /* 原子比较交换&＃xff0c;如果当前值等于旧指&＃xff0c;则新值被设置&＃xff0c;返回真值&＃xff0c;否则返回假 */#define AO_CASB(ptr, comp, value) (__sync_bool_compare_and_swap((ptr), (comp), (value)) !&＃61; 0 ? true : false) /* 原子清零 */#define AO_CLEAR(ptr) ((void)__sync_lock_release((ptr))) /* 通过值与旧值进行算术与位操作&＃xff0c;返回新值 */#define AO_ADD_F(ptr, value) ((__typeof__(*(ptr)))__sync_add_and_fetch((ptr), (value)))#define AO_SUB_F(ptr, value) ((__typeof__(*(ptr)))__sync_sub_and_fetch((ptr), (value)))#define AO_OR_F(ptr, value) ((__typeof__(*(ptr)))__sync_or_and_fetch((ptr), (value)))#define AO_AND_F(ptr, value) ((__typeof__(*(ptr)))__sync_and_and_fetch((ptr), (value)))#define AO_XOR_F(ptr, value) ((__typeof__(*(ptr)))__sync_xor_and_fetch((ptr), (value))) /* 通过值与旧值进行算术与位操作&＃xff0c;返回旧值 */#define AO_F_ADD(ptr, value) ((__typeof__(*(ptr)))__sync_fetch_and_add((ptr), (value)))#define AO_F_SUB(ptr, value) ((__typeof__(*(ptr)))__sync_fetch_and_sub((ptr), (value)))#define AO_F_OR(ptr, value) ((__typeof__(*(ptr)))__sync_fetch_and_or((ptr), (value)))#define AO_F_AND(ptr, value) ((__typeof__(*(ptr)))__sync_fetch_and_and((ptr), (value)))#define AO_F_XOR(ptr, value) ((__typeof__(*(ptr)))__sync_fetch_and_xor((ptr), (value))) #else#error "can not supported atomic operation by gcc(v4.0.0&＃43;) buildin function." #endif /* if (GCC_VERSION >&＃61; 40100) */ /* 忽略返回值&＃xff0c;算术和位操作 */ #define AO_INC(ptr) ((void)AO_ADD_F((ptr), 1)) #define AO_DEC(ptr) ((void)AO_SUB_F((ptr), 1)) #define AO_ADD(ptr, val) ((void)AO_ADD_F((ptr), (val))) #define AO_SUB(ptr, val) ((void)AO_SUB_F((ptr), (val))) #define AO_OR(ptr, val) ((void)AO_OR_F((ptr), (val))) #define AO_AND(ptr, val) ((void)AO_AND_F((ptr), (val))) #define AO_XOR(ptr, val) ((void)AO_XOR_F((ptr), (val))) /* 通过掩码&＃xff0c;设置某个位为1&＃xff0c;并返还新的值 */ #define AO_BIT_ON(ptr, mask) AO_OR_F((ptr), (mask)) /* 通过掩码&＃xff0c;设置某个位为0&＃xff0c;并返还新的值 */ #define AO_BIT_OFF(ptr, mask) AO_AND_F((ptr), ~(mask)) /* 通过掩码&＃xff0c;交换某个位&＃xff0c;1变0&＃xff0c;0变1&＃xff0c;并返还新的值 */ #define AO_BIT_XCHG(ptr, mask) AO_XOR_F((ptr), (mask))

###普通汇编指令以加法指令操作实现 x &＃61; x &＃43; n为例 &＃xff0c;gcc编译出来的汇编形式上如下&＃xff1a;

... movl 0xc(%ebp), %eax addl $n, %eax movl %eax, 0xc(%ebp) ...

可以看出&＃xff0c;实现这条c语句&＃xff0c;需要先将x所在内存0xc(%ebp)中的值装载到寄存器&＃xff05;eax中&＃xff0c;然后用addl指令进行与一个立即数$n进行加操作&＃xff0c;之后再寄存器中的结果装载回原内存中。如果在时序上又另一个线程也操作该内存中的值&＃xff0c;且在指令addl $n, %eax完成之后&＃xff0c;时间片切换到了另一个线程中&＃xff0c;该线程进行了该内存的修改操作&＃xff0c;而且还会在后续的操作中使用&＃xff0c;这个时候发生又发生时间片切换&＃xff0c;切回到原线程中&＃xff0c;进行movl %eax, 0xc(%ebp)指令覆盖了前一个线程修改内容&＃xff0c;如果在这时再切换到另一个线程中&＃xff0c;该线程就会使用到一个错误的值进行后续的操作。 ###gcc原子汇编指令仍然以加法指令操作实现 x &＃61; x &＃43; n为例 &＃xff0c;gcc编译出来的原子汇编形式上如下&＃xff1a;

... mov $0x1,%eax lock xadd %eax,-0x4(%rbp) mov %eax,-0x4(%rbp) ...

gcc的原子操作是内建函数通过汇编实现的&＃xff0c;统一命名以__sync_xxx()起头&＃xff0c;原子操作做了什么事情呢&＃xff1f;原子操作的原理都是通过汇编指令lock在各种xadd、cmpxchg或xchg指令前进行锁定操作内存的总线&＃xff0c;并将上述的普通3条指令的操作合并为一条操作&＃xff0c;因为内存与cpu都是通过总线进行数据交换&＃xff0c;所以即使其它cpu核也同时&＃xff08;真正意义上的多线程&＃xff0c;而不是单核上的时间片切换&＃xff09;要对该内存的存取&＃xff0c;也要等待。&＃xff08;因为我不是低层开发人员&＃xff0c;所以具体时序和动作我不是太了解&＃xff0c;只能以应用层的锁动作理解这里的总线锁&＃xff0c;如果你了解&＃xff0c;请更正&＃xff09;&＃xff0c;而被锁总线的单核应该不会进行时间片切换&＃xff0c;直到该指令完成。 ###优化带来语句倒置除了多线程操作同一个内存时会发生数据的一致性错误&＃xff0c;因为编译器的优化问题也会造成数据一致性问题。如果你的原意要进行如下的操作&＃xff1a;

int a &＃61; 0; int b &＃61; 0; void A() {a &＃61; 1; b &＃61; 2; } void B() {if (b > 0)printf("a :%d\n", a); }

那么经过编译器的优化&＃xff0c;A()中的两条复制语句可能被调换顺序&＃xff0c;如果两个线程分别同时执行A()和B()&＃xff0c;那么因为这个原因&＃xff0c;B()可能输出1&＃xff0c;也可能输出0&＃xff1b;解决方法是让a &＃61; 1一定在b &＃61; 2执行&＃xff0c;那么在两者之间插入内存栅栏__sync_synchronize()可以保证先后次序。&＃xff08;因为我对这样的优化发生情况不是很明了&＃xff0c;故这里不能详细的描述这样的优化对同线程产生的影响&＃xff09; ###volatile关键字与原子原子操作的内存&＃xff0c;要保证其内容已定是存取最新的&＃xff0c;而不是cache中的数据&＃xff0c;所以要用volatile关键字表明&＃xff0c;这样每次存取cpu直接存取内存&＃xff0c;而非cache中的数据&＃xff0c;我们定义一个原子类型&＃xff1a;

#ifndef AO_T typedef volatile long AO_T; #endif

##原子操作与普通C语句的等效操作

这里用上面定义的宏说明原子操作&＃xff0c;等效的C语言非原子的操作为了保证一致性&＃xff0c;我们使用lock()和 unlock这个伪语句表示锁的加锁和解锁。当然原子操作要比应用层加锁快了太多太多。

内存栅栏使用

int a &＃61; 0; barrier(); int b &＃61; 2;

保证a的复制在b的复制前执行

原子获取

int a &＃61; 5; int b &＃61; AO_GET(&a); //b&＃61;&＃61;5;

int a &＃61; 5; lock(); int b &＃61; a; unlock();

保证读取a的值是内存中的值&＃xff0c;而不是寄存器或cache中的值 ###原子设置

int a &＃61; 0; AO_SET(&a, 10); //a&＃61;&＃61;10;

int a &＃61; 0; lock(); a &＃61; 10; unlock();

###原子交换

int a &＃61; 10; AO_SWAP(&a, 9);

int a &＃61; 10; lock(); if (a !&＃61; 9)a &＃61; 9; unlock();

###原子比较交换

int a &＃61; 10; int b &＃61; AO_CAS(&a, 10, 9); //b&＃61;&＃61;10, a&＃61;&＃61;9; int c &＃61; AO_CAS(&a, 9, 8); //c&＃61;&＃61;8, a&＃61;&＃61;10;

int a &＃61; 10; int b &＃61; 0; int c &＃61; 0; lock(); if (a &＃61;&＃61; 10) {b &＃61; a;a &＃61; 9; } else {b &＃61; 10; } unlock(); lock(); if (a &＃61;&＃61; 9) {b &＃61; a;a &＃61; 8; } else {b &＃61; 9; } unlock();

AO_CASB()的逻辑与AO_CAS()一致&＃xff0c;只是返还一个真假值判断是否发生了交换&＃xff0c;就不再赘诉了。 ###原子清零

int a &＃61; 10; AO_CLEAR(&a); //a&＃61;&＃61;0;

int a &＃61; 10; lock(); a &＃61; 0; unlock();

###先操作后使用的加减运算和逻辑运算

先加一个数&＃xff0c;再使用和值 AO_xxx_F()中的F表示fetch提取的意思

int a &＃61; 1; int b &＃61; AO_ADD_F(&a, 10);//a&＃61;&＃61;11, b&＃61;&＃61;11

int a &＃61; 1; int b &＃61; 0; lock(); a &＃43;&＃61; 10; b &＃61; a; unlock();

其它的运算&＃xff08;减&＃xff0c;或&＃xff0c;与&＃xff0c;异或&＃xff09;与加法操作逻辑一样&＃xff0c;就不再赘诉了 ###先使用后操作的加减运算与逻辑运算
使用原值&＃xff0c;后加上一个数

int a &＃61; 1; int b &＃61; AO_F_ADD(&a, 10);//a&＃61;&＃61;11, b&＃61;&＃61;1

int a &＃61; 1; int b &＃61; 0; lock(); b &＃61; a; a &＃43;&＃61; 10; unlock();

##何时使用原子操作最合适

原子操作最合适用来管理状态&＃xff0c;而且最好是程序发现状态不符合自己要求是&＃xff0c;可以忽略这个错误&＃xff0c;继续运行&＃xff0c;或稍后在此尝试。比如我们使用一个local static变量存储当前系统有多少个cpu核&＃xff0c;以备给出一些策略&＃xff0c;比如以后我们要实现的自旋锁中的休眠。代码如下&＃xff1a;

long GetCPUCores() {static long g_CPUCores &＃61; 0;long gcpus &＃61; -1;/*原子获取&＃xff0c;如果没有设置过&＃xff0c;则继续&＃xff0c;否则返回这个值*/if (likely((gcpus &＃61; AO_GET(&g_CPUCores)) !&＃61; -1)) {return gcpus;}gcpus &＃61; sysconf(_SC_NPROCESSORS_CONF);if (unlikely(gcpus <0)) {printf("Get number of CPU failure : %s", strerror(errno));abort();}/*原子设置*/AO_SET(&g_CPUCores, gcpus);return gcpus; }

如果有多个线程同时调用&＃xff0c;或单个线程多次调用&＃xff0c;我们都可以保证g_CPUCores中数据的有效性&＃xff0c;不会出现获取到一个大于0到假值导致后续的逻辑错误。而且这样的设计&＃xff0c;还可以提高效率&＃xff0c;如果获取的系统参数是一个像

#ifdef __APPLE__gtid &＃61; syscall(SYS_thread_selfid); #elsegtid &＃61; syscall(SYS_gettid); #endif

的真正的系统调用&＃xff0c;那么在结果固定的情况下&＃xff0c;代价是昂贵的&＃xff0c;因为程序必须要发起中断服务&＃xff0c;切换到内核空间调用代码为SYS_thread_selfid或SYS_gettid的中段服务&＃xff0c;从而得到线程ID&＃xff08;线程是一个轻量级的进程&＃xff0c;只不过它的堆空间与其它线程共享&＃xff0c;而不是进程那样是彼此独立的&＃xff0c;我以后会在此细谈这个ID值的运用&＃xff09;。

##使用原子操作

改进上一篇文章中提及的结构魔数操作

上一节我们说过&＃xff0c;使用带魔数字段结构的函数通过判断、修改魔数做出相应的操作&＃xff0c;试想如果两个线程同时操作魔数字段&＃xff0c;肯定会带来冲突&＃xff0c;所以我们将其对应的非原子操作&＃xff0c;改为原子操作&＃xff0c;代码如下&＃xff1a;

/** 魔数* 结构体中设置一个magic的成员变量&＃xff0c;已检查结构体是否被正确初始化*/ #if !defined(OBJMAGIC)#define OBJMAGIC (0xfedcba98) #endif/*原子的设置魔数*/ #undef REFOBJ #define REFOBJ(obj) \({ \int _old &＃61; 0; \bool _ret &＃61; false; \if (likely((obj))) { \_old &＃61; AO_SWAP(&(obj)->magic, OBJMAGIC); \} \_ret &＃61; (_old &＃61;&＃61; OBJMAGIC ? false : true); \_ret; \})/*原子的重置魔数*/ #undef UNREFOBJ #define UNREFOBJ(obj) \({ \bool _ret &＃61; false; \if (likely((obj))) { \_ret &＃61; AO_CASB(&(obj)->magic, OBJMAGIC, 0); \} \_ret; \})/*原子的验证魔数*/ #undef ISOBJ #define ISOBJ(obj) ((obj) && AO_GET(&(obj)->magic) &＃61;&＃61; OBJMAGIC)/*断言魔数*/ #undef ASSERTOBJ #define ASSERTOBJ(obj) (assert(ISOBJ((obj))))

其实这样的运用也不能100&＃xff05;的保证多线程下数据的一致性&＃xff0c;比如两个线程&＃xff21;和&＃xff22;&＃xff0c;同时在操作一个结构体&＃xff34;&＃xff1a; ###原子操作