gcc 原子操作 compare and swap系列
其聲明如下:
type __sync_fetch_and_add (type *ptr, type value, ...)
type __sync_fetch_and_sub (type *ptr, type value, ...)
type __sync_fetch_and_or (type *ptr, type value, ...)
type __sync_fetch_and_and (type *ptr, type value, ...)
type __sync_fetch_and_xor (type *ptr, type value, ...)
type __sync_fetch_and_nand (type *ptr, type value, ...)
type __sync_add_and_fetch (type *ptr, type value, ...)
type __sync_sub_and_fetch (type *ptr, type value, ...)
type __sync_or_and_fetch (type *ptr, type value, ...)
type __sync_and_and_fetch (type *ptr, type value, ...)
type __sync_xor_and_fetch (type *ptr, type value, ...)
type __sync_nand_and_fetch (type *ptr, type value, ...)
這兩組函數(shù)的區(qū)別在于第一組返回更新前的值,第二組返回更新后的值。
type可以是1,2,4或8字節(jié)長度的int類型,即:
int8_t / uint8_t
int16_t / uint16_t
int32_t / uint32_t
int64_t / uint64_t
后面的可擴(kuò)展參數(shù)(...)用來指出哪些變量需要memory barrier,因?yàn)槟壳癵cc實(shí)現(xiàn)的是full barrier(類似于linux kernel 中的mb(),表示這個(gè)操作之前的所有內(nèi)存操作不會(huì)被重排序到這個(gè)操作之后),所以可以略掉這個(gè)參數(shù)。
bool __sync_bool_compare_and_swap (type *ptr, type oldval type newval, ...)
type __sync_val_compare_and_swap (type *ptr, type oldval type newval, ...)
這兩個(gè)函數(shù)提供原子的比較和交換,如果*ptr == oldval,就將newval寫入*ptr,
第一個(gè)函數(shù)在相等并寫入的情況下返回true.
第二個(gè)函數(shù)在返回操作之前的值。
__sync_synchronize (...)
發(fā)出一個(gè)full barrier.
關(guān)于memory barrier,cpu會(huì)對(duì)我們的指令進(jìn)行排序,一般說來會(huì)提高程序的效率,但有時(shí)候可能造成我們不希望得到的結(jié)果,舉一個(gè)例子,比如我們有一個(gè)硬件設(shè)備,它有4個(gè)寄存器,當(dāng)你發(fā)出一個(gè)操作指令的時(shí)候,一個(gè)寄存器存的是你的操作指令(比如READ),兩個(gè)寄存器存的是參數(shù)(比如是地址和size),最后一個(gè)寄存器是控制寄存器,在所有的參數(shù)都設(shè)置好之后向其發(fā)出指令,設(shè)備開始讀取參數(shù),執(zhí)行命令,程序可能如下:
? ? write1(dev.register_size,size);
? ? write1(dev.register_addr,addr);
? ? write1(dev.register_cmd,READ);
? ? write1(dev.register_control,GO);
如果最后一條write1被換到了前幾條語句之前,那么肯定不是我們所期望的,這時(shí)候我們可以在最后一條語句之前加入一個(gè)memory barrier,強(qiáng)制cpu執(zhí)行完前面的寫入以后再執(zhí)行最后一條:
? ? write1(dev.register_size,size);
? ? write1(dev.register_addr,addr);
? ? write1(dev.register_cmd,READ);
? ? __sync_synchronize();
? ? write1(dev.register_control,GO);
memory barrier有幾種類型:
? ? acquire barrier : 不允許將barrier之后的內(nèi)存讀取指令移到barrier之前(linux kernel中的wmb())。
? ? release barrier : 不允許將barrier之前的內(nèi)存讀取指令移到barrier之后 (linux kernel中的rmb())。
? ? full barrier ? ?: 以上兩種barrier的合集(linux kernel中的mb())。
還有兩個(gè)函數(shù):
type __sync_lock_test_and_set (type *ptr, type value, ...)
? ?將*ptr設(shè)為value并返回*ptr操作之前的值。
void __sync_lock_release (type *ptr, ...)
? ? ?將*ptr置0
示例程序:
#include
#include
#include
static int count = 0;
void *test_func(void *arg)
{
int i=0;
for(i=0; i < 20000; i++) {
__sync_fetch_and_add(&count,1);
//count++;
}
return NULL;
}
int main(int argc, const char *argv[])
{
pthread_t id[20];
int i = 0;
for(i=0; i < 20; i++) {
pthread_create(&id[i],NULL,test_func,NULL);
}
for(i=0; i<20; ++i) {
pthread_join(id[i],NULL);
}
printf("%dn",count);
return 0;
}
1. http://refspecs.freestandards.org/elf/IA64-SysV-psABI.pdf ? section 7.42. http://gcc.gnu.org/onlinedocs/gcc-4.1.2/gcc/Atomic-Builtins.html#Atomic-Builtins