Linux培训
达内IT学院
400-996-5531
编译器有时为优化性能,会将一些变量的值缓存到寄存器中。因此,如果编译器发现该变量的值没有改变,将从寄存器里读出该值,这样可以避免内存访问。
如果该变量确实被修改了呢?那岂不是读到错的值了吗?
是的。在多线程情况下,问题更为突出:
当某个线程对一个内存单元进行修改后,其他线程如果从寄存器里读取该变量可能读到老值,未更新的值,错误的值,不新鲜的值。
如何防止这样错误的“优化”?方法就是给变量加上volatile修饰。
volatile int i=10;//用volatile修饰变量i......//something happened int b = i;//强制从内存中读取实时的i的值
OK,毕竟volatile不是完美的,它也在某种程度上限制了优化。
有时候是不是有这样的需求:我要你立即实时读取数据的时候,你就访问内存,别优化;否则,你该优化还是优化。能做到吗?
不加volatile修饰,那么就做不到前面一点。加了volatile,后面这一方面就无从谈起,怎么办?
其实我们可以这样:
int i = 2; //变量i还是不用加volatile修饰#define ACCESS_ONCE(x) (* (volatile typeof(x) *) &(x))
需要实时读取i的值时候,就调用ACCESS_ONCE(i),否则直接使用i即可。
听起来很好,然而险象环生:
volatile常被误用,很多人往往不知道或者忽略它的两个特点:
在C/C++语言里,volatile不保证原子性;
使用volatile不应该对它有任何Memory Barrier的期待。
第一点比较好理解,对于第二点,我们来看一个很经典的例子:
volatile int is_ready = 0;char message[123];void thread_A { while(is_ready == 0) { } //use message;}void thread_B { strcpy(message,"everything seems ok"); is_ready = 1; }
线程B中,虽然is_ready有volatile修饰,但是这里的volatile不提供任何Memory Barrier,因此12行和13行可能被乱序执行,is_ready = 1被执行,而message还未被正确设置,导致线程A读到错误的值。
这意味着,在多线程中使用volatile需要非常谨慎、小心。
__thread
__thread是gcc内置的用于多线程编程的基础设施。用__thread修饰的变量,每个线程都拥有一份实体,相互独立,互不干扰。举个例子:
#include<iostream> #include<pthread.h> #include<unistd.h> using namespace std; __thread int i = 1;void* thread1(void* arg);void* thread2(void* arg);int main(){ pthread_t pthread1; pthread_t pthread2; pthread_create(&pthread1, NULL, thread1, NULL); pthread_create(&pthread2, NULL, thread2, NULL); pthread_join(pthread1, NULL); pthread_join(pthread2, NULL); return 0; }void* thread1(void* arg){ cout<<++i<<endl;//输出 2 return NULL; }void* thread2(void* arg){ sleep(1); //等待thread1完成更新 cout<<++i<<endl;//输出 2,而不是3 return NULL; }
需要注意的是:
1. __thread可以修饰全局变量、函数的静态变量,但是无法修饰函数的局部变量。
2. 被__thread修饰的变量只能在编译期初始化,且只能通过常量表达式来初始化。
Memory Barrier
为了优化,现代编译器和CPU可能会乱序执行指令。例如:
int a = 1;int b = 2;a = b + 3;b = 10;
CPU乱序执行后,第4行语句和第5行语句的执行顺序可能变为先b=10然后再a=b+3
有些人可能会说,那结果不就不对了吗?b为10,a为13?可是正确结果应该是a为5啊。
这里说的是语句的执行,对应的汇编指令不是简单的mov b,10和mov b,a+3。
生成的汇编代码可能是:
movl b(%rip), %eax ; 将b的值暂存入%eax movl $10, b(%rip) ; b = 10addl $3, %eax ; %eax加3movl %eax, a(%rip) ; 将%eax也就是b+3的值写入a,即 a = b + 3
这并不奇怪,为了优化性能,有时候确实可以这么做。但是在多线程并行编程中,有时候乱序就会出问题。
一个最典型的例子是用锁保护临界区。如果临界区的代码被拉到加锁前或者释放锁之后执行,那么将导致不明确的结果。
还有,比如随意将读数据和写数据乱序,那么本来是先读后写,变成先写后读就导致后面读到了脏的数据。
因此,Memory Barrier就是用来防止乱序执行的。具体说来,Memory Barrier包括三种:
1. acquire barrier。acquire barrier之后的指令不能被拉到该acquire barrier之前执行。
2. release barrier。release barrier之前的指令不能被拉到该release barrier之后执行。
3. full barrier。以上两种的合集。
所以,很容易知道,加锁,也就是lock对应acquire barrier;释放锁,也就是unlock对应release barrier。哦,那么full barrier呢?
__sync_synchronize
__sync_synchronize就是一种full barrier。
填写下面表单即可预约申请免费试听! 怕学不会?助教全程陪读,随时解惑!担心就业?一地学习,可全国推荐就业!
Copyright © 京ICP备08000853号-56 京公网安备 11010802029508号 达内时代科技集团有限公司 版权所有
Tedu.cn All Rights Reserved