Linux培训

Linux环境多线程编程基础设施

发布：Linux培训
来源：Linux教程
时间：2016-08-10 14:23

编译器有时为优化性能，会将一些变量的值缓存到寄存器中。因此，如果编译器发现该变量的值没有改变，将从寄存器里读出该值，这样可以避免内存访问。

如果该变量确实被修改了呢?那岂不是读到错的值了吗?

是的。在多线程情况下，问题更为突出：

当某个线程对一个内存单元进行修改后，其他线程如果从寄存器里读取该变量可能读到老值，未更新的值，错误的值，不新鲜的值。

如何防止这样错误的“优化”?方法就是给变量加上volatile修饰。

volatile int i=10;//用volatile修饰变量i......//something happened int b = i;//强制从内存中读取实时的i的值

OK，毕竟volatile不是完美的，它也在某种程度上限制了优化。

有时候是不是有这样的需求：我要你立即实时读取数据的时候，你就访问内存，别优化;否则，你该优化还是优化。能做到吗?

不加volatile修饰，那么就做不到前面一点。加了volatile，后面这一方面就无从谈起，怎么办?

其实我们可以这样：

int i = 2; //变量i还是不用加volatile修饰#define ACCESS_ONCE(x) (* (volatile typeof(x) *) &(x))

需要实时读取i的值时候，就调用ACCESS_ONCE(i)，否则直接使用i即可。

听起来很好，然而险象环生：

volatile常被误用，很多人往往不知道或者忽略它的两个特点：

在C/C++语言里，volatile不保证原子性;

使用volatile不应该对它有任何Memory Barrier的期待。

第一点比较好理解，对于第二点，我们来看一个很经典的例子：

volatile int is_ready = 0;char message[123];void thread_A
{  while(is_ready == 0)
  {
  }  //use message;}void thread_B
{  strcpy(message,"everything seems ok");
  is_ready = 1;
}

线程B中，虽然is_ready有volatile修饰，但是这里的volatile不提供任何Memory Barrier，因此12行和13行可能被乱序执行，is_ready = 1被执行，而message还未被正确设置，导致线程A读到错误的值。

这意味着，在多线程中使用volatile需要非常谨慎、小心。

__thread

__thread是gcc内置的用于多线程编程的基础设施。用__thread修饰的变量，每个线程都拥有一份实体，相互独立，互不干扰。举个例子：

#include<iostream>  #include<pthread.h>  #include<unistd.h>  using namespace std;
__thread int i = 1;void* thread1(void* arg);void* thread2(void* arg);int main(){  pthread_t pthread1;  pthread_t pthread2;
  pthread_create(&pthread1, NULL, thread1, NULL);
  pthread_create(&pthread2, NULL, thread2, NULL);
  pthread_join(pthread1, NULL);
  pthread_join(pthread2, NULL);  return 0;
}void* thread1(void* arg){  cout<<++i<<endl;//输出 2  
  return NULL;
}void* thread2(void* arg){
  sleep(1); //等待thread1完成更新
  cout<<++i<<endl;//输出 2，而不是3
  return NULL;
}

需要注意的是：

1. __thread可以修饰全局变量、函数的静态变量，但是无法修饰函数的局部变量。

2. 被__thread修饰的变量只能在编译期初始化，且只能通过常量表达式来初始化。

Memory Barrier

为了优化，现代编译器和CPU可能会乱序执行指令。例如：

int a = 1;int b = 2;a = b + 3;b = 10;

CPU乱序执行后，第4行语句和第5行语句的执行顺序可能变为先b=10然后再a=b+3

有些人可能会说，那结果不就不对了吗?b为10，a为13?可是正确结果应该是a为5啊。

这里说的是语句的执行，对应的汇编指令不是简单的mov b,10和mov b,a+3。

生成的汇编代码可能是：

movl    b(%rip), %eax ; 将b的值暂存入%eax
movl    $10, b(%rip) ; b = 10addl    $3, %eax ; %eax加3movl    %eax, a(%rip) ; 将%eax也就是b+3的值写入a,即 a = b + 3

这并不奇怪，为了优化性能，有时候确实可以这么做。但是在多线程并行编程中，有时候乱序就会出问题。

一个最典型的例子是用锁保护临界区。如果临界区的代码被拉到加锁前或者释放锁之后执行，那么将导致不明确的结果。

还有，比如随意将读数据和写数据乱序，那么本来是先读后写，变成先写后读就导致后面读到了脏的数据。

因此，Memory Barrier就是用来防止乱序执行的。具体说来，Memory Barrier包括三种：

1. acquire barrier。acquire barrier之后的指令不能被拉到该acquire barrier之前执行。

2. release barrier。release barrier之前的指令不能被拉到该release barrier之后执行。

3. full barrier。以上两种的合集。

所以，很容易知道，加锁，也就是lock对应acquire barrier;释放锁，也就是unlock对应release barrier。哦，那么full barrier呢?

__sync_synchronize

__sync_synchronize就是一种full barrier。

预约申请免费试听课

填写下面表单即可预约申请免费试听！怕学不会？助教全程陪读，随时解惑！担心就业？一地学习，可全国推荐就业！

上一篇：linux常用命令

下一篇：Linux进程调度

Linux相关推荐阅读

开班时间

Java开发 12月30日立即报名
云计算 12月30日立即报名
网络安全 12月30日立即报名
Python 12月30日立即报名
数据分析 12月30日立即报名
C++ 12月30日立即报名
物联网 12月30日立即报名
Web前端 12月30日立即报名
软件测试 12月30日立即报名
AI大模型 12月30日立即报名
鸿蒙 12月30日立即报名
智能办公 12月30日立即报名
商业视效 12月30日立即报名
AGI商业变现 12月30日立即报名
UI设计 12月30日立即报名
新媒体电商 12月30日立即报名

关于达内

达内简介联系我们隐私声明法律公告业务合作

其他服务

培训证书查询投诉与建议

投诉邮箱

tousu@tedu.cn

客服电话

400-111-8989

选择城市和中心

北京

达内北京天坛中心

黑龙江省

达内大庆中心

吉林省

达内长春中心

辽宁省

内蒙古

达内呼和浩特中心

天津

河北省

达内河北中心

山西省

陕西省

达内西安省体中心

山东省

河南省

江苏省

安徽省

上海

达内上海长寿路中心

湖北省

达内武汉光谷中心

四川省

达内成都钻石中心

重庆

达内重庆中心

湖南省

达内长沙中心

江西省

达内南昌人民公园中心

浙江省

贵州省

达内贵阳中心

福建省

云南省

达内昆明中心

广西省

达内南宁中心

广东省

达内广州云计算中心

海南省

达内海南中心

台湾

达内台北中心

Linux培训

Linux环境多线程编程基础设施

预约申请免费试听课

Linux相关推荐阅读

相关栏目

开班时间