Linux培训

相关推荐:

Linux培训 > 职场技巧分享

什么是Linux中的零拷贝技术？

发布：Linux培训
来源：职场技巧分享
时间：2020-07-07 17:14

今天小编要跟大家分享的文章是关于什么是Linux中的零拷贝技术。在写一个服务端程序时（Web Server或者文件服务器），文件下载是一个基本功能。这时候服务端的任务是：将服务端主机磁盘中的文件不做修改地从已连接的socket发出去，我们通常用下面的代码完成：

1. while((n = read(diskfd, buf, BUF_SIZE)) >0)

2. write(sockfd, buf , n);

基本操作就是循环的从磁盘读入文件内容到缓冲区，再将缓冲区的内容发送到socket。但是由于Linux的I/O操作默认是缓冲I/O。这里面主要使用的也就是read和write两个系统调用，我们并不知道操作系统在其中做了什么。实际上在以上I/O操作中，发生了多次的数据拷贝。当应用程序访问某块数据时，操作系统首先会检查，是不是最近访问过此文件，文件内容是否缓存在内核缓冲区，如果是，操作系统则直接根据read系统调用提供的buf地址，将内核缓冲区的内容拷贝到buf所指定的用户空间缓冲区中去。如果不是，操作系统则首先将磁盘上的数据拷贝的内核缓冲区，这一步目前主要依靠DMA来传输，然后再把内核缓冲区上的内容拷贝到用户缓冲区中。接下来，write系统调用再把用户缓冲区的内容拷贝到网络堆栈相关的内核缓冲区中，最后socket再把内核缓冲区的内容发送到网卡上。说了这么多，不如看图清楚：

什么是Linux中的零拷贝技术

什么是零拷贝技术（zero-copy）？

零拷贝主要的任务就是避免CPU将数据从一块存储拷贝到另外一块存储，主要就是利用各种零拷贝技术，避免让CPU做大量的数据拷贝任务，减少不必要的拷贝，或者让别的组件来做这一类简单的数据传输任务，让CPU解脱出来专注于别的任务。这样就可以让系统资源的利用更加有效。我们继续回到引文中的例子，我们如何减少数据拷贝的次数呢？一个很明显的着力点就是减少数据在内核空间和用户空间来回拷贝，这也引入了零拷贝的一个类型：让数据传输不需要经过user space。

使用mmap

我们减少拷贝次数的一种方法是调用mmap()来代替read调用：

1. buf = mmap(diskfd, len);

2. write(sockfd, buf, len);

应用程序调用mmap()，磁盘上的数据会通过DMA被拷贝的内核缓冲区，接着操作系统会把这段内核缓冲区与应用程序共享，这样就不需要把内核缓冲区的内容往用户空间拷贝。应用程序再调用write(),操作系统直接将内核缓冲区的内容拷贝到socket缓冲区中，这一切都发生在内核态，最后，socket缓冲区再把数据发到网卡去。同样的，看图很简单：

什么是Linux中的零拷贝技术

mmap

使用mmap替代read很明显减少了一次拷贝，当拷贝数据量很大时，无疑提升了效率。但是使用mmap是有代价的。当你使用mmap时，你可能会遇到一些隐藏的陷阱。例如，当你的程序map了一个文件，但是当这个文件被另一个进程截断(truncate)时, write系统调用会因为访问非法地址而被SIGBUS信号终止。SIGBUS信号默认会杀死你的进程并产生一个coredump,如果你的服务器这样被中止了，那会产生一笔损失。通常我们使用以下解决方案避免这种问题：

1.为SIGBUS信号建立信号处理程序当遇到SIGBUS信号时，信号处理程序简单地返回，write系统调用在被中断之前会返回已经写入的字节数，并且errno会被设置成success,但是这是一种糟糕的处理办法，因为你并没有解决问题的实质核心。

2.使用文件租借锁通常我们使用这种方法，在文件描述符上使用租借锁，我们为文件向内核申请一个租借锁，当其它进程想要截断这个文件时，内核会向我们发送一个实时的RTSIGNALLEASE信号，告诉我们内核正在破坏你加持在文件上的读写锁。这样在程序访问非法内存并且被SIGBUS杀死之前，你的write系统调用会被中断。write会返回已经写入的字节数，并且置errno为success。我们应该在mmap文件之前加锁，并且在操作完文件后解锁：

1. if(fcntl(diskfd, F_SETSIG, RT_SIGNAL_LEASE) == -1) {

2. perror("kernel lease set signal");

3. return-1;

4. }

5. /* l_type can be F_RDLCK F_WRLCK 加锁*/

6. /* l_type can be F_UNLCK解锁*/

7. if(fcntl(diskfd, F_SETLEASE, l_type)){

8. perror("kernel lease set type");

9. return-1;

10. }

使用sendfile

从2.1版内核开始，Linux引入了sendfile来简化操作:

1. #include<sys/sendfile.h>

2. ssize_tsendfile(intout_fd,intin_fd,off_t*offset,size_tcount);

系统调用sendfile()在代表输入文件的描述符infd和代表输出文件的描述符outfd之间传送文件内容（字节）。描述符outfd必须指向一个套接字，而infd指向的文件必须是可以mmap的。这些局限限制了sendfile的使用，使sendfile只能将数据从文件传递到套接字上，反之则不行。使用sendfile不仅减少了数据拷贝的次数，还减少了上下文切换，数据传送始终只发生在kernel space。

什么是Linux中的零拷贝技术

使用splice

sendfile只适用于将数据从文件拷贝到套接字上，限定了它的使用范围。Linux在2.6.17版本引入splice系统调用，用于在两个文件描述符中移动数据：

1. #define_GNU_SOURCE /* See feature_test_macros(7) */

2. #include<fcntl.h>

3. ssize_tsplice(intfd_in,loff_t*off_in,intfd_out,loff_t*off_out,size_tlen,unsignedintflags);

splice调用在两个文件描述符之间移动数据，而不需要数据在内核空间和用户空间来回拷贝。他从fdin拷贝len长度的数据到fdout，但是有一方必须是管道设备，这也是目前splice的一些局限性。flags参数有以下几种取值：

§ SPLICEFMOVE ：尝试去移动数据而不是拷贝数据。这仅仅是对内核的一个小提示：如果内核不能从pipe移动数据或者pipe的缓存不是一个整页面，仍然需要拷贝数据。Linux最初的实现有些问题，所以从2.6.21开始这个选项不起作用，后面的Linux版本应该会实现。

§ SPLICEFNONBLOCK ：splice操作不会被阻塞。然而，如果文件描述符没有被设置为不可被阻塞方式的I/O，那么调用splice有可能仍然被阻塞。

§ SPLICEFMORE：后面的splice调用会有更多的数据。

splice调用利用了Linux提出的管道缓冲区机制，所以至少一个描述符要为管道。以上几种零拷贝技术都是减少数据在用户空间和内核空间拷贝技术实现的，但是有些时候，数据必须在用户空间和内核空间之间拷贝。这时候，我们只能针对数据在用户空间和内核空间拷贝的时机上下功夫了。Linux通常利用写时复制(copy on write)来减少系统开销，这个技术又时常称作COW。由于篇幅原因，本文不详细介绍写时复制。大概描述下就是：如果多个程序同时访问同一块数据，那么每个程序都拥有指向这块数据的指针，在每个程序看来，自己都是独立拥有这块数据的，只有当程序需要对数据内容进行修改时，才会把数据内容拷贝到程序自己的应用空间里去，这时候，数据才成为该程序的私有数据。如果程序不需要对数据进行修改，那么永远都不需要拷贝数据到自己的应用空间里。这样就减少了数据的拷贝。写时复制的内容可以再写一篇文章了。。。除此之外，还有一些零拷贝技术，比如传统的Linux I/O中加上O_DIRECT标记可以直接I/O，避免了自动缓存，还有尚未成熟的fbufs技术，本文尚未覆盖所有零拷贝技术，只是介绍常见的一些，如有兴趣，可以自行研究，一般成熟的服务端项目也会自己改造内核中有关I/O的部分，提高自己的数据传输速率。

以上就是小编今天为大家分享的关于什么是Linux中的零拷贝技术的文章，希望本篇文章能够对正在从事Linux运维工作的小伙伴们有所帮助，想要了解更多Linux相关知识记得关注达内 Linux培训官网，最后祝愿小伙伴们工作顺利，成为一名优秀的Linux运维工程师。

来自：简书，作者：卡巴拉的树

链接：#/p/fad3339e3448

【免责声明：本文图片及文字信息均由小编转载自网络，旨在分享提供阅读，版权归原作者所有，如有侵权请联系我们进行删除。】

预约申请免费试听课

填写下面表单即可预约申请免费试听！怕学不会？助教全程陪读，随时解惑！担心就业？一地学习，可全国推荐就业！

上一篇：Linux运维工程师从入门到涨薪都需要学什么技能?

下一篇：运维人员能够通过HTTPS解决什么问题

相关推荐

: 云计算就业前景如何

在数字化转型加速推进的今天，云计算作为底层核心技术，其云计算就业前景成为众多求职者和从业者关注的焦点。从互联网巨头到传统企业，对云计算人才的需求日益增长，深入了解这一领域的就业前景，能为职业选择提供关键参考，而新达内教育则能助力大家抓住这一机遇。

: 云计算就业培训靠谱吗

在云计算行业人才缺口持续扩大的背景下，云计算就业培训成为许多人快速入行的选择，但 “培训是否靠谱” 也成了大家普遍关心的问题。事实上，靠谱的云计算就业培训能帮学员系统掌握技能、对接企业需求，而选择专业机构是关键，新达内教育便是其中的优质代表。

: 学云计算的好处

在数字化时代，云计算作为核心技术之一，正重塑各行各业的运作模式。学云计算的好处日益凸显，不仅能为个人职业发展开辟新路径，还能提升应对技术变革的能力。但不少人虽知晓其价值，却不知如何系统学习，而新达内教育培训凭借专业的课程体系，成为助力大众掌握云计算技能、享受学习好处的优质平台。

: 杭州云计算培训班怎么选

随着数字经济的蓬勃发展，杭州作为互联网产业高地，对云计算人才的需求日益旺盛。许多求职者和转行人士希望通过参加云计算培训班掌握专业技能，但面对市面上五花八门的机构，“杭州云计算培训班怎么选” 成为大家普遍困惑的问题。本文将从核心维度给出选择建议，并推荐兼具实力与口碑的新达内教育培训。

Linux相关推荐阅读

25岁学习云计算晚吗

linux运维工程师培训机构哪家好

学云计算出来能干嘛

云计算技术是学什么的

达内教育云计算培训正规的吗

达内教育云计算就业可靠吗

达内教育Linux培训是正规的吗

达内教育云计算培训就业可靠吗

2025年云计算运维工程师在哪学习比较好

大数据和云计算专业好找工作吗

相关栏目

开班时间

Java开发 12月30日立即报名
云计算 12月30日立即报名
网络安全 12月30日立即报名
Python 12月30日立即报名
数据分析 12月30日立即报名
C++ 12月30日立即报名
物联网 12月30日立即报名
Web前端 12月30日立即报名
软件测试 12月30日立即报名
AI大模型 12月30日立即报名
鸿蒙 12月30日立即报名
智能办公 12月30日立即报名
商业视效 12月30日立即报名
AGI商业变现 12月30日立即报名
UI设计 12月30日立即报名
新媒体电商 12月30日立即报名

关于达内

达内简介联系我们隐私声明法律公告业务合作

其他服务

培训证书查询投诉与建议

投诉邮箱

tousu@tedu.cn

客服电话

400-111-8989

Copyright © 2023 Tedu.cn All Rights Reserved 京ICP备08000853号-56 京公网安备 11010802029508号达内时代科技集团有限公司版权所有

选择城市和中心

北京

达内北京天坛中心

黑龙江省

达内大庆中心

吉林省

达内长春中心

辽宁省

内蒙古

达内呼和浩特中心

天津

河北省

达内河北中心

山西省

陕西省

达内西安省体中心

山东省

河南省

江苏省

安徽省

上海

达内上海长寿路中心

湖北省

达内武汉光谷中心

四川省

达内成都钻石中心

重庆

达内重庆中心

湖南省

达内长沙中心

江西省

达内南昌人民公园中心

浙江省

贵州省

达内贵阳中心

福建省

云南省

达内昆明中心

广西省

达内南宁中心

广东省

达内广州云计算中心

海南省

达内海南中心

台湾

达内台北中心