Linux I/O 演进史：从管道到零拷贝，一篇串起11个服务端核心原语

发表于 3 天前

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

×

本文是 Linux 高性能 服务器开辟系列的第四篇，承接前三篇《吃透Linux/C++体系编程：文件与I/O利用从入门到避坑》《TCP/IP 协议：高性能 服务器的底层基石》《Linux 网络编程核心 API 速查手册》，深入解说 Linux 服务端 I/O 的演进逻辑与零拷贝优化，从底层原理到代码落地，构建完备的高性能 服务器开辟知识体系。

彻底搞懂 fcntl/pipe/dup/CGI/mmap/sendfile/splice/tee 的底层逻辑

为什么要搞懂这一串 Linux I/O 原语

当你在欣赏器输入网址按下回车，静态文件被快速返回；当你用反向署理转发 TCP 流量；当你用一行管道下令cat log.txt | grep error过滤日记——背后支持这统统的，正是本文要讲的这11个Linux核心I/O原语。
许多开辟者对它们的认知停顿在「背过API参数、应付过口试」，却始终找不到它们之间的关联：dup/dup2和CGI有什么关系？pipe为什么是splice/tee的核心？sendfile和mmap到底怎么选？
本文我们将沿着根本本领建立→经典场景落地→零拷贝极致优化的完备演讲路径，把全部技能点串成一条完备的逻辑链，搞懂每一个技能的出现配景，办理的痛点，以及在Linux I/O体系中的位置。
核心公识：Linux中统统皆文件，全部I/O的核心载体，都是文件形貌符（fd）。
I/O的控制中枢：fcntl，fd的「全能工具箱」

我把fcntl放在最开头，由于它是全部I/O利用的幕后控制者——你反面看到的全部技能，险些都离不开它的辅助。
fcntl核心定位，是对文件形貌符的属性做精致化控制，它的核心本领刚好覆盖率后续全部场景的根本需求：

修改fd的壅闭/非壅闭模式：通过O_NONBLOCK标记，为后续的管道、socket I/O提供非壅闭本领；
复制文件形貌符：通过F_DUPFD实现和dup/dup2同源的fd复制本领；
设置FD_CLOEXEC标记：控制进程exec实验时是否关闭fd，是CGI实现的关键细节；
调解管道缓冲区巨细：通过F_SETPIPE_SZ修改管道容量，是splice/tee性能调优的核心本领；
获取/修改文件状态：同一管理fd的权限、标记位，是全部I/O利用的根本。

一句话总结：fcntl是Linux I/O体系的「全局控制面板」，没有它，后续的全部I/O本领都无法机动落地。
函数原型

#include <fcntl.h>
#include <unistd.h>
// 核心函数：fd控制的万能入口
int fcntl(int fd, int cmd, ... /* arg */);

复制代码

fd：目标文件形貌符
cmd：控制下令（如 F_GETFL/F_SETFL/F_GETFD/F_SETFD/F_SETPIPE_SZ）
...：可变参数，根据 cmd 决定是否须要

核心代码示例

点击查察代码

#include <fcntl.h>
#include <unistd.h>
// 1. 将fd设置为非阻塞模式
void set_nonblocking(int fd) {
int flags = fcntl(fd, F_GETFL, 0);
fcntl(fd, F_SETFL, flags | O_NONBLOCK);
}
// 2. 设置FD_CLOEXEC：exec时自动关闭fd
void set_cloexec(int fd) {
int flags = fcntl(fd, F_GETFD, 0);
fcntl(fd, F_SETFD, flags | FD_CLOEXEC);
}
// 3. 调整管道缓冲区大小为1MB
void set_pipe_size(int pipe_fd) {
fcntl(pipe_fd, F_SETPIPE_SZ, 1024 * 1024);
}

复制代码

根本I/O的第一次优化：readv/writev，告别冗余体系调用

有了fd的根本控制本领，我们先看最经典的I/O模式：read/write。
传统模式的痛点

当我们须要读写多个分散的内存缓冲区时，好比HTTP相应要先写Header、再写Body，传统方案须要多次调用write，每一次调用都要触发「用户态→内核态」的上下文切换。高并发场景下，这些切换的CPU开销，以致会凌驾数据拷贝本身。
办理方案：readv/writev

readv/writev被称为分散/聚集I/O，它用一次体系调用，就能完成多个不一连缓冲区的读写：

readv：从fd中读取数据，按序次分散添补到多个缓冲区；
writev：把多个缓冲区的数据，按序次聚集写入到fd中。

它的核心代价，就是把N次体系调用压缩为1次，大幅淘汰上下文切换的CPU开销。好比HTTP相应的场景，用writev可以一次把Header和Body写入socket，无需两次write调用。
这也是我们第一次打仗到Linux I/O优化的核心思绪：能少一次体系调用，就少一次；能少一次数据拷贝，就少一次。这个思绪，将贯穿后续整个零拷贝演进的全过程。
函数原型

#include <sys/uio.h>
#include <unistd.h>
// 分散读：从fd读取数据，填充到多个iovec缓冲区
ssize_t readv(int fd, const struct iovec *iov, int iovcnt);
// 聚集写：将多个iovec缓冲区的数据，一次性写入fd
ssize_t writev(int fd, const struct iovec *iov, int iovcnt);

复制代码

iov：iovec 布局体数组，每个元素形貌一个缓冲区（所在+长度）
iovcnt：iov 数组的元素个数

核心代码示例：HTTP相应的writev实现

点击查察代码

#include <sys/uio.h>
#include <unistd.h>
#include <cstring>
#include <string>
void send_http_response(int sock_fd) {
// 两个分散的缓冲区：HTTP头 + 响应体
const std::string header = "HTTP/1.1 200 OK\r\nContent-Length: 11\r\n\r\n";
const std::string body = "Hello World";
// 构造iovec数组，每个元素对应一个缓冲区
struct iovec iov[2];
iov[0].iov_base = const_cast<char*>(header.data());
iov[0].iov_len = header.size();
iov[1].iov_base = const_cast<char*>(body.data());
iov[1].iov_len = body.size();
// 一次writev调用，写入所有缓冲区
writev(sock_fd, iov, 2);
}

复制代码

跨进程I/O的基石：pipe，Linux最经典的IPC原语

办理了进程内的I/O优化，我们自然会碰到下一个题目：进程之间是内存隔离的，怎样让两个进程高效传输数据？
答案就是pipe（管道），Linux最古老、最根本的进程间通讯（IPC）机制。它的本质是内核中的一个环形缓冲区，对外提供一对fd：读端（只读）和写端（只写），实现进程间的单向字节省传输。
pipe的核心特性

单向传输：数据只能从写端流入，读端流出，要实现双向通讯须要创建两对管道；
字节省语义：无消息界限，和TCP雷同，写入的字节省会被一连读取；
同步机制：写端缓冲区满时壅闭写入，读端缓冲区空时壅闭读取；
生命周期：随进程存在，当全部持有管道fd的进程都关闭后，管道会被内核烧毁。

我们最认识的shell管道下令ls | grep test，底层就是pipe实现的：shell创建一对管道，把ls的标准输出重定向到管道写端，把grep的标准输入重定向到管道读端，实现两个进程的数据传输。
而这里的「重定向」，就须要我们下一个主角登场：dup/dup2。
函数原型

#include <unistd.h>
// 创建管道，fd[0]为读端，fd[1]为写端
int pipe(int fd[2]);

复制代码

fd[2]：输出参数，乐成后 fd[0] 是只读的管道读端，fd[1] 是只写的管道写端

核心代码示例：shell管道的底层C++实现

点击查察代码

#include <iostream>
#include <unistd.h>
#include <sys/wait.h>
int main() {
int pipefd[2];
pipe(pipefd); // 创建管道：pipefd[0]读端，pipefd[1]写端
if (fork() == 0) {
// 子进程：执行 ls
close(pipefd[0]); // 关闭读端
dup2(pipefd[1], 1); // 将标准输出重定向到管道写端
close(pipefd[1]);
execlp("ls", "ls", nullptr);
exit(1);
}
if (fork() == 0) {
// 子进程：执行 grep test
close(pipefd[1]); // 关闭写端
dup2(pipefd[0], 0); // 将标准输入重定向到管道读端
close(pipefd[0]);
execlp("grep", "grep", "test", nullptr);
exit(1);
}
// 父进程：关闭管道，等待子进程
close(pipefd[0]);
close(pipefd[1]);
wait(nullptr);
wait(nullptr);
return 0;
}

复制代码

管道的灵魂搭档：dup/dup2，实现I/O重定向

有了管道，我们怎样让一个进程的标准输入/输出，无缝接入管道？这就要靠dup/dup2——文件形貌符复制函数。
核心原理

dup/dup2的本质，是复制fd的内核引用，而非文件内容。复制后的两个fd，会指向同一个内核文件对象，共享文件偏移、权限、状态标记。

dup(fd)：自动分配一个当前可用的最小fd编号，复制传入的fd；
dup2(old_fd, new_fd)：逼迫把old_fd复制到指定的new_fd编号，假如new_fd已经打开，会先自动关闭它。

核心代价：I/O重定向

这是dup/dup2最核心的用途。好比我们要把进程的标准输出（stdout，固定fd=1）重定向到文件，只须要几行代码：
函数原型

#include <unistd.h>
// 复制fd，自动分配最小可用的新fd编号
int dup(int oldfd);
// 复制fd，强制指定新fd编号（若newfd已打开则先关闭）
int dup2(int oldfd, int newfd);

复制代码

核心代码示例：标准输出重定向到文件（C++）

点击查察代码[code]#include #include #include int main() { // 打开文件 int file_fd = open("output.txt", O_WRONLY | O_CREAT | O_TRUNC, 0644); // 核心：将文件fd复制到标准输出fd=1 dup2(file_fd, 1); close(file_fd); // 原文件fd已不须要，关闭 // 以后全部cout都会写入文件 std::cout 父 if (fork() == 0) { // 子进程：模仿CGI步调 close(pipe_req[1]); close(pipe_resp[0]); // 重定向标准输入/输出到管道 dup2(pipe_req[0], 0); dup2(pipe_resp[1], 1); close(pipe_req[0]); close(pipe_resp[1]); // 模仿CGI：读取哀求，返反相应 char req[1024]; ssize_t n = read(0, req, sizeof(req) - 1); req[n] = '\0'; std::cout

		自动登录	找回密码
密码			立即注册