小林TCP常见问题

Author：那随意了
发布时间：October 18, 2023
1744 views
No comments
5041 words
Categories：网络与架构

小林TCP常见问题

如何理解是 TCP 面向字节流协议？如何理解字节流？

之所以会说TCP是面向字节流的协议，UDP是面向报文的协议，是因为操作系统对TCP和UDP协议发送方的机制不同，他也就是问题原因在发送方。

先来说说为什么UDP是面向报文的协议？

当用户通过UDP协议传输时，操作系统不会对消息进行拆分，在组装好UDP头部后就交给网络层来处理，所以发出去的UDP报文中的数据不分就是完整的用户消息，也就是每个UDP报文就是一个用户消息的边界，这样接收方到UDP报文后，读一个UDP报文就能读取到完整的用户信息。

你可能会问，如果收到了俩个UDP报文，操作系统是怎么区分开的？

操作系统在收到UDP报文后，会将其插入到队列里，队列里每一个元素就是一个UDP报文，这样当用户调用revfrom()系统读数据的时候，就会从队列里取出一个元素，然后从内核拷贝给用户缓冲区。

再来说说为什么TCP是面向字节流的协议？

当用户消息通过TCP协议传输时，消息可能会被操作系统分组成多个TCP报文，也就是一个完整的用户消息被拆分成多个TCP报文进行传输。

这时，接收方的程序如果不知道发送方发送的消息长度，也就是不知道消息边界，是无法读取出有效的用户信息的，因为用户消息被拆分成多个TCP报文后，并不能像UDP一样，一个UDP报文就能代表一个完整的用户消息。

举个实际的例子来说明。

发送方准备发送「Hi.」和「I am Xiaolin」这两个消息。

在发送端，当我们调用 send 函数完成数据“发送”以后，数据并没有被真正从网络上发送出去，只是从应用程序拷贝到了操作系统内核协议栈中。

至于什么时候真正被发送，取决于发送窗口、拥塞窗口以及当前发送缓冲区的大小等条件。也就是说，我们不能认为每次 send 调用发送的数据，都会作为一个整体完整地消息被发送出去。

如果我们考虑实际网络传输过程中的各种影响，假设发送端陆续调用 send 函数先后发送「Hi.」和「I am Xiaolin」报文，那么实际的发送很有可能是这几种情况。

第一种情况，这两个消息被分到同一个 TCP 报文，像这样：

第二种情况，「I am Xiaolin」的部分随「Hi」在一个 TCP 报文中发送出去，像这样：

第三种情况，「Hi.」的一部分随 TCP 报文被发送出去，另一部分和「I am Xiaolin」一起随另一个 TCP 报文发送出去，像这样。

类似的情况还能举例很多种，这里主要是想说明，我们不知道「Hi.」和「I am Xiaolin」这两个用户消息是如何进行 TCP 分组传输的。

因此，我们不能认为一个用户消息对应一个 TCP 报文，正因为这样，所以 TCP 是面向字节流的协议。

当俩个消息的某个不分内容被分到同一个TCP报文时，就是我们常说的TCP粘包问题，这时接收方不知道消息的边界的话，是无法读初有效的消息。

要解决这个问题，要交给应用程序。

如何解决粘包

粘包的问题出现是因为不知道一个用户消息的边界在哪，如果知道了边界在哪，就可以通过边界来划分出有效的用户消息。

一般有三种方式分包

固定长度的消息
特殊字符作为边界
自定义消息结构

固定长度消息

这种是最简单方法，即每个用户消息都是固定长度的，比如规定一个消息的长度是 64 个字节，当接收方接满 64 个字节，就认为这个内容是一个完整且有效的消息。

但是这种方式灵活性不高，实际中很少用。

特殊字符作为边界

我们可以在两个用户消息之间插入一个特殊的字符串，这样接收方在接收数据时，读到了这个特殊字符，就把认为已经读完一个完整的消息。

HTTP 是一个非常好的例子。

HTTP通过设置回车符、换行符作为HTTP报文的边界，如果刚好消息内容里有这个特殊字符，我们要对这个特殊字符进行转义，避免被接收方当做消息的边界点儿解析到无效的数据。

自定义消息结构

我们可以自定义一个消息结构，由包头和数据组成，其中包头包是固定大小的，而且包头里有一个字段来说明紧随其后的数据有多大。

比如这个消息结构体，首先 4 个字节大小的变量来表示数据长度，真正的数据则在后面。

struct { 
    u_int32_t message_length; 
    char message_data[]; 
} message;

当接收方接收到包头的大小（比如 4 个字节）后，就解析包头的内容，于是就可以知道数据的长度，然后接下来就继续读取数据，直到读满数据的长度，就可以组装成一个完整到用户消息来处理了。

TCP Keepalive 和 HTTP Keep-Alive 是一个东西吗？

TCP Keepalive 和 HTTP Keep-A这是个好问题，应该有不少人都会搞混，因为这两个东西看上去太像了，很容易误以为是同一个东西。

事实上，这两个完全是两样不同东西，实现的层面也不同：

HTTP 的 Keep-Alive，是由应用层（用户态） 实现的，称为 HTTP 长连接；
TCP 的 Keepalive，是由 TCP 层（内核态） 实现的，称为 TCP 保活机制；

接下来，分别说说它们。ive 是一个东西吗？

HTTP 的 Keep-Alive

HTTP 协议采用的是「请求-应答」的模式，也就是客户端发起了请求，服务端才会返回响应，一来一回这样子。

由于 HTTP 是基于 TCP 传输协议实现的，客户端与服务端要进行 HTTP 通信前，需要先建立 TCP 连接，然后客户端发送 HTTP 请求，服务端收到后就返回响应，至此「请求-应答」的模式就完成了，随后就会释放 TCP 连接。

如果每次请求都要经历这样的过程：建立 TCP -> 请求资源 -> 响应资源 -> 释放连接，那么此方式就是 HTTP 短连接，如下图：

这样实在太累人了，一次连接只能请求一次资源。

能不能在第一个 HTTP 请求完后，先不断开 TCP 连接，让后续的 HTTP 请求继续使用此连接？

当然可以，HTTP 的 Keep-Alive 就是实现了这个功能，可以使用同一个 TCP 连接来发送和接收多个 HTTP 请求/应答，避免了连接建立和释放的开销，这个方法称为 HTTP 长连接。

HTTP 长连接的特点是，只要任意一端没有明确提出断开连接，则保持 TCP 连接状态。

怎么才能使用 HTTP 的 Keep-Alive 功能？

在 HTTP 1.0 中默认是关闭的，如果浏览器要开启 Keep-Alive，它必须在请求的包头中添加：

Connection: Keep-Alive

然后当服务器收到请求，作出回应的时候，它也添加一个头在响应中：

Connection: Keep-Alive

这样做，连接就不会中断，而是保持连接。当客户端发送另一个请求时，它会使用同一个连接。这一直继续到客户端或服务器端提出断开连接。

从 HTTP 1.1 开始，就默认是开启了 Keep-Alive，如果要关闭 Keep-Alive，需要在 HTTP 请求的包头里添加：

Connection:close

现在大多数浏览器都默认是使用 HTTP/1.1，所以 Keep-Alive 都是默认打开的。一旦客户端和服务端达成协议，那么长连接就建立好了。

HTTP 长连接不仅仅减少了 TCP 连接资源的开销，而且这给 HTTP 流水线技术提供了可实现的基础。

所谓的 HTTP 流水线，是客户端可以先一次性发送多个请求，而在发送过程中不需先等待服务器的回应，可以减少整体的响应时间。

但是服务器还是按照顺序响应，先回应 A 请求，完成后再回应 B 请求。

而且要等服务器响应完客户端第一批发送的请求后，客户端才能发出下一批的请求，也就说如果服务器响应的过程发生了阻塞，那么客户端就无法发出下一批的请求，此时就造成了「队头阻塞」的问题。

可能有的同学会问，如果使用了 HTTP 长连接，如果客户端完成一个 HTTP 请求后，就不再发起新的请求，此时这个 TCP 连接一直占用着不是挺浪费资源的吗？

对没错，所以为了避免资源浪费的情况，web 服务软件一般都会提供 keepalive_timeout 参数，用来指定 HTTP 长连接的超时时间。

比如设置了 HTTP 长连接的超时时间是 60 秒，web 服务软件就会启动一个定时器，如果客户端在完后一个 HTTP 请求后，在 60 秒内都没有再发起新的请求，定时器的时间一到，就会触发回调函数来释放该连接。

TCP的Keepalive

TCP 的 Keepalive 这东西其实就是 TCP 的保活机制，它的工作原理我之前的文章写过，这里就直接贴下以前的内容。

如果两端的 TCP 连接一直没有数据交互，达到了触发 TCP 保活机制的条件，那么内核里的 TCP 协议栈就会发送探测报文。

如果对端程序是正常工作的。当 TCP 保活的探测报文发送给对端, 对端会正常响应，这样 TCP 保活时间会被重置，等待下一个 TCP 保活时间的到来。
如果对端主机宕机（注意不是进程崩溃，进程崩溃后操作系统在回收进程资源的时候，会发送 FIN 报文，而主机宕机则是无法感知的，所以需要 TCP 保活机制来探测对方是不是发生了主机宕机），或对端由于其他原因导致报文不可达。当 TCP 保活的探测报文发送给对端后，石沉大海，没有响应，连续几次，达到保活探测次数后，TCP 会报告该 TCP 连接已经死亡。

所以，TCP 保活机制可以在双方没有数据交互的情况，通过探测报文，来确定对方的 TCP 连接是否存活，这个工作是在内核完成的。

注意，应用程序若想使用 TCP 保活机制需要通过 socket 接口设置 SO_KEEPALIVE 选项才能够生效，如果没有设置，那么就无法使用 TCP 保活机制。

总结

HTTP 的 Keep-Alive 也叫 HTTP 长连接，该功能是由「应用程序」实现的，可以使得用同一个 TCP 连接来发送和接收多个 HTTP 请求/应答，减少了 HTTP 短连接带来的多次 TCP 连接建立和释放的开销。

TCP 的 Keepalive 也叫 TCP 保活机制，该功能是由「内核」实现的，当客户端和服务端长达一定时间没有进行数据交互时，内核为了确保该连接是否还有效，就会发送探测报文，来检测对方是否还在线，然后来决定是否要关闭该连接。

Last modification：October 18, 2023

如果觉得我的文章对你有用，请随意赞赏

小林TCP常见问题

那随意了 • 2023 年 10 月 18 日

<h1>小林TCP常见问题</h1><h2>如何理解是 TCP 面向字节流协议？如何理解字节流？</h2>之所以会说TCP是面向字节流的协议，UDP是面向报文的协议，是因为操作系统对TCP和UDP协议发送方的机制不同，他也就是问题原因在发送方。<blockquote>先来说说为什么UDP是面向报文的协议？</blockquote>当用户通过UDP协议传输时，操作系统不会对消息进行拆分，在组装好UDP头部后就交给网络层来处理，所以发出去的UDP报文中的数据不分就是完整的用户消息，也就是每个UDP报文就是一个用户消息的边界，这样接收方到UDP报文后，读一个UDP报文就能读取到完整的用户信息。你可能会问，如果收到了俩个UDP报文，操作系统是怎么区分开的？操作系统在收到UDP报文后，会将其插入到队列里，队列里每一个元素就是一个UDP报文，这样当用户调用revfrom()系统读数据的时候，就会从队列里取出一个元素，然后从内核拷贝给用户缓冲区。<img src="https://s3.bmp.ovh/imgs/2023/10/18/1e71265a75a54b9f.webp" alt="" title=""style="">再来说说为什么TCP是面向字节流的协议？当用户消息通过TCP协议传输时，消息可能会被操作系统分组成多个TCP报文，也就是一个完整的用户消息被拆分成多个TCP报文进行传输。这时，接收方的程序如果不知道发送方发送的消息长度，也就是不知道消息边界，是无法读取出有效的用户信息的，因为用户消息被拆分成多个TCP报文后，并不能像UDP一样，一个UDP报文就能代表一个完整的用户消息。举个实际的例子来说明。发送方准备发送 「Hi.」和「I am Xiaolin」这两个消息。在发送端，当我们调用 send 函数完成数据“发送”以后，数据并没有被真正从网络上发送出去，只是从应用程序拷贝到了操作系统内核协议栈中。至于什么时候真正被发送，取决于发送窗口、拥塞窗口以及当前发送缓冲区的大小等条件。也就是说，我们不能认为每次 send 调用发送的数据，都会作为一个整体完整地消息被发送出去。如果我们考虑实际网络传输过程中的各种影响，假设发送端陆续调用 send 函数先后发送 「Hi.」和「I am Xiaolin」 报文，那么实际的发送很有可能是这几种情况。第一种情况，这两个消息被分到同一个 TCP 报文，像这样：<img src="https://s3.bmp.ovh/imgs/2023/10/18/032d9280dc175675.webp" alt="" title=""style="">第二种情况，「I am Xiaolin」的部分随 「Hi」 在一个 TCP 报文中发送出去，像这样：<img src="https://s3.bmp.ovh/imgs/2023/10/18/0d3767a4e9d3fa43.webp" alt="" title=""style="">第三种情况，「Hi.」 的一部分随 TCP 报文被发送出去，另一部分和 「I am Xiaolin」 一起随另一个 TCP 报文发送出去，像这样。<img src="https://s3.bmp.ovh/imgs/2023/10/18/cd017defa9a1d07f.webp" alt="" title=""style="">类似的情况还能举例很多种，这里主要是想说明，我们不知道 「Hi.」和 「I am Xiaolin」 这两个用户消息是如何进行 TCP 分组传输的。因此，我们不能认为一个用户消息对应一个 TCP 报文，正因为这样，所以 TCP 是面向字节流的协议。当俩个消息的某个不分内容被分到同一个TCP报文时，就是我们常说的TCP粘包问题，这时接收方不知道消息的边界的话，是无法读初有效的消息。要解决这个问题，要交给应用程序。<h3>如何解决粘包</h3>粘包的问题出现是因为不知道一个用户消息的边界在哪，如果知道了边界在哪，就可以通过边界来划分出有效的用户消息。一般有三种方式分包<ul><li>固定长度的消息</li><li>特殊字符作为边界</li><li>自定义消息结构</li></ul><h4>固定长度消息</h4>这种是最简单方法，即每个用户消息都是固定长度的，比如规定一个消息的长度是 64 个字节，当接收方接满 64 个字节，就认为这个内容是一个完整且有效的消息。但是这种方式灵活性不高，实际中很少用。<h4>特殊字符作为边界</h4>我们可以在两个用户消息之间插入一个特殊的字符串，这样接收方在接收数据时，读到了这个特殊字符，就把认为已经读完一个完整的消息。HTTP 是一个非常好的例子。HTTP通过设置回车符、换行符作为HTTP报文的边界，如果刚好消息内容里有这个特殊字符，我们要对这个特殊字符进行转义，避免被接收方当做消息的边界点儿解析到无效的数据。<h4>自定义消息结构</h4>我们可以自定义一个消息结构，由包头和数据组成，其中包头包是固定大小的，而且包头里有一个字段来说明紧随其后的数据有多大。比如这个消息结构体，首先 4 个字节大小的变量来表示数据长度，真正的数据则在后面。<pre><code class="lang-c">struct { 
 u_int32_t message_length; 
 char message_data[]; 
} message;</code></pre>当接收方接收到包头的大小（比如 4 个字节）后，就解析包头的内容，于是就可以知道数据的长度，然后接下来就继续读取数据，直到读满数据的长度，就可以组装成一个完整到用户消息来处理了。<h2>TCP Keepalive 和 HTTP Keep-Alive 是一个东西吗？</h2>TCP Keepalive 和 HTTP Keep-A这是个好问题，应该有不少人都会搞混，因为这两个东西看上去太像了，很容易误以为是同一个东西。事实上，这两个完全是两样不同东西，实现的层面也不同：<ul><li>HTTP 的 Keep-Alive，是由应用层（用户态） 实现的，称为 HTTP 长连接；</li><li>TCP 的 Keepalive，是由 TCP 层（内核态） 实现的，称为 TCP 保活机制；</li></ul>接下来，分别说说它们。ive 是一个东西吗？<h3>HTTP 的 Keep-Alive</h3>HTTP 协议采用的是「请求-应答」的模式，也就是客户端发起了请求，服务端才会返回响应，一来一回这样子。由于 HTTP 是基于 TCP 传输协议实现的，客户端与服务端要进行 HTTP 通信前，需要先建立 TCP 连接，然后客户端发送 HTTP 请求，服务端收到后就返回响应，至此「请求-应答」的模式就完成了，随后就会释放 TCP 连接。如果每次请求都要经历这样的过程：建立 TCP -&gt; 请求资源 -&gt; 响应资源 -&gt; 释放连接，那么此方式就是 HTTP 短连接，如下图：这样实在太累人了，一次连接只能请求一次资源。能不能在第一个 HTTP 请求完后，先不断开 TCP 连接，让后续的 HTTP 请求继续使用此连接？当然可以，HTTP 的 Keep-Alive 就是实现了这个功能，可以使用同一个 TCP 连接来发送和接收多个 HTTP 请求/应答，避免了连接建立和释放的开销，这个方法称为 HTTP 长连接。<img src="https://z1.ax1x.com/2023/10/18/piPRKjs.png" alt="" title=""style="">HTTP 长连接的特点是，只要任意一端没有明确提出断开连接，则保持 TCP 连接状态。怎么才能使用 HTTP 的 Keep-Alive 功能？在 HTTP 1.0 中默认是关闭的，如果浏览器要开启 Keep-Alive，它必须在请求的包头中添加：<pre><code class="lang-text">Connection: Keep-Alive</code></pre>然后当服务器收到请求，作出回应的时候，它也添加一个头在响应中：<pre><code class="lang-text">Connection: Keep-Alive</code></pre>这样做，连接就不会中断，而是保持连接。当客户端发送另一个请求时，它会使用同一个连接。这一直继续到客户端或服务器端提出断开连接。从 HTTP 1.1 开始， 就默认是开启了 Keep-Alive，如果要关闭 Keep-Alive，需要在 HTTP 请求的包头里添加：<pre><code class="lang-text">Connection:close</code></pre>现在大多数浏览器都默认是使用 HTTP/1.1，所以 Keep-Alive 都是默认打开的。一旦客户端和服务端达成协议，那么长连接就建立好了。HTTP 长连接不仅仅减少了 TCP 连接资源的开销，而且这给 HTTP 流水线技术提供了可实现的基础。所谓的 HTTP 流水线，是客户端可以先一次性发送多个请求，而在发送过程中不需先等待服务器的回应，可以减少整体的响应时间。<img src="https://z1.ax1x.com/2023/10/18/piPR8EV.png" alt="" title=""style="">但是服务器还是按照顺序响应，先回应 A 请求，完成后再回应 B 请求。而且要等服务器响应完客户端第一批发送的请求后，客户端才能发出下一批的请求，也就说如果服务器响应的过程发生了阻塞，那么客户端就无法发出下一批的请求，此时就造成了「队头阻塞」的问题。可能有的同学会问，如果使用了 HTTP 长连接，如果客户端完成一个 HTTP 请求后，就不再发起新的请求，此时这个 TCP 连接一直占用着不是挺浪费资源的吗？对没错，所以为了避免资源浪费的情况，web 服务软件一般都会提供 <code>keepalive_timeout</code> 参数，用来指定 HTTP 长连接的超时时间。比如设置了 HTTP 长连接的超时时间是 60 秒，web 服务软件就会启动一个定时器，如果客户端在完后一个 HTTP 请求后，在 60 秒内都没有再发起新的请求，定时器的时间一到，就会触发回调函数来释放该连接。<h3>TCP的Keepalive</h3>TCP 的 Keepalive 这东西其实就是 TCP 的保活机制，它的工作原理我之前的文章写过，这里就直接贴下以前的内容。如果两端的 TCP 连接一直没有数据交互，达到了触发 TCP 保活机制的条件，那么内核里的 TCP 协议栈就会发送探测报文。<ul><li>如果对端程序是正常工作的。当 TCP 保活的探测报文发送给对端, 对端会正常响应，这样 TCP 保活时间会被重置，等待下一个 TCP 保活时间的到来。</li><li>如果对端主机宕机（注意不是进程崩溃，进程崩溃后操作系统在回收进程资源的时候，会发送 FIN 报文，而主机宕机则是无法感知的，所以需要 TCP 保活机制来探测对方是不是发生了主机宕机），或对端由于其他原因导致报文不可达。当 TCP 保活的探测报文发送给对端后，石沉大海，没有响应，连续几次，达到保活探测次数后，TCP 会报告该 TCP 连接已经死亡。</li></ul>所以，TCP 保活机制可以在双方没有数据交互的情况，通过探测报文，来确定对方的 TCP 连接是否存活，这个工作是在内核完成的。注意，应用程序若想使用 TCP 保活机制需要通过 socket 接口设置 <code>SO_KEEPALIVE</code> 选项才能够生效，如果没有设置，那么就无法使用 TCP 保活机制。<h3>总结</h3>HTTP 的 Keep-Alive 也叫 HTTP 长连接，该功能是由「应用程序」实现的，可以使得用同一个 TCP 连接来发送和接收多个 HTTP 请求/应答，减少了 HTTP 短连接带来的多次 TCP 连接建立和释放的开销。TCP 的 Keepalive 也叫 TCP 保活机制，该功能是由「内核」实现的，当客户端和服务端长达一定时间没有进行数据交互时，内核为了确保该连接是否还有效，就会发送探测报文，来检测对方是否还在线，然后来决定是否要关闭该连接。

小林TCP常见问题

小林TCP常见问题

如何理解是 TCP 面向字节流协议？如何理解字节流？

如何解决粘包

固定长度消息

特殊字符作为边界

自定义消息结构

TCP Keepalive 和 HTTP Keep-Alive 是一个东西吗？

HTTP 的 Keep-Alive

TCP的Keepalive

总结

Leave a Comment Cancel reply

那些底层使用了Rocksdb的项目

docker常用命令

postForObject发送参数接方一直为null

js基础

git的常用命令

LockSupport分析

R树

Redis内存优化

基于带宽分割rope Transformer的音源分离

小林 HTTPS ECDHE握手解析

小林TCP常见问题