Netty的TCP粘包/拆包问题的解决之道

有过TCP编程的开发者都可能直到,无论是服务端还是客户端,当我们读取或者发送消息的时候,都需要考虑TCP底层的粘包/拆包机制,那么什么是TCP粘包和拆包问题呢?那么就请看下面吧.

TCP粘包/拆包

TCP是个”流”协议,所谓流,就是没有界限的一串数据,大家可以想想河里的流水,他们是连成一片的,其间没有分界线,TCP底层并不了解上层业务数据的具体含义,它会根据TCP缓冲区的实际情况进行化包的划分,所以在业务上认为,一个完整的包可能会被TCP拆成多个包进行发送,也有多个小的包封装成一个大的数据包发送,这就是所谓的TCP粘包和拆包问题.

TCP粘包/拆包问题说明

我们可以通过图解对TCP粘包和拆包问题进行说明,粘包问题实例如下图:
TCP粘包-拆包发生的原因.png-7kB
假设客户端分别发送了两个数据包D1和D2给服务器,由于服务端一次读取到的字节数是不确定的,故可能存在以下的4种请况.

1. 服务端分两次读取到两个独立的数据包,分别是D1和D2,没有粘包和拆包
2. 服务端一次接收到了两个数据包,D1和D2粘合在一起,被称为TCP粘包
3. 服务端分两次读取到两个数据包,第一次读取到了完整的D1包和D2包的部分内容,第二次读取了D2的剩余内容,这被称为TCP拆包
4. 服务段分两次读取到了两个数据包,第一次读取到了D1包的部分内容D1_1,第二次读取到了D1包剩余的内容D1_2和D2包的整包.

如果此时服务端TCP接收滑窗口非常小,而数据包D1和D2比较大,很有可能会发生第5种可能,即服务端分多次才能将D1和D2包接收完全,期间发生多次拆包.

TCP粘包/拆包发生的原因

问题产生的原因有三个,分别如下:

  1. 应用程序write写入的字节大小大于套接口发送缓冲区的大小;
  2. 进行MSS大小的TCP分段;
  3. 以太网帧的payload大于MTU进行IP分片

如下图:
TCP粘包-拆包问题原因.png-28kB

粘包问题的解决策略

由于底层的TCP无法理解上层的业务数据,所以在底层是无法保证数据包不被拆分和重组的,这个问题只能通过上层的应用协议栈设计来解决,根据业界的主流协议的解决方案,可以归纳如下:

  1. 消息定长,例如每个报文的大小为固定长度200字节,如果不够,空位不空格;
  2. 在包尾增加回车换行符进行分割,例如FTP协议
  3. 将消息分为消息头和消息体,消息头中包含表示消息总长度(或者消息体长度)
    的字段,通常设计思路为消息头的第一个字段使用int32来表示消息的总长度.
  4. 更复杂的应用层协议

Netty的解决方案

Netty为了解决TCP粘包和拆包导致的半包读写问题,提供了多种的编码解码器用于处理半包,只要能够熟练的掌握这些类库的使用,TCP粘包问题就可以变得非常容易,这个就是其他NIO框架和JDK原生的NIO API无法匹敌的.

利用LineBasedFrameDecoder解决TCP粘包问题

在原来的代码中增加两个解码器: LineBasedFrameDecoder 和 StringDecoder, 这个两个类的个个的功能如下面的原理可所分析的.
LineBasedFrameDecoder和StringDecoder的原理分析
LineBasedFrameDecoder的工作原理是它依次遍历ByteBuf中的可读字节
判断是否有”\n” 或者”\r\n”, 如果有,就以此位置为结束位置,从可读索引到结束
位置区间的字节就组成了一行.
它是以换行符为结束标志的解码器, 支持携带结束符或者不携带结束符两种解码方式,同时支持配置单行的最大长度
如果连续读取到最大长度之后,仍然没有发现换行符就会抛出异常,同时忽略掉之前读到的异常码流.
StringDecoder的功能非常简单,就是将接收到的对象换成字符串,然后继续调用后面的Handller LineBasedFrameDecoder + StringDecoder组合就是按行切换的文本解码器,它被设计用来支持TCP的粘包和拆包

如果发送的消息不是以换行符结束的,该怎么办呢?或者没有回车换行符,靠消息头中的长度字符来分段分包怎么办呢?是不是需要自己写半包解码器呢?

其实Netty提供了多种支持TCP粘包/拆包的解码器,用来满足不同的诉求.

分隔符和定长解码器的应用

TCP以流的方法,进行数据传输,上层的应用协议为了堆消息进行区分,往往采用如下的4中方式:

  1. 消息长度固定,累计读取到长度总和为定长LEN的报文后,就认为读取到了一个完整的消息,将技术器置位,重新开始读取下一个数据报.
  2. 将回车换行作为消息多结束符,例如:FTP协议,这种方式在文本协议中应用比较广泛;
  3. 将特殊的分隔符作为消息的结束标志.回车换行符就是一种特殊的结束分隔符
  4. 通过在消息头中定义长度字段来表示消息的总长度.

Netty对上面的4种应用做了统一的抽象,提供了4种解码器来解决对应的问题,使用起来非常方便,有了这些解码器,用户不需要自己对读取的报文进行人工解码,也不需要考虑TCP的粘包和拆包.

坚持原创技术分享,您的支持将鼓励我继续创作!