1. 背鍋俠 TCP
在前面介紹套接字通信的時(shí)候說到了 TCP 是傳輸層協(xié)議,它是一個(gè)面向連接的、安全的、流式傳輸協(xié)議。因?yàn)閿?shù)據(jù)的傳輸是基于流的所以發(fā)送端和接收端每次處理的數(shù)據(jù)的量,處理數(shù)據(jù)的頻率可以不是對(duì)等的,可以按照自身需求來(lái)進(jìn)行決策。TCP 協(xié)議是優(yōu)勢(shì)非常明顯,但是有時(shí)也會(huì)給我們?cè)斐衫_,正所謂:成也蕭何敗蕭何。假設(shè)我們有如下需求:
客戶端和服務(wù)器之間要進(jìn)行基于 TCP 的套接字通信- 通信過程中客戶端會(huì)每次會(huì)不定期給服務(wù)器發(fā)送一個(gè)不定長(zhǎng)度的有特定含義的字符串。
- 通信的服務(wù)器端每次都需要接收到客戶端這個(gè)不定長(zhǎng)度的字符串,并對(duì)其進(jìn)行解析。
根據(jù)上面的描述,服務(wù)器在接收數(shù)據(jù)的時(shí)候有如下幾種情況:
- 一次接收到了客戶端發(fā)送過來(lái)的一個(gè)完整的數(shù)據(jù)包
- 一次接收到了客戶端發(fā)送過來(lái)的 N 個(gè)數(shù)據(jù)包,由于每個(gè)包的長(zhǎng)度不定,無(wú)法將各個(gè)數(shù)據(jù)包拆開
- 一次接收到了一個(gè)或者 N 個(gè)數(shù)據(jù)包 下一個(gè)數(shù)據(jù)包的一部分,還是很悲劇,無(wú)法將數(shù)據(jù)包拆開
- 一次收到了半個(gè)數(shù)據(jù)包,下一次接收數(shù)據(jù)的時(shí)候收到了剩下的一部分 下個(gè)數(shù)據(jù)包的一部分,更悲劇,頭大了
- 另外,還有一些不可抗拒的因素:比如客戶端和服務(wù)器端的網(wǎng)速不一樣,發(fā)送和接收的數(shù)據(jù)量也會(huì)不一致
對(duì)于以上描述的現(xiàn)象很多時(shí)候我們將其稱之為 TCP的粘包問題,但是這種叫法不太對(duì)的,本身 TCP 就是面向連接的流式傳輸協(xié)議,特性如此,我們卻說是 TCP 這個(gè)協(xié)議出了問題,這只能說是使用者的無(wú)知。多個(gè)數(shù)據(jù)包粘連到一起無(wú)法拆分是我們的需求過于復(fù)雜造成的,是程序猿的問題而不是協(xié)議的問題,TCP 協(xié)議表示這鍋它不想背。現(xiàn)在問題來(lái)了,服務(wù)器端如果想保證每次都能接收到客戶端發(fā)送過來(lái)的這個(gè)不定長(zhǎng)度的數(shù)據(jù)包,程序猿應(yīng)該如何解決這個(gè)問題呢?下面給大家提供幾種解決方案:
- 使用標(biāo)準(zhǔn)的應(yīng)用層協(xié)議(比如:http、https)來(lái)封裝要傳輸?shù)牟欢ㄩL(zhǎng)的數(shù)據(jù)包
- 在每條數(shù)據(jù)的尾部添加特殊字符,如果遇到特殊字符,代表當(dāng)條數(shù)據(jù)接收完畢了
- 有缺陷:效率低,需要一個(gè)字節(jié)一個(gè)字節(jié)接收,接收一個(gè)字節(jié)判斷一次,判斷是不是那個(gè)特殊字符串
- 在發(fā)送數(shù)據(jù)塊之前,在數(shù)據(jù)塊最前邊添加一個(gè)固定大小的數(shù)據(jù)頭,這時(shí)候數(shù)據(jù)由兩部分組成:數(shù)據(jù)頭 數(shù)據(jù)塊
- 數(shù)據(jù)頭:存儲(chǔ)當(dāng)前數(shù)據(jù)包的總字節(jié)數(shù),接收端先接收數(shù)據(jù)頭,然后在根據(jù)數(shù)據(jù)頭接收對(duì)應(yīng)大小的字節(jié)
- 數(shù)據(jù)塊:當(dāng)前數(shù)據(jù)包的內(nèi)容
2. 解決方案
如果使用
TCP 進(jìn)行套接字通信,如果發(fā)送的數(shù)據(jù)包粘連到一起導(dǎo)致接收端無(wú)法解析,我們通常使用添加包頭的方式輕松地解決掉這個(gè)問題。關(guān)于數(shù)據(jù)包的包頭大小可以根據(jù)自己的實(shí)際需求進(jìn)行設(shè)定,這里沒有啥特殊需求,因此規(guī)定包頭的固定大小為4個(gè)字節(jié),用于存儲(chǔ)當(dāng)前數(shù)據(jù)塊的總字節(jié)數(shù)。
2.1 發(fā)送端
對(duì)于發(fā)送端來(lái)說,數(shù)據(jù)的發(fā)送分為 4 步:
- 根據(jù)待發(fā)送的數(shù)據(jù)長(zhǎng)度 N 動(dòng)態(tài)申請(qǐng)一塊固定大小的內(nèi)存:N 4(4 是包頭占用的字節(jié)數(shù))
- 將待發(fā)送數(shù)據(jù)的總長(zhǎng)度寫入申請(qǐng)的內(nèi)存的前四個(gè)字節(jié)中,此處需要將其轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)序(大端)
- 將待發(fā)送的數(shù)據(jù)拷貝到包頭后邊的地址空間中,將完整的數(shù)據(jù)包發(fā)送出去(字符串沒有字節(jié)序問題)
- 釋放申請(qǐng)的堆內(nèi)存。
由于發(fā)送端每次都需要將這個(gè)數(shù)據(jù)包完整的發(fā)送出去,因此可以設(shè)計(jì)一個(gè)發(fā)送函數(shù),如果當(dāng)前數(shù)據(jù)包中的數(shù)據(jù)沒有發(fā)送完就讓它一直發(fā)送,處理代碼如下:
/*
函數(shù)描述:?發(fā)送指定的字節(jié)數(shù)
函數(shù)參數(shù):
????-?fd:?通信的文件描述符(套接字)
????-?msg:?待發(fā)送的原始數(shù)據(jù)
????-?size:?待發(fā)送的原始數(shù)據(jù)的總字節(jié)數(shù)
函數(shù)返回值:?函數(shù)調(diào)用成功返回發(fā)送的字節(jié)數(shù),?發(fā)送失敗返回-1
*/
int?writen(int?fd,?const?char*?msg,?int?size)
{
????const?char*?buf?=?msg;
????int?count?=?size;
????while?(count?>?0)
????{
????????int?len?=?send(fd,?buf,?count,?0);
????????if?(len?==?-1)
????????{
????????????close(fd);
????????????return?-1;
????????}
????????else?if?(len?==?0)
????????{
????????????continue;
????????}
????????buf? =?len;
????????count?-=?len;
????}
????return?size;
}
有了這個(gè)功能函數(shù)之后就可以發(fā)送帶有包頭的數(shù)據(jù)塊了,具體處理動(dòng)作如下:
/*
函數(shù)描述:?發(fā)送帶有數(shù)據(jù)頭的數(shù)據(jù)包
函數(shù)參數(shù):
????-?cfd:?通信的文件描述符(套接字)
????-?msg:?待發(fā)送的原始數(shù)據(jù)
????-?len:?待發(fā)送的原始數(shù)據(jù)的總字節(jié)數(shù)
函數(shù)返回值:?函數(shù)調(diào)用成功返回發(fā)送的字節(jié)數(shù),?發(fā)送失敗返回-1
*/
int?sendMsg(int?cfd,?char*?msg,?int?len)
{
???if(msg?==?NULL?||?len?<=?0?||?cfd?<=0)
???{
???????return?-1;
???}
???//?申請(qǐng)內(nèi)存空間:?數(shù)據(jù)長(zhǎng)度? ?包頭4字節(jié)(存儲(chǔ)數(shù)據(jù)長(zhǎng)度)
???char*?data?=?(char*)malloc(len 4);
???int?bigLen?=?htonl(len);
???memcpy(data,?