當前位置:首頁 > 公眾號精選 > 程序員小灰
[導讀]你是一臺電腦,你的名字叫 A 只要你知道另一位伙伴 B 的 IP 地址,且你們之間的網(wǎng)絡是通的,無論多遠,你都可以將一個數(shù)據(jù)包發(fā)送給你的伙伴 B 這就是物理層、數(shù)據(jù)鏈路層、網(wǎng)絡層這三層所做的事情。

你是一臺電腦,你的名字叫 A

只要你知道另一位伙伴 B 的 IP 地址,且你們之間的網(wǎng)絡是通的,無論多遠,你都可以將一個數(shù)據(jù)包發(fā)送給你的伙伴 B

這就是物理層、數(shù)據(jù)鏈路層、網(wǎng)絡層這三層所做的事情。 站在第四層的你,就可以不要臉地利用下三層所做的鋪墊,隨心所欲地發(fā)送數(shù)據(jù),而不必擔心找不到對方了。

雖然你此時還什么都沒干,但你還是給自己這一層起了個響亮的名字,叫做傳輸層。 你本以為自己所在的第四層萬事大吉,啥事沒有,但很快問題就接踵而至。

問題來了

前三層協(xié)議只能把數(shù)據(jù)包從一個主機搬到另外一臺主機,但是,到了目的地以后,數(shù)據(jù)包具體交給哪個程序(進程)呢?

所以,你需要把通信的進程區(qū)分開來,于是就給每個進程分配一個數(shù)字編號,你給它起了一個響亮的名字:端口號

然后你在要發(fā)送的數(shù)據(jù)包上,增加了傳輸層的頭部,源端口號目標端口號。


OK,這樣你將原本主機到主機的通信,升級為了進程和進程之間的通信 你沒有意識到,你不知不覺實現(xiàn)了 UDP 協(xié)議! (當然 UDP 協(xié)議中不光有源端口和目標端口,還有數(shù)據(jù)包長度和校驗值,我們暫且略過) 就這樣,你用 UDP 協(xié)議無憂無慮地同 B 進行著通信,一直沒發(fā)生什么問題。

但很快,你發(fā)現(xiàn)事情變得非常復雜......

丟包問題

由于網(wǎng)絡的不可靠,數(shù)據(jù)包可能在半路丟失,而 A 和 B 卻無法察覺。

對于丟包問題,只要解決兩個事就好了。 第一個,A 怎么知道包丟了? 答案:讓 B 告訴 A 第二個,丟了的包怎么辦? 答案:重傳 于是你設計了如下方案,A 每發(fā)一個包,都必須收到來自 B 的確認(ACK),再發(fā)下一個,否則在一定時間內(nèi)沒有收到確認,就重傳這個包。

你管它叫停止等待協(xié)議。只要按照這個協(xié)議來,雖然 A 無法保證 B 一定能收到包,但 A 能夠確認 B 是否收到了包,收不到就重試,盡最大努力讓這個通信過程變得可靠,于是你們現(xiàn)在的通信過程又有了一個新的特征,可靠交付

效率問題

停止等待雖然能解決問題,但是效率太低了,A 原本可以在發(fā)完第一個數(shù)據(jù)包之后立刻開始發(fā)第二個數(shù)據(jù)包,但由于停止等待協(xié)議,A 必須等數(shù)據(jù)包到達了 B ,且 B 的 ACK 包又回到了 A,才可以繼續(xù)發(fā)第二個數(shù)據(jù)包,這效率慢得可不是一點兩點。 于是你對這個過程進行了改進,采用流水線的方式,不再傻傻地等。

順序問題

但是網(wǎng)路是復雜的、不可靠的。 有的時候 A 發(fā)出去的數(shù)據(jù)包,分別走了不同的路由到達 B,可能無法保證和發(fā)送數(shù)據(jù)包時一樣的順序。

在流水線中有多個數(shù)據(jù)包和ACK包在亂序流動,他們之間對應關系就亂掉了。 難道還回到停止等待協(xié)議?A 每收到一個包的確認(ACK)再發(fā)下一個包,那就根本不存在順序問題。應該有更好的辦法! A 在發(fā)送的數(shù)據(jù)包中增加一個序號(seq),同時 B 要在 ACK 包上增加一個確認號(ack),這樣不但解決了停止等待協(xié)議的效率問題,也通過這樣標序號的方式解決了順序問題。

而 B 這個確認號意味深長:比如 B 發(fā)了一個確認號為 ack = 3,它不僅僅表示 A 發(fā)送的序號為 2 的包收到了,還表示 2 之前的數(shù)據(jù)包都收到了。這種方式叫累計確認累計應答

注意,實際上 ack 的號是收到的最后一個數(shù)據(jù)包的序號 seq + 1,也就是告訴對方下一個應該發(fā)的序號是多少。但圖中為了便于理解,ack 就表示收到的那個序號,不必糾結。

流量問題

有的時候,A 發(fā)送數(shù)據(jù)包的速度太快,而 B 的接收能力不夠,但 B 卻沒有告知 A 這個情況。

怎么解決呢? 很簡單,B 告訴 A 自己的接收能力,A 根據(jù) B 的接收能力,相應控制自己的發(fā)送速率,就好了。 B 怎么告訴 A 呢?B 跟 A 說"我很強"這三個字么?那肯定不行,得有一個嚴謹?shù)囊?guī)范。 于是 B 決定,每次發(fā)送數(shù)據(jù)包給 A 時,順帶傳過來一個值,叫窗口大小(win),這個值就表示 B 的接收能力。同理,每次 A 給 B 發(fā)包時也帶上自己的窗口大小,表示 A 的接收能力。

B 告訴了 A 自己的窗口大小值,A 怎么利用它去做 A 這邊發(fā)包的流量控制呢? 很簡單,假如 B 給 A 傳過來的窗口大小 win = 5,那 A 根據(jù)這個值,把自己要發(fā)送的數(shù)據(jù)分成這么幾類。

圖片過于清晰,就不再文字解釋了。 當 A 不斷發(fā)送數(shù)據(jù)包時,已發(fā)送的最后一個序號就往右移動,直到碰到了窗口的上邊界,此時 A 就無法繼續(xù)發(fā)包,達到了流量控制。

但是當 A 不斷發(fā)包的同時,A 也會收到來自 B 的確認包,此時整個窗口會往右移動,因此上邊界也往右移動,A 就能發(fā)更多的數(shù)據(jù)包了。

以上都是在窗口大小不變的情況下,而 B 在發(fā)給 A 的 ACK 包中,每一個都可以重新設置一個新的窗口大小,如果 A 收到了一個新的窗口大小值,A 會隨之調整。 如果 A 收到了比原窗口值更大的窗口大小,比如 win = 6,則 A 會直接將窗口上邊界向右移動 1 個單位。

如果 A 收到了比原窗口值小的窗口大小,比如 win = 4,則 A 暫時不會改變窗口大小,更不會將窗口上邊界向左移動,而是等著 ACK 的到來,不斷將左邊界向右移動,直到窗口大小值收縮到新大小為止。

OK,終于將流量控制問題解決得差不多了,你看著上面一個個小動圖,給這個窗口起了一個更生動的名字,滑動窗口。

擁塞問題

但有的時候,不是 B 的接受能力不夠,而是網(wǎng)絡不太好,造成了網(wǎng)絡擁塞。

擁塞控制與流量控制有些像,但流量控制是受 B 的接收能力影響,而擁塞控制是受網(wǎng)絡環(huán)境的影響。 擁塞控制的解決辦法依然是通過設置一定的窗口大小,只不過,流量控制的窗口大小是 B 直接告訴 A 的,而擁塞控制的窗口大小按理說就應該是網(wǎng)絡環(huán)境主動告訴 A。 但網(wǎng)絡環(huán)境怎么可能主動告訴 A 呢?只能 A 單方面通過試探,不斷感知網(wǎng)絡環(huán)境的好壞,進而確定自己的擁塞窗口的大小。

擁塞窗口大小的計算有很多復雜的算法,就不在本文中展開了,假如擁塞窗口的大小為  cwnd,上一部分流量控制的滑動窗口的大小為 rwnd,那么窗口的右邊界受這兩個值共同的影響,需要取它倆的最小值。 窗口大小 = min(cwnd, rwnd) 含義很容易理解,當 B 的接受能力比較差時,即使網(wǎng)絡非常通暢,A 也需要根據(jù) B 的接收能力限制自己的發(fā)送窗口。當網(wǎng)絡環(huán)境比較差時,即使 B 有很強的接收能力,A 也要根據(jù)網(wǎng)絡的擁塞情況來限制自己的發(fā)送窗口。正所謂受其短板的影響嘛~

連接問題

有的時候,B 主機的相應進程還沒有準備好或是掛掉了,A 就開始發(fā)送數(shù)據(jù)包,導致了浪費。

這個問題在于,A 在跟 B 通信之前,沒有事先確認 B 是否已經(jīng)準備好,就開始發(fā)了一連串的信息。就好比你和另一個人打電話,你還沒有"喂"一下確認對方有沒有在聽,你就巴拉巴拉說了一堆。 這個問題該怎么解決呢? 地球人都知道,三次握手嘛!

A:我準備好了(SYN)

B:我知道了(ACK),我也準備好了(SYN)

A:我知道了(ACK)


A 與 B 各自在內(nèi)存中維護著自己的狀態(tài)變量,三次握手之后,雙方的狀態(tài)都變成了連接已建立(ESTABLISHED)。 雖然就只是發(fā)了三次數(shù)據(jù)包,并且在各自的內(nèi)存中維護了狀態(tài)變量,但這么說總覺得太 low,你看這個過程相當于雙方建立連接的過程,于是你靈機一動,就叫它面向連接吧。 注意:這個連接是虛擬的,是由 A 和 B 這兩個終端共同維護的,在網(wǎng)絡中的設備根本就不知道連接這回事兒! 但凡事有始就有終,有了建立連接的過程,就要考慮釋放連接的過程,又是地球人都知道,四次揮手嘛!

A:再見,我要關閉了(FIN)

B:我知道了(ACK)

給 B 一段時間把自己的事情處理完...

B:再見,我要關閉了(FIN)

A:我知道了(ACK)



總結

以上講述的,就是 TCP 協(xié)議的核心思想,上面過程中需要傳輸?shù)男畔?,就體現(xiàn)在 TCP 協(xié)議的頭部,這里放上最常見的 TCP 協(xié)議頭解讀的圖。

不知道你現(xiàn)在再看下面這句話,是否能理解: TCP 是 面向連接的、可靠的、基于字節(jié)流的 傳輸層通信協(xié)議 面向連接、可靠,這兩個詞通過上面的講述很容易理解,那什么叫做基于字節(jié)流呢? 很簡單,TCP 在建立連接時,需要告訴對方 MSS(最大報文段大?。?。 也就是說,如果要發(fā)送的數(shù)據(jù)很大,在 TCP 層是需要按照 MSS 來切割成一個個的 TCP 報文段 的。 切割的時候我才不管你原來的數(shù)據(jù)表示什么意思,需要在哪里斷句啥的,我就把它當成一串毫無意義的字節(jié),在我想要切割的地方咔嚓就來一刀,標上序號,只要接收方再根據(jù)這個序號拼成最終想要的完整數(shù)據(jù)就行了。 在我 TCP 傳輸這里,我就把它當做一個個的字節(jié),也就是基于字節(jié)流的含義了。

最后留給大家一個作業(yè),模擬 A 與 B 建立一個 TCP 連接。

第一題:A 給 B 發(fā)送 "aaa" ,然后 B 給 A 回復一個簡單的字符串 "success",并將此過程抓包。

第二題:A 給 B 發(fā)送 "aaaaaa ... a" 超過最大報文段大小,然后 B 給 A 回復一個簡單的字符串 "success",并將此過程抓包。

下面是我抓的包(第二題)

三次握手階段

A -> B [SYN] Seq=0 Win=64240 Len=0

MSS=1460 WS=256

B - >A [SYN, ACK] Seq=0 Ack=1 Win=29200 Len=0

MSS=1424 WS=512

A -> B [ACK] Seq=1 Ack=1 Win=132352 Len=0

數(shù)據(jù)發(fā)送階段

A -> B [ACK] Seq=1 Ack=1 Win=132352 Len=1424

A -> B [ACK] Seq=1425 Ack=1 Win=132352 Len=1424

A -> B [PSH, ACK] Seq=2849 Ack=1 Win=132352 Len=1247

B -> A [ACK] Seq=1 Ack=1425 Win=32256 Len=0

B -> A [ACK] Seq=1 Ack=2849 Win=35328 Len=0

B -> A [ACK] Seq=1 Ack=4096 Win=37888 Len=0

B -> A [PSH, ACK] Seq=1 Ack=4096 Win=37888 Len=7

四次揮手階段

B -> A [FIN, ACK] Seq=8 Ack=4096 Win=37888 Len=0

A -> B [ACK] Seq=4096 Ack=9 Win=132352 Len=0

A -> B [FIN, ACK] Seq=4096 Ack=9 Win=132352 Len=0(下面少復制了一行ACK,抱歉)
后記
一提到 TCP,可能很多人都想起被三次握手和四次揮手所支配的恐懼。但其實你跟著文中的思路你就會發(fā)現(xiàn),三次握手與四次揮手只占 TCP 所解決的核心問題中很小的一部分,只是因為它在面試中很適合作為知識點進行考察,所以在很多人的印象中就好像 TCP 的核心就是握手和揮手似的。
本文希望你能從問題出發(fā),真正理解 TCP 所想要解決的問題,你會發(fā)現(xiàn)很多原理就好像生活常識一樣順其自然,并不復雜,希望你有收獲~


免責聲明:本文內(nèi)容由21ic獲得授權后發(fā)布,版權歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉