當前位置:首頁 > 公眾號精選 > 架構師社區(qū)
[導讀]前言看到這個標題你可能會說,TCP連接的建立與斷開,這個我熟,不就是三次握手與四次揮手嗎?且慢,腦海中可以先嘗試回答這幾個問題:四次揮手是誰發(fā)起的?如果斷電/斷網(wǎng)了連接會斷開嗎?什么情況下沒有四次揮手連接也會斷開?這不是面試,而是遇到了實際問題,至于是什么問題,容我先賣個關子,本...

前言

看到這個標題你可能會說,TCP 連接的建立與斷開,這個我熟,不就是三次握手與四次揮手嗎?且慢,腦海中可以先嘗試回答這幾個問題:

  • 四次揮手是誰發(fā)起的?
  • 如果斷電/斷網(wǎng)了連接會斷開嗎?
  • 什么情況下沒有四次揮手連接也會斷開?
這不是面試,而是遇到了實際問題,至于是什么問題,容我先賣個關子,本文也不會解答,后面會有一篇專門的文章來說遇到的問題是啥,所以在講實際問題之前,先弄懂理論。

正常斷開

我們由淺入深,先了解正常情況下 TCP 連接是如何斷開的,下圖為 TCP 三次握手與四次揮手的經(jīng)典圖(來自《TCP/IP詳解卷1》)

4個實驗,徹底搞懂TCP連接的斷開
在我們的電腦上,可以使用 python 的 SimpleHTTPServer 來快速起一個 http 服務(http 也是基于 TCP 協(xié)議),比如這樣:

python -m SimpleHTTPServer 20880

再通過 nc 或 telnet 這兩個命令來創(chuàng)建 TCP 連接,比如我測試使用 nc 來創(chuàng)建連接

nc -v ip port

Connection to ip port [tcp/*] succeeded! 表示連接成功

4個實驗,徹底搞懂TCP連接的斷開
我們?nèi)绾斡^察這個連接呢?可以通過 netstat 或 lsof ?來查看這條"連接",這里我使用 lsof(mac 與 Linux 系統(tǒng)的 netstat 命令不太一樣,使用起來有點別扭 )

lsof -i:20880

4個實驗,徹底搞懂TCP連接的斷開
無論是客戶端還是服務端都會占用一個端口,不過服務端端口是固定的,客戶端端口是隨機的。

如果我們想看 TCP 連接和斷開時握手揮手的 TCP 報文怎么查看呢?可以使用 tcpdump 命令

三次握手

tcpdump -A -vv -i any -S host 10.179.245.95

為了方便查看,和上面的經(jīng)典圖放在了一起

4個實驗,徹底搞懂TCP連接的斷開
這里的參數(shù)需要提一下的是 -S,如果不加 -S 參數(shù)看到的第三次握手的ack=1,與書上的理論不太一樣,其實這里只是 tcpdump 簡化了展示,想看實際值需要加 -S

這里的 Flags [S]/[S.]/[.]

  • [S] 代表 SYN
  • [.] 代表 ACK,[S.] 就是 SYN ACK

四次揮手

命令與抓三次握手相同,我們抓到如下?lián)]手數(shù)據(jù)

4個實驗,徹底搞懂TCP連接的斷開
  • [F] 代表 FIN
這張圖有點奇怪,四次揮手居然變成了三次,這其實是 TCP 協(xié)議的實現(xiàn)問題,如果第二次與第三次揮手之間沒有數(shù)據(jù)發(fā)送,那么被動斷開連接的一方就可能會把第二次的 ACK 與 第三次的 FIN 合并為一次揮手。

當然我也抓到過正常的四次揮手,大概長這樣

4個實驗,徹底搞懂TCP連接的斷開

異常斷開

上面鋪墊了這么多,現(xiàn)在開始進入正題。

TCP 連接斷開是誰發(fā)起的

我們來思考一個問題:TCP 連接的斷開是誰發(fā)起的?程序本身還是操作系統(tǒng)?

我們來看一段非常簡單的 TCP 連接創(chuàng)建與斷開的代碼

tcpAddr,?_?:=?net.ResolveTCPAddr("tcp",?"127.0.0.1:20880")
conn,?err?:=?net.DialTCP("tcp",?nil,?tcpAddr)
if?err?!=?nil?{
?fmt.Println("Client?connect?error?!?"? ?err.Error())
?return
}

defer?func()?{
?err?:=?conn.Close()
?fmt.Println("Client?connect?closed?!")
?if?err?!=?nil?{
??fmt.Println(err)
?}
}()

fmt.Println(conn.LocalAddr().String()? ?"?:?Client?connected!")
time.Sleep(10?*?time.Second)
運行后,效果如下,也符合我們預期:當程序打印 Client connected! 時,能看到連接,當打印 Client connect closed! 時,連接斷開

4個實驗,徹底搞懂TCP連接的斷開
如果我們在連接斷開前使用 kill -9 強殺進程呢?(這里我用了兩臺電腦來測試)

4個實驗,徹底搞懂TCP連接的斷開
我們發(fā)現(xiàn) conn.Close() 并沒有執(zhí)行,但四次揮手還是發(fā)生了!

查閱資料發(fā)現(xiàn)如下結論:

a、b 兩個正常連接的對端進程。假如 b 進程沒有調(diào)用 close 就異常終止,那么發(fā)送 FIN 包是內(nèi)核 OS 代勞

斷電/斷網(wǎng)時的連接是怎樣斷開的

我們通過上面的實驗發(fā)現(xiàn)就算進程異常終止,操作系統(tǒng)也會幫忙發(fā)起四次揮手

但如果是斷電或斷網(wǎng)的情況下,操作系統(tǒng)就無法代勞了,這時會怎樣呢?為了便于測試,這里用兩臺電腦,client 連接 server,斷開 server 的網(wǎng)絡來模擬斷網(wǎng)斷電情況。

可以肯定的是斷網(wǎng),斷電后,連接不會立即斷開,那么后續(xù)連接是否會斷開呢?我們分成下面幾種情況來看

斷網(wǎng)時有數(shù)據(jù)傳輸

斷網(wǎng)時如果有數(shù)據(jù)發(fā)送,由于收不到 ACK,所以會重試,但并不會無限重試下去,達到一定的重發(fā)次數(shù)之后,如果仍然沒有任何確認應答返回,就會判斷為網(wǎng)絡或者對端主機發(fā)生了異常,強制關閉連接。此時的關閉是直接關閉,而沒有揮手(數(shù)據(jù)都發(fā)不出去,還揮啥手),Linux 下的設置為

最小重傳時間是200ms 最大重傳時間是120s 重傳次數(shù)為15

斷網(wǎng)時沒有數(shù)據(jù)傳輸

斷網(wǎng)時如果沒有數(shù)據(jù)傳輸,還得看 TCP 連接的 KeepAlive 是否打開,關于 TCP 的 KeepAlive 簡介如下:

  • TCP KeepAlive 是一種在不影響數(shù)據(jù)流內(nèi)容的情況下探測對方的方式,采用 保活計時器實現(xiàn),當計時器被觸發(fā)時,一端發(fā)送?;顖笪?,另一端接收到報文后發(fā)送 ACK 響應
  • 它并不是 TCP 的規(guī)范,但大部分的實現(xiàn)都提供了這一機制
  • 該機制存在爭議,有的人?;顧C制應該在應用程序中實現(xiàn)

開啟KeepAlive

操作系統(tǒng)中有這么幾個參數(shù)控制 KeepAlive 的配置:

  • Keepalive_time:空閑時間,即多長時間連接沒有發(fā)送數(shù)據(jù)時開始 KeepAlive 檢測
  • Keepalive_intvl:發(fā)送間隔時間,即上述代碼的設置
  • Keepalive_probs:最多發(fā)送多少個檢測數(shù)據(jù)包
在 Linux 上可以通過如下文件查看

cat?/proc/sys/net/ipv4/tcp_keepalive_time
cat?/proc/sys/net/ipv4/tcp_keepalive_intvl
cat?/proc/sys/net/ipv4/tcp_keepalive_probes
4個實驗,徹底搞懂TCP連接的斷開
如果按照這個默認值來看,得2小時沒有數(shù)據(jù)傳輸,KeepAlive 才開始工作!

而在 Go 中只有兩個參數(shù)可以設置:

conn.SetKeepAlive(true)
conn.SetKeepAlivePeriod(5?*?time.Second)
其中第二個 SetKeepAlivePeriod 源碼是這樣的:

func?setKeepAlivePeriod(fd?*netFD,?d?time.Duration)?error?{
?//?The?kernel?expects?seconds?so?round?to?next?highest?second.
?secs?:=?int(roundDurationUp(d,?time.Second))
?if?err?:=?fd.pfd.SetsockoptInt(syscall.IPPROTO_TCP,?sysTCP_KEEPINTVL,?secs);?err?!=?nil?{
??return?wrapSyscallError("setsockopt",?err)
?}
?err?:=?fd.pfd.SetsockoptInt(syscall.IPPROTO_TCP,?syscall.TCP_KEEPALIVE,?secs)
?runtime.KeepAlive(fd)
?return?wrapSyscallError("setsockopt",?err)
}
SetKeepAlivePeriod 的參數(shù)同時設置了 tcp_keepalive_intvl 和 tcp_keepalive_time,tcp_keepalive_probes 沒法設置

做個簡單測試:client 開啟 KeepAlive 連接 server 后,什么數(shù)據(jù)都不發(fā)送,把server 的網(wǎng)斷掉,可以看到 KeepAlive 心跳包,一段時間后連接被置為 CLOSED 狀態(tài)

4個實驗,徹底搞懂TCP連接的斷開

關閉KeepAlive

關閉 KeepAlive 后,如果沒有數(shù)據(jù)傳輸,連接永遠不會斷開

斷網(wǎng)后 server 重啟再恢復

再思考一個場景,如果 client 與 server 建立連接后,沒有數(shù)據(jù)傳輸,斷掉 server 端的網(wǎng)絡,這時如果把 server 程序重啟一下,再恢復網(wǎng)絡,那這條連接還能用嗎?

如果 server 重啟后,client 還是不發(fā)數(shù)據(jù),那這條連接看起來還是可用的,因為他們根本不知道對方是個什么情況,但如果此時 client 發(fā)送一點數(shù)據(jù)給 server,你會發(fā)現(xiàn) server 會發(fā)送一個 RST 給client,然后 client 就斷開連接了

4個實驗,徹底搞懂TCP連接的斷開

總結

除了正常情況之外,本文從 TCP 連接斷開的角度結合實驗給出了一些結論:

  • TCP 連接斷開的揮手,在進程崩潰時,會由操作系統(tǒng)內(nèi)核代勞
  • 當 TCP 連接建立后,如果某一方斷電或斷網(wǎng),如果此時剛好正在發(fā)送數(shù)據(jù),TCP 數(shù)據(jù)包發(fā)送失敗后會重試,重試達到上限時也會斷開連接
  • TCP 連接建立后,如果某一方斷電或斷網(wǎng),且這條連接沒有數(shù)據(jù)傳輸時
    • 如果開啟了 KeepAlive 則會在一定心跳檢測后斷開連接,這個默認檢測時間大概2個多小時,比較久
    • 如果未開啟 KeepAlive 則連接永遠存在
  • 如果一方發(fā)送 RST 包給另一方,也是會強制對方斷開連接的

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉