《我想進(jìn)大廠》之網(wǎng)絡(luò)篇奪命連環(huán)12問
談一談你對(duì)TCP/IP四層模型,OSI七層模型的理解?
為了增強(qiáng)通用性和兼容性,計(jì)算機(jī)網(wǎng)絡(luò)都被設(shè)計(jì)成層次機(jī)構(gòu),每一層都遵守一定的規(guī)則。
因此有了OSI這樣一個(gè)抽象的網(wǎng)絡(luò)通信參考模型,按照這個(gè)標(biāo)準(zhǔn)使計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)可以互相連接。
物理層:通過(guò)網(wǎng)線、光纜等這種物理方式將電腦連接起來(lái)。傳遞的數(shù)據(jù)是比特流,0101010100。
數(shù)據(jù)鏈路層:首先,把比特流封裝成數(shù)據(jù)幀的格式,對(duì)0、1進(jìn)行分組。電腦連接起來(lái)之后,數(shù)據(jù)都經(jīng)過(guò)網(wǎng)卡來(lái)傳輸,而網(wǎng)卡上定義了全世界唯一的MAC地址。然后再通過(guò)廣播的形式向局域網(wǎng)內(nèi)所有電腦發(fā)送數(shù)據(jù),再根據(jù)數(shù)據(jù)中MAC地址和自身對(duì)比判斷是否是發(fā)給自己的。
網(wǎng)絡(luò)層:廣播的形式太低效,為了區(qū)分哪些MAC地址屬于同一個(gè)子網(wǎng),網(wǎng)絡(luò)層定義了IP和子網(wǎng)掩碼,通過(guò)對(duì)IP和子網(wǎng)掩碼進(jìn)行與運(yùn)算就知道是否是同一個(gè)子網(wǎng),再通過(guò)路由器和交換機(jī)進(jìn)行傳輸。IP協(xié)議屬于網(wǎng)絡(luò)層的協(xié)議。
傳輸層:有了網(wǎng)絡(luò)層的MAC+IP地址之后,為了確定數(shù)據(jù)包是從哪個(gè)進(jìn)程發(fā)送過(guò)來(lái)的,就需要端口號(hào),通過(guò)端口來(lái)建立通信,比如TCP和UDP屬于這一層的協(xié)議。
會(huì)話層:負(fù)責(zé)建立和斷開連接
表示層:為了使得數(shù)據(jù)能夠被其他的計(jì)算機(jī)理解,再次將數(shù)據(jù)轉(zhuǎn)換成另外一種格式,比如文字、視頻、圖片等。
應(yīng)用層:最高層,面對(duì)用戶,提供計(jì)算機(jī)網(wǎng)絡(luò)與最終呈現(xiàn)給用戶的界面
TCP/IP則是四層的結(jié)構(gòu),相當(dāng)于是對(duì)OSI模型的簡(jiǎn)化。
- 數(shù)據(jù)鏈路層,也有稱作網(wǎng)絡(luò)訪問層、網(wǎng)絡(luò)接口層。他包含了OSI模型的物理層和數(shù)據(jù)鏈路層,把電腦連接起來(lái)。
- 網(wǎng)絡(luò)層,也叫做IP層,處理IP數(shù)據(jù)包的傳輸、路由,建立主機(jī)間的通信。
- 傳輸層,就是為兩臺(tái)主機(jī)設(shè)備提供端到端的通信。
- 應(yīng)用層,包含OSI的會(huì)話層、表示層和應(yīng)用層,提供了一些常用的協(xié)議規(guī)范,比如FTP、SMPT、HTTP等。
總結(jié)下來(lái),就是物理層通過(guò)物理手段把電腦連接起來(lái),數(shù)據(jù)鏈路層則對(duì)比特流的數(shù)據(jù)進(jìn)行分組,網(wǎng)絡(luò)層來(lái)建立主機(jī)到主機(jī)的通信,傳輸層建立端口到端口的通信,應(yīng)用層最終負(fù)責(zé)建立連接,數(shù)據(jù)格式轉(zhuǎn)換,最終呈現(xiàn)給用戶。
說(shuō)說(shuō)TCP 3次握手的過(guò)程?
建立連接前server端需要監(jiān)聽端口,所以初始狀態(tài)是LISTEN。
- client端建立連接,發(fā)送一個(gè)SYN同步包,發(fā)送之后狀態(tài)變成SYN_SENT
- server端收到SYN之后,同意建立連接,返回一個(gè)ACK響應(yīng),同時(shí)也會(huì)給client發(fā)送一個(gè)SYN包,發(fā)送完成之后狀態(tài)變?yōu)镾YN_RCVD
- client端收到server的ACK之后,狀態(tài)變?yōu)镋STABLISHED,返回ACK給server端。server收到之后狀態(tài)也變?yōu)镋STABLISHED,連接建立完成。
為什么要3次?2次,4次不行嗎?
因?yàn)門CP是雙工傳輸模式,不區(qū)分客戶端和服務(wù)端,連接的建立是雙向的過(guò)程。
如果只有兩次,無(wú)法做到雙向連接的建立,從建立連接server回復(fù)的SYN和ACK合并成一次可以看出來(lái),他也不需要4次。
揮手為什么要四次?因?yàn)閾]手的ACK和FIN不能同時(shí)發(fā)送,因?yàn)閿?shù)據(jù)發(fā)送的截止時(shí)間不同。
那么四次揮手的過(guò)程呢?
- client端向server發(fā)送FIN包,進(jìn)入FIN_WAIT_1狀態(tài),這代表client端已經(jīng)沒有數(shù)據(jù)要發(fā)送了
- server端收到之后,返回一個(gè)ACK,進(jìn)入CLOSE_WAIT等待關(guān)閉的狀態(tài),因?yàn)閟erver端可能還有沒有發(fā)送完成的數(shù)據(jù)
- 等到server端數(shù)據(jù)都發(fā)送完畢之后,server端就向client發(fā)送FIN,進(jìn)入LAST_ACK狀態(tài)
- client收到ACK之后,進(jìn)入TIME_WAIT的狀態(tài),同時(shí)回復(fù)ACK,server收到之后直接進(jìn)入CLOSED狀態(tài),連接關(guān)閉。但是client要等待2MSL(報(bào)文最大生存時(shí)間)的時(shí)間,才會(huì)進(jìn)入CLOSED狀態(tài)。
為什么要等待2MSL的時(shí)間才關(guān)閉?
- 為了保證連接的可靠關(guān)閉。如果server沒有收到最后一個(gè)ACK,那么就會(huì)重發(fā)FIN。
- 為了避免端口重用帶來(lái)的數(shù)據(jù)混淆。如果client直接進(jìn)入CLOSED狀態(tài),又用相同端口號(hào)向server建立一個(gè)連接,上一次連接的部分?jǐn)?shù)據(jù)在網(wǎng)絡(luò)中延遲到達(dá)server,數(shù)據(jù)就可能發(fā)生混淆了。
TCP怎么保證傳輸過(guò)程的可靠性?
校驗(yàn)和:發(fā)送方在發(fā)送數(shù)據(jù)之前計(jì)算校驗(yàn)和,接收方收到數(shù)據(jù)后同樣計(jì)算,如果不一致,那么傳輸有誤。
確認(rèn)應(yīng)答,序列號(hào):TCP進(jìn)行傳輸時(shí)數(shù)據(jù)都進(jìn)行了編號(hào),每次接收方返回ACK都有確認(rèn)序列號(hào)。
超時(shí)重傳:如果發(fā)送方發(fā)送數(shù)據(jù)一段時(shí)間后沒有收到ACK,那么就重發(fā)數(shù)據(jù)。
連接管理:三次握手和四次揮手的過(guò)程。
流量控制:TCP協(xié)議報(bào)頭包含16位的窗口大小,接收方會(huì)在返回ACK時(shí)同時(shí)把自己的即時(shí)窗口填入,發(fā)送方就根據(jù)報(bào)文中窗口的大小控制發(fā)送速度。
擁塞控制:剛開始發(fā)送數(shù)據(jù)的時(shí)候,擁塞窗口是1,以后每次收到ACK,則擁塞窗口+1,然后將擁塞窗口和收到的窗口取較小值作為實(shí)際發(fā)送的窗口,如果發(fā)生超時(shí)重傳,擁塞窗口重置為1。這樣做的目的就是為了保證傳輸過(guò)程的高效性和可靠性。
說(shuō)下瀏覽器請(qǐng)求一個(gè)網(wǎng)址的過(guò)程?
- 首先通過(guò)DNS服務(wù)器把域名解析成IP地址,通過(guò)IP和子網(wǎng)掩碼判斷是否屬于同一個(gè)子網(wǎng)
- 構(gòu)造應(yīng)用層請(qǐng)求http報(bào)文,傳輸層添加TCP/UDP頭部,網(wǎng)絡(luò)層添加IP頭部,數(shù)據(jù)鏈路層添加以太網(wǎng)協(xié)議頭部
- 數(shù)據(jù)經(jīng)過(guò)路由器、交換機(jī)轉(zhuǎn)發(fā),最終達(dá)到目標(biāo)服務(wù)器,目標(biāo)服務(wù)器同樣解析數(shù)據(jù),最終拿到http報(bào)文,按照對(duì)應(yīng)的程序的邏輯響應(yīng)回去。
知道HTTPS的工作原理嗎?
- 用戶通過(guò)瀏覽器請(qǐng)求https網(wǎng)站,服務(wù)器收到請(qǐng)求,選擇瀏覽器支持的加密和hash算法,同時(shí)返回?cái)?shù)字證書給瀏覽器,包含頒發(fā)機(jī)構(gòu)、網(wǎng)址、公鑰、證書有效期等信息。
- 瀏覽器對(duì)證書的內(nèi)容進(jìn)行校驗(yàn),如果有問題,則會(huì)有一個(gè)提示警告。否則,就生成一個(gè)隨機(jī)數(shù)X,同時(shí)使用證書中的公鑰進(jìn)行加密,并且發(fā)送給服務(wù)器。
- 服務(wù)器收到之后,使用私鑰解密,得到隨機(jī)數(shù)X,然后使用X對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行加密,返回給瀏覽器
- 瀏覽器則使用X和之前約定的加密算法進(jìn)行解密,得到最終的網(wǎng)頁(yè)內(nèi)容
負(fù)載均衡有哪些實(shí)現(xiàn)方式?
DNS:這是最簡(jiǎn)單的負(fù)載均衡的方式,一般用于實(shí)現(xiàn)地理級(jí)別的負(fù)載均衡,不同地域的用戶通過(guò)DNS的解析可以返回不同的IP地址,這種方式的負(fù)載均衡簡(jiǎn)單,但是擴(kuò)展性太差,控制權(quán)在域名服務(wù)商。
Http重定向:通過(guò)修改Http響應(yīng)頭的Location達(dá)到負(fù)載均衡的目的,Http的302重定向。這種方式對(duì)性能有影響,而且增加請(qǐng)求耗時(shí)。
反向代理:作用于應(yīng)用層的模式,也被稱作為七層負(fù)載均衡,比如常見的Nginx,性能一般可以達(dá)到萬(wàn)級(jí)。這種方式部署簡(jiǎn)單,成本低,而且容易擴(kuò)展。
IP:作用于網(wǎng)絡(luò)層的和傳輸層的模式,也被稱作四層負(fù)載均衡,通過(guò)對(duì)數(shù)據(jù)包的IP地址和端口進(jìn)行修改來(lái)達(dá)到負(fù)載均衡的效果。常見的有LVS(Linux Virtual Server),通常性能可以支持10萬(wàn)級(jí)并發(fā)。
按照類型來(lái)劃分的話,還可以分成DNS負(fù)載均衡、硬件負(fù)載均衡、軟件負(fù)載均衡。
其中硬件負(fù)載均衡價(jià)格昂貴,性能最好,能達(dá)到百萬(wàn)級(jí),軟件負(fù)載均衡包括Nginx、LVS這種。
說(shuō)說(shuō)BIO/NIO/AIO的區(qū)別?
BIO:同步阻塞IO,每一個(gè)客戶端連接,服務(wù)端都會(huì)對(duì)應(yīng)一個(gè)處理線程,對(duì)于沒有分配到處理線程的連接就會(huì)被阻塞或者拒絕。相當(dāng)于是一個(gè)連接一個(gè)線程。
NIO:同步非阻塞IO,基于Reactor模型,客戶端和channel進(jìn)行通信,channel可以進(jìn)行讀寫操作,通過(guò)多路復(fù)用器selector來(lái)輪詢注冊(cè)在其上的channel,而后再進(jìn)行IO操作。這樣的話,在進(jìn)行IO操作的時(shí)候再用一個(gè)線程去處理就可以了,也就是一個(gè)請(qǐng)求一個(gè)線程。
AIO:異步非阻塞IO,相比NIO更進(jìn)一步,完全由操作系統(tǒng)來(lái)完成請(qǐng)求的處理,然后通知服務(wù)端開啟線程去進(jìn)行處理,因此是一個(gè)有效請(qǐng)求一個(gè)線程。
那么你怎么理解同步和阻塞?
首先,可以認(rèn)為一個(gè)IO操作包含兩個(gè)部分:
- 發(fā)起IO請(qǐng)求
- 實(shí)際的IO讀寫操作
同步和異步在于第二個(gè),實(shí)際的IO讀寫操作,如果操作系統(tǒng)幫你完成了再通知你,那就是異步,否則都叫做同步。
阻塞和非阻塞在于第一個(gè),發(fā)起IO請(qǐng)求,對(duì)于NIO來(lái)說(shuō)通過(guò)channel發(fā)起IO操作請(qǐng)求后,其實(shí)就返回了,所以是非阻塞。
談一下你對(duì)Reactor模型的理解?
Reactor模型包含兩個(gè)組件:
- Reactor:負(fù)責(zé)查詢、響應(yīng)IO事件,當(dāng)檢測(cè)到IO事件時(shí),分發(fā)給Handlers處理。
- Handler:與IO事件綁定,負(fù)責(zé)IO事件的處理。
它包含幾種實(shí)現(xiàn)方式:
單線程Reactor
這個(gè)模式reactor和handler在一個(gè)線程中,如果某個(gè)handler阻塞的話,會(huì)導(dǎo)致其他所有的handler無(wú)法執(zhí)行,而且無(wú)法充分利用多核的性能。
單Reactor多線程
由于decode、compute、encode的操作并非IO的操作,多線程Reactor的思路就是充分發(fā)揮多核的特性,同時(shí)把非IO的操作剝離開。
但是,單個(gè)Reactor承擔(dān)了所有的事件監(jiān)聽、響應(yīng)工作,如果連接過(guò)多,還是可能存在性能問題。
多Reactor多線程
為了解決單Reactor的性能問題,就產(chǎn)生了多Reactor的模式。其中mainReactor建立連接,多個(gè)subReactor則負(fù)責(zé)數(shù)據(jù)讀寫。
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!