大家好,我是飛哥!經(jīng)常在后臺(tái)收到讀者的交流,Linux
源碼那么龐大,飛哥你是如何讀的呢?由于問(wèn)這個(gè)問(wèn)題的太多,我想有必要專門(mén)寫(xiě)一篇文章聊一聊。首先,我先說(shuō)一點(diǎn),其實(shí)我本人不是搞內(nèi)核相關(guān)工作的。我和大多數(shù)同學(xué)都一樣,從事的也是應(yīng)用層上的開(kāi)發(fā),負(fù)責(zé)的是后端模塊。那我為什么要研究源碼這個(gè)之前我說(shuō)過(guò),是因?yàn)槲以诙嗄甑墓ぷ髦杏龅降暮芏鄦?wèn)題都是底層相關(guān)的。不深入底層看一看,感覺(jué)永遠(yuǎn)是在隔靴撓癢,永遠(yuǎn)理解不到問(wèn)題的本質(zhì)。(這里說(shuō)的底層其實(shí)也不只是包括 Linux 內(nèi)核,還包括一些硬件的組成原理啥的)。
飛哥走過(guò)的彎路
雖然咱們今天的主題是源碼,不過(guò)我并不建議你一開(kāi)始就陷入到源碼里,這也是我走過(guò)的彎路。在我剛開(kāi)始想深入挖掘網(wǎng)絡(luò)性能的時(shí)候,我買來(lái)了《深入理解 LINUX 內(nèi)核》《深入理解 Linux 網(wǎng)絡(luò)技術(shù)內(nèi)幕》等幾本書(shū)。這本書(shū)里介紹了內(nèi)核中各個(gè)組件,如網(wǎng)卡設(shè)備、鄰居子系統(tǒng)、路由等,把相關(guān)源碼都講了一遍。我啃了好長(zhǎng)時(shí)間,但結(jié)果是看完以后感覺(jué)還是一團(tuán)漿糊。尤其是到了工作中具體的一個(gè)實(shí)際問(wèn)題的時(shí)候,發(fā)現(xiàn)根本還是理解不了網(wǎng)絡(luò)模塊到底是怎么運(yùn)作的。比如一個(gè)包到底是如何從網(wǎng)卡到應(yīng)用程序中的,這些書(shū)看半天還是弄不明白這個(gè)問(wèn)題。就更別提后續(xù)搞一些網(wǎng)絡(luò)優(yōu)化的事情了。到了后來(lái),我改變了戰(zhàn)術(shù),才算是柳暗花明又一村,找到了真正正確、高效的方法。
產(chǎn)生問(wèn)題
我所找到的正確方法就是,
以工作中的實(shí)際問(wèn)題為核心。回頭想想我們看源碼的目的是啥呢,是要把 Linux 搞明白?我想不是,把 Linux 搞明白只是途徑,而我們的真正目的是為了提高我們手頭的工作。比如,我想觀察我的服務(wù)中 Linux 的收包的過(guò)程是否出現(xiàn)了問(wèn)題,以及想嘗試在這個(gè)接收過(guò)程中都有哪些優(yōu)化方法。基于這個(gè)工作中的需求出發(fā),然后我就四處開(kāi)始翻資料,打算要把 Linux 是如何接收和處理一個(gè)網(wǎng)絡(luò)包徹底搞搞清楚。包括我之前看過(guò)的源碼的書(shū),也查了好多網(wǎng)絡(luò)上的文章。最后終于摸出了個(gè)十之八九,總結(jié)出了
圖解Linux網(wǎng)絡(luò)包接收過(guò)程。再比如我手頭的項(xiàng)目中很多地方需要維持長(zhǎng)連接,那么我就想搞明白
一臺(tái) Linux 服務(wù)器最多能支撐多少個(gè) TCP 連接?這種問(wèn)題更是,幾乎沒(méi)有任何書(shū),任何資料,任何文章能給一個(gè)讓我滿意的答案。這個(gè)時(shí)候光翻源碼,看網(wǎng)絡(luò)上的技術(shù)文也是遠(yuǎn)遠(yuǎn)不夠的,我動(dòng)手寫(xiě)了不少測(cè)試代碼,親手進(jìn)行實(shí)踐。寫(xiě)出了
- 漫畫(huà)|一臺(tái)Linux服務(wù)器最多能支撐多少個(gè)TCP連接?
- 漫畫(huà) | 理解了TCP連接的實(shí)現(xiàn)以后,客戶端的并發(fā)也爆發(fā)了!
- 百看不如一練,動(dòng)手測(cè)試單機(jī)百萬(wàn)連接的保姆級(jí)教程!
再比如有同學(xué)問(wèn)了我,127.0.0.1 是如何進(jìn)行網(wǎng)絡(luò)包收發(fā)的,和跨機(jī) IO 相比,能節(jié)約哪些開(kāi)銷?為了解開(kāi)這個(gè)疑問(wèn),我翻了源碼又寫(xiě)出了
127.0.0.1 之本機(jī)網(wǎng)絡(luò)通信過(guò)程知多少 ?!但其實(shí)我所關(guān)注的點(diǎn)并不都在內(nèi)核源碼上。比如在我前期的一些文章里,我想弄明白訪問(wèn)內(nèi)存的速度。我研究了 L1、L2、L3。還調(diào)研了內(nèi)存的工作原理。隨后發(fā)現(xiàn)了內(nèi)存在隨機(jī) IO ?的時(shí)候也是會(huì)比順序IO要慢幾倍的。后來(lái)我想搞明白固態(tài)硬盤(pán)和機(jī)械硬盤(pán)的速度差異,我又去分析了固態(tài)硬盤(pán)的物理構(gòu)成。而且所有的這些我都搭配了實(shí)際的性能測(cè)試。今天的重點(diǎn)并不是給大家介紹這些文章,我想表達(dá)的意思是,
產(chǎn)生問(wèn)題非常重要。這些問(wèn)題最好是能和你手工工作相關(guān),因?yàn)檫@樣你后期才能在工作中進(jìn)行應(yīng)用和提升。我覺(jué)得只有有用的技術(shù),才是真正有價(jià)值的技術(shù)。至于說(shuō)硬件組成原理,內(nèi)核源碼,極客時(shí)間上的一些優(yōu)秀的網(wǎng)課,都是解決這些問(wèn)題是的工具而已。
源碼閱讀方法
在解決問(wèn)題的時(shí)候,內(nèi)核源碼確實(shí)是很重要的一塊,也是我們今天介紹的主題??创a我覺(jué)得有兩個(gè)方法,可以用
地毯式的轟炸和
精確制導(dǎo)來(lái)類比。
地毯式轟炸
地毯式轟炸就是不管三七二十一,把內(nèi)核所有的源碼全部硬啃一遍。各個(gè)組件都進(jìn)去看一看,了解了解。除非你本身就是搞內(nèi)核相關(guān)的工作的,否則我是不推薦大家去把內(nèi)核源碼通讀一遍的。這也是我前面和大家講過(guò)的我走的彎路。因?yàn)檫@樣搞有如下的缺點(diǎn):第一,我們大部分的讀者都是已經(jīng)工作了的同學(xué)。你沒(méi)有學(xué)生時(shí)代那么大塊的時(shí)間去整塊整塊的啃。第二,即使你啃完了,你和手頭的工作還是聯(lián)系不起來(lái)。前面我說(shuō)過(guò),我啃完了《深入理解 Linux 網(wǎng)絡(luò)技術(shù)內(nèi)幕》,仍然連網(wǎng)絡(luò)包是如何從網(wǎng)卡到用戶進(jìn)程里的還是沒(méi)搞明白。這就好比在戰(zhàn)場(chǎng)上,動(dòng)用大量的武器彈藥進(jìn)行狂轟濫炸。這種方法非常浪費(fèi)彈藥,而且很有可能還沒(méi)有炸到關(guān)鍵的碉堡。
精確制導(dǎo)
這個(gè)是我所推薦的方法。前面不是說(shuō)過(guò),我們一定要先產(chǎn)生一個(gè)問(wèn)題么。那么我們看源碼的目標(biāo)就是要精確制導(dǎo)消滅這個(gè)對(duì)象。等我們進(jìn)入到內(nèi)核源碼里的時(shí)候,你會(huì)發(fā)現(xiàn)這里面邏輯關(guān)系錯(cuò)綜復(fù)雜。如果每一個(gè)邏輯你都想鉆進(jìn)去弄個(gè)明白,最后可能就是累死在內(nèi)核源碼的迷宮里了。所以我們?cè)诳丛创a的時(shí)候,要時(shí)刻牢記我們要消滅的問(wèn)題是啥。如果某段邏輯和你要解決的問(wèn)題無(wú)關(guān),那就直接繞過(guò)去,繞過(guò)去,不要戀戰(zhàn)!你在我的文章里應(yīng)該也能發(fā)現(xiàn),我雖然會(huì)貼內(nèi)核源碼,但是絕大部分的源碼都包含省略號(hào)。這些就是我覺(jué)得和當(dāng)前主題無(wú)關(guān)的源碼,所以我都躲著它們走。比如在介紹內(nèi)核發(fā)送數(shù)據(jù)過(guò)程的時(shí)候,我介紹到 inet_sendmsg,我是這樣展示的的。
//file:?net/ipv4/af_inet.c
int?inet_sendmsg(......)
{
?......
?return?sk->sk_prot->sendmsg(iocb,?sk,?msg,?size);
}
而實(shí)際上,內(nèi)核的
源碼長(zhǎng)的是這樣的。
int?inet_sendmsg(struct?kiocb?*iocb,?struct?socket?*sock,?struct?msghdr?*msg,
???size_t?size)
{
?struct?sock?*sk?=?sock->sk;
?sock_rps_record_flow(sk);
?/*?We?may?need?to?bind?the?socket.?*/
?if?(!inet_sk(sk)->inet_num?