【程序員必讀】經(jīng)驗(yàn)：編程的智慧

時(shí)間：2021-09-03 10:08:22

關(guān)鍵字：程序員編程

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]來(lái)源：碼洞下面的這篇文章內(nèi)容由中國(guó)最具爭(zhēng)議性的計(jì)算機(jī)天才王垠老師精心創(chuàng)作，可謂字字珠璣用心苦良，文章篇幅較長(zhǎng)，希望大家能認(rèn)真閱讀，值得收藏。?編程是一種創(chuàng)造性的工作，是一門(mén)藝術(shù)。精通任何一門(mén)藝術(shù)，都需要很多的練習(xí)和領(lǐng)悟，所以這里提出的“智慧”，并不是號(hào)稱一天瘦十斤的減肥藥，它并不...

來(lái)源：碼洞

下面的這篇文章內(nèi)容由中國(guó)最具爭(zhēng)議性的計(jì)算機(jī)天才王垠老師精心創(chuàng)作，可謂字字珠璣用心苦良，文章篇幅較長(zhǎng)，希望大家能認(rèn)真閱讀，值得收藏。?

編程是一種創(chuàng)造性的工作，是一門(mén)藝術(shù)。精通任何一門(mén)藝術(shù)，都需要很多的練習(xí)和領(lǐng)悟，所以這里提出的“智慧”，并不是號(hào)稱一天瘦十斤的減肥藥，它并不能代替你自己的勤奮。然而由于軟件行業(yè)喜歡標(biāo)新立異，喜歡把簡(jiǎn)單的事情搞復(fù)雜，我希望這些文字能給迷惑中的人們指出一些正確的方向，讓他們少走一些彎路，基本做到一分耕耘一分收獲。

>>>>?

反復(fù)推敲代碼

有些人喜歡炫耀自己寫(xiě)了多少多少萬(wàn)行的代碼，仿佛代碼的數(shù)量是衡量編程水平的標(biāo)準(zhǔn)。然而，如果你總是匆匆寫(xiě)出代碼，卻從來(lái)不回頭去推敲，修改和提煉，其實(shí)是不可能提高編程水平的。你會(huì)制造出越來(lái)越多平庸甚至糟糕的代碼。在這種意義上，很多人所謂的“工作經(jīng)驗(yàn)”，跟他代碼的質(zhì)量其實(shí)不一定成正比。如果有幾十年的工作經(jīng)驗(yàn)，卻從來(lái)不回頭去提煉和反思自己的代碼，那么他也許還不如一個(gè)只有一兩年經(jīng)驗(yàn)，卻喜歡反復(fù)推敲，仔細(xì)領(lǐng)悟的人。

有位文豪說(shuō)得好：“看一個(gè)作家的水平，不是看他發(fā)表了多少文字，而要看他的廢紙簍里扔掉了多少?！?我覺(jué)得同樣的理論適用于編程。好的程序員，他們刪掉的代碼，比留下來(lái)的還要多很多。如果你看見(jiàn)一個(gè)人寫(xiě)了很多代碼，卻沒(méi)有刪掉多少，那他的代碼一定有很多垃圾。

就像文學(xué)作品一樣，代碼是不可能一蹴而就的。靈感似乎總是零零星星，陸陸續(xù)續(xù)到來(lái)的。任何人都不可能一筆呵成，就算再厲害的程序員，也需要經(jīng)過(guò)一段時(shí)間，才能發(fā)現(xiàn)最簡(jiǎn)單優(yōu)雅的寫(xiě)法。有時(shí)候你反復(fù)提煉一段代碼，覺(jué)得到了頂峰，沒(méi)法再改進(jìn)了，可是過(guò)了幾個(gè)月再回頭來(lái)看，又發(fā)現(xiàn)好多可以改進(jìn)和簡(jiǎn)化的地方。這跟寫(xiě)文章一模一樣，回頭看幾個(gè)月或者幾年前寫(xiě)的東西，你總能發(fā)現(xiàn)一些改進(jìn)。

所以如果反復(fù)提煉代碼已經(jīng)不再有進(jìn)展，那么你可以暫時(shí)把它放下。過(guò)幾個(gè)星期或者幾個(gè)月再回頭來(lái)看，也許就有煥然一新的靈感。這樣反反復(fù)復(fù)很多次之后，你就積累起了靈感和智慧，從而能夠在遇到新問(wèn)題的時(shí)候直接朝正確，或者接近正確的方向前進(jìn)。

寫(xiě)優(yōu)雅的代碼

人們都討厭“面條代碼”（spaghetti code），因?yàn)樗拖衩鏃l一樣繞來(lái)繞去，沒(méi)法理清頭緒。那么優(yōu)雅的代碼一般是什么形狀的呢？經(jīng)過(guò)多年的觀察，我發(fā)現(xiàn)優(yōu)雅的代碼，在形狀上有一些明顯的特征。

如果我們忽略具體的內(nèi)容，從大體結(jié)構(gòu)上來(lái)看，優(yōu)雅的代碼看起來(lái)就像是一些整整齊齊，套在一起的盒子。如果跟整理房間做一個(gè)類比，就很容易理解。如果你把所有物品都丟在一個(gè)很大的抽屜里，那么它們就會(huì)全都混在一起。你就很難整理，很難迅速的找到需要的東西。但是如果你在抽屜里再放幾個(gè)小盒子，把物品分門(mén)別類放進(jìn)去，那么它們就不會(huì)到處亂跑，你就可以比較容易的找到和管理它們。

優(yōu)雅的代碼的另一個(gè)特征是，它的邏輯大體上看起來(lái)，是枝丫分明的樹(shù)狀結(jié)構(gòu)（tree）。這是因?yàn)槌绦蛩龅膸缀跻磺惺虑?，都是信息的傳遞和分支。你可以把代碼看成是一個(gè)電路，電流經(jīng)過(guò)導(dǎo)線，分流或者匯合。如果你是這樣思考的，你的代碼里就會(huì)比較少出現(xiàn)只有一個(gè)分支的if語(yǔ)句，它看起來(lái)就會(huì)像這個(gè)樣子：

if (...) {
?if (...) {
? ?...
?} else {
? ?...
?}
} else if (...) {
?...
} else {
?...
}

注意到了嗎？在我的代碼里面，if語(yǔ)句幾乎總是有兩個(gè)分支。它們有可能嵌套，有多層的縮進(jìn)，而且else分支里面有可能出現(xiàn)少量重復(fù)的代碼。然而這樣的結(jié)構(gòu)，邏輯卻非常嚴(yán)密和清晰。在后面我會(huì)告訴你為什么if語(yǔ)句最好有兩個(gè)分支。

寫(xiě)模塊化的代碼

有些人吵著鬧著要讓程序“模塊化”，結(jié)果他們的做法是把代碼分部到多個(gè)文件和目錄里面，然后把這些目錄或者文件叫做“module”。他們甚至把這些目錄分放在不同的VCS repo里面。結(jié)果這樣的作法并沒(méi)有帶來(lái)合作的流暢，而是帶來(lái)了許多的麻煩。這是因?yàn)樗麄兤鋵?shí)并不理解什么叫做“模塊”，膚淺的把代碼切割開(kāi)來(lái)，分放在不同的位置，其實(shí)非但不能達(dá)到模塊化的目的，而且制造了不必要的麻煩。

真正的模塊化，并不是文本意義上的，而是邏輯意義上的。一個(gè)模塊應(yīng)該像一個(gè)電路芯片，它有定義良好的輸入和輸出。實(shí)際上一種很好的模塊化方法早已經(jīng)存在，它的名字叫做“函數(shù)”。每一個(gè)函數(shù)都有明確的輸入（參數(shù)）和輸出（返回值），同一個(gè)文件里可以包含多個(gè)函數(shù)，所以你其實(shí)根本不需要把代碼分開(kāi)在多個(gè)文件或者目錄里面，同樣可以完成代碼的模塊化。我可以把代碼全都寫(xiě)在同一個(gè)文件里，卻仍然是非常模塊化的代碼。

想要達(dá)到很好的模塊化，你需要做到以下幾點(diǎn)：

避免寫(xiě)太長(zhǎng)的函數(shù)。如果發(fā)現(xiàn)函數(shù)太大了，就應(yīng)該把它拆分成幾個(gè)更小的。通常我寫(xiě)的函數(shù)長(zhǎng)度都不超過(guò)40行。對(duì)比一下，一般筆記本電腦屏幕所能容納的代碼行數(shù)是50行。我可以一目了然的看見(jiàn)一個(gè)40行的函數(shù)，而不需要滾屏。只有40行而不是50行的原因是，我的眼球不轉(zhuǎn)的話，最大的視角只看得到40行代碼。
如果我看代碼不轉(zhuǎn)眼球的話，我就能把整片代碼完整的映射到我的視覺(jué)神經(jīng)里，這樣就算忽然閉上眼睛，我也能看得見(jiàn)這段代碼。我發(fā)現(xiàn)閉上眼睛的時(shí)候，大腦能夠更加有效地處理代碼，你能想象這段代碼可以變成什么其它的形狀。40行并不是一個(gè)很大的限制，因?yàn)楹瘮?shù)里面比較復(fù)雜的部分，往往早就被我提取出去，做成了更小的函數(shù)，然后從原來(lái)的函數(shù)里面調(diào)用。
制造小的工具函數(shù)。如果你仔細(xì)觀察代碼，就會(huì)發(fā)現(xiàn)其實(shí)里面有很多的重復(fù)。這些常用的代碼，不管它有多短，提取出去做成函數(shù)，都可能是會(huì)有好處的。有些幫助函數(shù)也許就只有兩行，然而它們卻能大大簡(jiǎn)化主要函數(shù)里面的邏輯。
有些人不喜歡使用小的函數(shù)，因?yàn)樗麄兿氡苊夂瘮?shù)調(diào)用的開(kāi)銷(xiāo)，結(jié)果他們寫(xiě)出幾百行之大的函數(shù)。這是一種過(guò)時(shí)的觀念?，F(xiàn)代的編譯器都能自動(dòng)的把小的函數(shù)內(nèi)聯(lián)（inline）到調(diào)用它的地方，所以根本不產(chǎn)生函數(shù)調(diào)用，也就不會(huì)產(chǎn)生任何多余的開(kāi)銷(xiāo)。
同樣的一些人，也愛(ài)使用宏（macro）來(lái)代替小函數(shù)，這也是一種過(guò)時(shí)的觀念。在早期的C語(yǔ)言編譯器里，只有宏是靜態(tài)“內(nèi)聯(lián)”的，所以他們使用宏，其實(shí)是為了達(dá)到內(nèi)聯(lián)的目的。然而能否內(nèi)聯(lián)，其實(shí)并不是宏與函數(shù)的根本區(qū)別。宏與函數(shù)有著巨大的區(qū)別（這個(gè)我以后再講），應(yīng)該盡量避免使用宏。為了內(nèi)聯(lián)而使用宏，其實(shí)是濫用了宏，這會(huì)引起各種各樣的麻煩，比如使程序難以理解，難以調(diào)試，容易出錯(cuò)等等。
每個(gè)函數(shù)只做一件簡(jiǎn)單的事情。有些人喜歡制造一些“通用”的函數(shù)，既可以做這個(gè)又可以做那個(gè)，它的內(nèi)部依據(jù)某些變量和條件，來(lái)“選擇”這個(gè)函數(shù)所要做的事情。比如，你也許寫(xiě)出這樣的函數(shù)：
void foo() {
?if (getOS().equals("MacOS")) {
? ?a();
?} else {
? ?b();
?}
?c();
?if (getOS().equals("MacOS")) {
? ?d();
?} else {
? ?e();
?}
}
寫(xiě)這個(gè)函數(shù)的人，根據(jù)系統(tǒng)是否為“MacOS”來(lái)做不同的事情。你可以看出這個(gè)函數(shù)里，其實(shí)只有c()是兩種系統(tǒng)共有的，而其它的a(), b(), d(), e()都屬于不同的分支。
這種“復(fù)用”其實(shí)是有害的。如果一個(gè)函數(shù)可能做兩種事情，它們之間共同點(diǎn)少于它們的不同點(diǎn)，那你最好就寫(xiě)兩個(gè)不同的函數(shù)，否則這個(gè)函數(shù)的邏輯就不會(huì)很清晰，容易出現(xiàn)錯(cuò)誤。其實(shí)，上面這個(gè)函數(shù)可以改寫(xiě)成兩個(gè)函數(shù)：
void fooMacOS() {
?a();
?c();
?d();
}
和
void fooOther() {
?b();
?c();
?e();
}
如果你發(fā)現(xiàn)兩件事情大部分內(nèi)容相同，只有少數(shù)不同，多半時(shí)候你可以把相同的部分提取出去，做成一個(gè)輔助函數(shù)。比如，如果你有個(gè)函數(shù)是這樣：
void foo() {
?a();
?b()
?c();
?if (getOS().equals("MacOS")) {
? ?d();
?} else {
? ?e();
?}
}
其中a()，b()，c()都是一樣的，只有d()和e()根據(jù)系統(tǒng)有所不同。那么你可以把a(bǔ)()，b()，c()提取出去：
void preFoo() {
?a();
?b()
?c();
然后制造兩個(gè)函數(shù)：
void fooMacOS() {
?preFoo();
?d();
}
和
void fooOther() {
?preFoo();
?e();
}
這樣一來(lái)，我們既共享了代碼，又做到了每個(gè)函數(shù)只做一件簡(jiǎn)單的事情。這樣的代碼，邏輯就更加清晰。
避免使用全局變量和類成員（class member）來(lái)傳遞信息，盡量使用局部變量和參數(shù)。有些人寫(xiě)代碼，經(jīng)常用類成員來(lái)傳遞信息，就像這樣：
class A {
? String x;

? void findX() {
? ? ?...
? ? ?x = ...;
? }

? void foo() {
? ? findX();
? ? ...
? ? print(x);
? }
}
首先，他使用findX()，把一個(gè)值寫(xiě)入成員x。然后，使用x的值。這樣，x就變成了findX和print之間的數(shù)據(jù)通道。由于x屬于class A，這樣程序就失去了模塊化的結(jié)構(gòu)。由于這兩個(gè)函數(shù)依賴于成員x，它們不再有明確的輸入和輸出，而是依賴全局的數(shù)據(jù)。findX和foo不再能夠離開(kāi)class A而存在，而且由于類成員還有可能被其他代碼改變，代碼變得難以理解，難以確保正確性。
如果你使用局部變量而不是類成員來(lái)傳遞信息，那么這兩個(gè)函數(shù)就不需要依賴于某一個(gè)class，而且更加容易理解，不易出錯(cuò)：
String findX() {
? ?...
? ?x = ...;
? ?return x;
}
void foo() {
? String x = findX();
? print(x);
}

寫(xiě)可讀的代碼

有些人以為寫(xiě)很多注釋就可以讓代碼更加可讀，然而卻發(fā)現(xiàn)事與愿違。注釋不但沒(méi)能讓代碼變得可讀，反而由于大量的注釋充斥在代碼中間，讓程序變得障眼難讀。而且代碼的邏輯一旦修改，就會(huì)有很多的注釋變得過(guò)時(shí)，需要更新。修改注釋是相當(dāng)大的負(fù)擔(dān)，所以大量的注釋，反而成為了妨礙改進(jìn)代碼的絆腳石。

實(shí)際上，真正優(yōu)雅可讀的代碼，是幾乎不需要注釋的。如果你發(fā)現(xiàn)需要寫(xiě)很多注釋，那么你的代碼肯定是含混晦澀，邏輯不清晰的。其實(shí)，程序語(yǔ)言相比自然語(yǔ)言，是更加強(qiáng)大而嚴(yán)謹(jǐn)?shù)?，它其?shí)具有自然語(yǔ)言最主要的元素：主語(yǔ)，謂語(yǔ)，賓語(yǔ)，名詞，動(dòng)詞，如果，那么，否則，是，不是，…… 所以如果你充分利用了程序語(yǔ)言的表達(dá)能力，你完全可以用程序本身來(lái)表達(dá)它到底在干什么，而不需要自然語(yǔ)言的輔助。

有少數(shù)的時(shí)候，你也許會(huì)為了繞過(guò)其他一些代碼的設(shè)計(jì)問(wèn)題，采用一些違反直覺(jué)的作法。這時(shí)候你可以使用很短注釋，說(shuō)明為什么要寫(xiě)成那奇怪的樣子。這樣的情況應(yīng)該少出現(xiàn)，否則這意味著整個(gè)代碼的設(shè)計(jì)都有問(wèn)題。

如果沒(méi)能合理利用程序語(yǔ)言提供的優(yōu)勢(shì)，你會(huì)發(fā)現(xiàn)程序還是很難懂，以至于需要寫(xiě)注釋。所以我現(xiàn)在告訴你一些要點(diǎn)，也許可以幫助你大大減少寫(xiě)注釋的必要：

使用有意義的函數(shù)和變量名字。如果你的函數(shù)和變量的名字，能夠切實(shí)的描述它們的邏輯，那么你就不需要寫(xiě)注釋來(lái)解釋它在干什么。比如：
// put elephant1 into fridge2
put(elephant1, fridge2);
由于我的函數(shù)名put，加上兩個(gè)有意義的變量名elephant1和fridge2，已經(jīng)說(shuō)明了這是在干什么（把大象放進(jìn)冰箱），所以上面那句注釋完全沒(méi)有必要。
局部變量應(yīng)該盡量接近使用它的地方。有些人喜歡在函數(shù)最開(kāi)頭定義很多局部變量，然后在下面很遠(yuǎn)的地方使用它，就像這個(gè)樣子：
void foo() {
?int index = ...;
?...
?...
?bar(index);
?...
}
由于這中間都沒(méi)有使用過(guò)index，也沒(méi)有改變過(guò)它所依賴的數(shù)據(jù)，所以這個(gè)變量定義，其實(shí)可以挪到接近使用它的地方：
void foo() {
?...
?...
?int index = ...;
?bar(index);
?...
}
這樣讀者看到bar(index)，不需要向上看很遠(yuǎn)就能發(fā)現(xiàn)index是如何算出來(lái)的。而且這種短距離，可以加強(qiáng)讀者對(duì)于這里的“計(jì)算順序”的理解。否則如果index在頂上，讀者可能會(huì)懷疑，它其實(shí)保存了某種會(huì)變化的數(shù)據(jù)，或者它后來(lái)又被修改過(guò)。如果index放在下面，讀者就清楚的知道，index并不是保存了什么可變的值，而且它算出來(lái)之后就沒(méi)變過(guò)。
如果你看透了局部變量的本質(zhì)——它們就是電路里的導(dǎo)線，那你就能更好的理解近距離的好處。變量定義離用的地方越近，導(dǎo)線的長(zhǎng)度就越短。你不需要摸著一根導(dǎo)線，繞來(lái)繞去找很遠(yuǎn)，就能發(fā)現(xiàn)接收它的端口，這樣的電路就更容易理解。
局部變量名字應(yīng)該簡(jiǎn)短。這貌似跟第一點(diǎn)相沖突，簡(jiǎn)短的變量名怎么可能有意義呢？注意我這里說(shuō)的是局部變量，因?yàn)樗鼈兲幱诰植?，再加上?點(diǎn)已經(jīng)把它放到離使用位置盡量近的地方，所以根據(jù)上下文你就會(huì)容易知道它的意思：
比如，你有一個(gè)局部變量，表示一個(gè)操作是否成功：
boolean successInDeleteFile = deleteFile("foo.txt");
if (successInDeleteFile) {
?...
} else {
?...
}
這個(gè)局部變量successInDeleteFile大可不必這么啰嗦。因?yàn)樗挥眠^(guò)一次，而且用它的地方就在下面一行，所以讀者可以輕松發(fā)現(xiàn)它是deleteFile返回的結(jié)果。如果你把它改名為success，其實(shí)讀者根據(jù)一點(diǎn)上下文，也知道它表示”success in deleteFile”。所以你可以把它改成這樣：
boolean success = deleteFile("foo.txt");
if (success) {
?...
} else {
?...
}
這樣的寫(xiě)法不但沒(méi)漏掉任何有用的語(yǔ)義信息，而且更加易讀。successInDeleteFile這種“camelCase”，如果超過(guò)了三個(gè)單詞連在一起，其實(shí)是很礙眼的東西。所以如果你能用一個(gè)單詞表示同樣的意義，那當(dāng)然更好。
不要重用局部變量。很多人寫(xiě)代碼不喜歡定義新的局部變量，而喜歡“重用”同一個(gè)局部變量，通過(guò)反復(fù)對(duì)它們進(jìn)行賦值，來(lái)表示完全不同意思。比如這樣寫(xiě)：
String msg;
if (...) {
?msg = "succeed";
?log.info(msg);
} else {
?msg = "failed";
?log.info(msg);
}
雖然這樣在邏輯上是沒(méi)有問(wèn)題的，然而卻不易理解，容易混淆。變量msg兩次被賦值，表示完全不同的兩個(gè)值。它們立即被log.info使用，沒(méi)有傳遞到其它地方去。這種賦值的做法，把局部變量的作用域不必要的增大，讓人以為它可能在將來(lái)改變，也許會(huì)在其它地方被使用。更好的做法，其實(shí)是定義兩個(gè)變量：
if (...) {
?String msg = "succeed";
?log.info(msg);
} else {
?String msg = "failed";
?log.info(msg);
}
由于這兩個(gè)msg變量的作用域僅限于它們所處的if語(yǔ)句分支，你可以很清楚的看到這兩個(gè)msg被使用的范圍，而且知道它們之間沒(méi)有任何關(guān)系。
把復(fù)雜的邏輯提取出去，做成“幫助函數(shù)”。有些人寫(xiě)的函數(shù)很長(zhǎng)，以至于看不清楚里面的語(yǔ)句在干什么，所以他們誤以為需要寫(xiě)注釋。如果你仔細(xì)觀察這些代碼，就會(huì)發(fā)現(xiàn)不清晰的那片代碼，往往可以被提取出去，做成一個(gè)函數(shù)，然后在原來(lái)的地方調(diào)用。由于函數(shù)有一個(gè)名字，這樣你就可以使用有意義的函數(shù)名來(lái)代替注釋。舉一個(gè)例子：
...
// put elephant1 into fridge2
openDoor(fridge2);
if (elephant1.alive()) {
?...
} else {
? ...
}
closeDoor(fridge2);
...
如果你把這片代碼提出去定義成一個(gè)函數(shù)：
void put(Elephant elephant, Fridge fridge) {
?openDoor(fridge);
?if (elephant.alive()) {
? ?...
?} else {
? ? ...
?}
?closeDoor(fridge);
}
這樣原來(lái)的代碼就可以改成：
...
put(elephant1, fridge2);
...
更加清晰，而且注釋也沒(méi)必要了。
把復(fù)雜的表達(dá)式提取出去，做成中間變量。有些人聽(tīng)說(shuō)“函數(shù)式編程”是個(gè)好東西，也不理解它的真正含義，就在代碼里大量使用嵌套的函數(shù)。像這樣：
Pizza pizza = makePizza(crust(salt(), butter()),
? topping(onion(), tomato(), sausage()));
這樣的代碼一行太長(zhǎng)，而且嵌套太多，不容易看清楚。其實(shí)訓(xùn)練有素的函數(shù)式程序員，都知道中間變量的好處，不會(huì)盲目的使用嵌套的函數(shù)。他們會(huì)把這代碼變成這樣：
Crust crust = crust(salt(), butter());
Topping topping = topping(onion(), tomato(), sausage());
Pizza pizza = makePizza(crust, topping);
這樣寫(xiě)，不但有效地控制了單行代碼的長(zhǎng)度，而且由于引入的中間變量具有“意義”，步驟清晰，變得很容易理解。
在合理的地方換行。對(duì)于絕大部分的程序語(yǔ)言，代碼的邏輯是和空白字符無(wú)關(guān)的，所以你可以在幾乎任何地方換行，你也可以不換行。這樣的語(yǔ)言設(shè)計(jì)是個(gè)好東西，因?yàn)樗o了程序員自由控制自己代碼格式的能力。然而，它也引起了一些問(wèn)題，因?yàn)楹芏嗳瞬恢廊绾魏侠淼膿Q行。

有些人喜歡利用IDE的自動(dòng)換行機(jī)制，編輯之后用一個(gè)熱鍵把整個(gè)代碼重新格式化一遍，IDE就會(huì)把超過(guò)行寬限制的代碼自動(dòng)折行?？墒沁@種自動(dòng)這行，往往沒(méi)有根據(jù)代碼的邏輯來(lái)進(jìn)行，不能幫助理解代碼。自動(dòng)換行之后可能產(chǎn)生這樣的代碼：

? if (someLongCondition1()