在軟件中隨處可見命名:要給變量、函數(shù)、參數(shù)、類和封包命名,還要給源代碼及源代碼所在目錄命名,甚至還有jar文件、war文件和ear文件命名。
但是,看似簡單的命名,也是讓不少程序員頭疼的問題。有一些小伙伴,在進行變量命名的時候,對于自己熟悉的英文,可能還會用英文命名一下,如果需要命名的部分不會用英文表達,或許就直接用拼音了。
有的童鞋一下想不起來怎么命名,直接用拼音直接用aa,bb等這樣沒有任何代表意義的字母來命名,可讀性非常差,可能自己今天寫的,一個星期后回來再看,也忘記其具體代表的含義了。
因此,許多人在寫代碼之前,總會在想啊想啊,用什么命名法好呢?對于經(jīng)常在C 、Java、Python等主流語言上切換的強迫癥來說,換個語言換種命名風格簡直不要太混亂。
既然有這么多命名要做,不妨做好它。本期內(nèi)容中,異步君為大家?guī)砹似饌€好名字應(yīng)遵從的幾條簡單規(guī)則,一起來看看吧
01
名副其實
名副其實說起來簡單。我們想要強調(diào),這事很嚴肅。選個好名字要花時間,但省下來的時間比花掉的多。注意命名,而且一旦發(fā)現(xiàn)有更好的名稱,就換掉舊的。這么做,讀你代碼的人(包括你自己)都會更開心。
變量、函數(shù)或類的名稱應(yīng)該已經(jīng)答復(fù)了所有的大問題。它該告訴你,它為什么會存在,它做什么事,應(yīng)該怎么用。如果名稱需要注釋來補充,那就不算是名副其實。
int d; // elapsed time in days
名稱d什么也沒說明。它沒有引起讀者對時間消逝的感覺,更別說以日計了。我們應(yīng)該選擇指明了計量對象和計量單位的名稱:
int elapsedTimeInDays;int daysSinceCreation;int daysSinceModification;int fileAgeInDays;
選擇體現(xiàn)本意的名稱能讓人更容易理解和修改代碼。下列代碼的目的何在?
public List<int[]> getThem() { List<int[]> list1 = new ArrayList<int[]>(); for (int[] x : theList) if (x[0] == 4) list1.add(x); return list1;}
為什么難以說明上述代碼要做什么事?里面并沒有復(fù)雜的表達式,空格和縮進中規(guī)中矩,只用到三個變量和兩個常量,甚至沒有涉及任何其他類或多態(tài)方法,只是(或者看起來是)一個數(shù)組的列表而已。
問題不在于代碼的簡潔度,而在于代碼的模糊度:即上下文在代碼中未被明確體現(xiàn)的程度。上述代碼要求我們了解類似以下問題的答案:
(1)theList中是什么類型的東西?
(2)theList零下標條目的意義是什么?
(3)值4的意義是什么?
(4)我怎么使用返回的列表?
問題的答案沒體現(xiàn)在代碼段中,可代碼段就是它們該在的地方。比方說,我們在開發(fā)一種掃雷游戲,我們發(fā)現(xiàn),盤面是名為theList的單元格列表,那就將其名稱改為gameBoard。
盤面上每個單元格都用一個簡單數(shù)組表示。我們還發(fā)現(xiàn),零下標條目是一種狀態(tài)值,而該種狀態(tài)值為4表示“已標記”。只要改為有意義的名稱,代碼就會得到相當程度的改進:
public List<int[]> getFlaggedCells() { List<int[]> flaggedCells = new ArrayList<int[]>(); for (int[] cell : gameBoard) if (cell[STATUS_VALUE] == FLAGGED) flaggedCells.add(cell); return flaggedCells;}
注意,代碼的簡潔性并未被觸及。運算符和常量的數(shù)量全然保持不變,嵌套數(shù)量也全然保持不變,但代碼變得明確多了。
還可以更進一步,不用int數(shù)組表示單元格,而是另寫一個類。該類包括一個名副其實的函數(shù)(稱為isFlagged),從而掩蓋住那個魔術(shù)數(shù)[1]。于是得到函數(shù)的新版本:
public ListgetFlaggedCells() { ListflaggedCells = new ArrayList(); for (Cell cell : gameBoard) if (cell.isFlagged()) flaggedCells.add(cell); return flaggedCells;}
只要簡單改一下名稱,就能輕易知道發(fā)生了什么。這就是選用好名稱的力量。
02
避免誤導(dǎo)
程序員必須避免留下掩藏代碼本意的錯誤線索。應(yīng)當避免使用與本意相悖的詞,例如,hp、aix和sco都不該用作變量名,因為它們都是Unix平臺或類Unix平臺的專有名稱。即便你是在編寫三角計算程序,hp看起來是一個不錯的縮寫[2],但那也可能會提供錯誤信息。
別用accountList來指稱一組賬號,除非它真的是List類型。List一詞對程序員有特殊意義。如果包納賬號的容器并非真是一個List,就會引起錯誤的判斷。
所以,用accountGroup或bunchOfAccounts,甚至直接用accounts都會好一些。
提防使用外形相似度較高的名稱。例如,想?yún)^(qū)分模塊中某處的XYZControllerFor-EfficientHandlingOfStrings和另一處的XYZControllerForEfficientStorage-OfStrings,會花多長時間呢?這兩個詞的外形實在太相似了。
以同樣的方式拼寫出同樣的概念才是信息。拼寫前后不一致就是誤導(dǎo)。我們很享受現(xiàn)代Java編程環(huán)境的自動代碼完成特性。鍵入某個名稱的前幾個字母,按一下某個熱鍵組合(如果有的話),就能得到一列該名稱的可能形式。
假如相似的名稱依字母順序放在一起,且差異很明顯,那就會相當有助益,因為程序員多半會壓根不看你的詳細注釋,甚至不看該類的方法列表就直接看名字挑一個對象。
誤導(dǎo)性名稱真正可怕的例子,是用小寫字母l和大寫字母O作為變量名,尤其是在組合使用的時候。當然,問題在于它們看起來完全像是常量“壹”和“零”。
int a = l;if (O == l) a = O1;else l = 01;
讀者可能會認為這純屬虛構(gòu),但我們確曾見過充斥這類名稱的代碼。有一次,代碼作者建議用不同字體寫變量名,好顯得更清楚些,但前提是這種方案得要通過口頭和書面?zhèn)鬟f給未來所有的開發(fā)者才行。后來,只是做了簡單的重命名操作,就解決了問題,而且也沒引起別的問題。
03
做有意義的區(qū)分
如果程序員只是為滿足編譯器或解釋器的需要而寫代碼,就會制造麻煩。例如,因為同一作用范圍內(nèi)兩樣不同的東西不能重名,你可能會隨手改掉其中一個的名稱,有時干脆以錯誤的拼寫充數(shù),結(jié)果就會出現(xiàn)在更正拼寫錯誤后導(dǎo)致編譯器出錯的情況。
光是添加數(shù)字系列或是廢話遠遠不夠,即便這足以讓編譯器滿意。如果名稱必須相異,那么其意思也應(yīng)該不同才對。
以數(shù)字系列命名(a1、a2…aN)是依義命名的對立面。這樣的名稱純屬誤導(dǎo)——完全沒有提供正確信息,沒有提供導(dǎo)向作者意圖的線索。試看:
public static void copyChars(char a1[], char a2[]) { for (int i = 0; i < a1.length; i ) { a2[i] = a1[i]; }}
如果參數(shù)名改為source和destination,這個函數(shù)就會像樣許多。
廢話是另一種沒意義的區(qū)分。假設(shè)你有一個Product類,如果還有一個名為ProductInfo或ProductData的類,那它們的名稱雖然不同,意思卻無區(qū)別。Info和Data就像a、an和the一樣,是意義含混的廢話。
注意,只要體現(xiàn)出有意義的區(qū)分,使用a和the這樣的前綴就沒錯。例如,你可能把a用在域內(nèi)變量,而把the用于函數(shù)參數(shù)[5]。但如果你已經(jīng)有一個名為zork的變量,又想調(diào)用一個名為theZork的變量,麻煩就來了。
廢話都是冗余。variable一詞永遠不應(yīng)當出現(xiàn)在變量名中。table一詞永遠不應(yīng)當出現(xiàn)在表名中。NameString會比Name好嗎?難道Name會是一個浮點數(shù)?如果是這樣,就違反了關(guān)于誤導(dǎo)的規(guī)則。
設(shè)想有一個名為Customer的類,還有一個名為CustomerObject的類,它們的區(qū)別何在呢?哪一個是表示客戶歷史支付情況的最佳方式?
有一個應(yīng)用反映了這種狀況。為當事者諱,我們改了一下,不過犯錯的代碼的確就是這個樣子。
getActiveAccount(); getActiveAccounts(); getActiveAccountInfo(); 程序員怎么知道該調(diào)用哪個函數(shù)呢?
如果缺少明確約定,那么變量moneyAmount與money就沒區(qū)別,customerInfo與customer沒區(qū)別,accountData與account沒區(qū)別,theMessage也與message沒區(qū)別。要區(qū)分名稱,就要以讀者能鑒別不同之處的方式來區(qū)分。
04
使用讀得出來的名稱
人類長于記憶和使用單詞。大腦的相當一部分就是用來容納和處理單詞的。單詞能讀得出來。人類的大腦中有那么大的一塊地方用來處理言語,若不善加利用,實在是種恥辱。
如果名稱讀不出來,討論的時候就會像個傻鳥?!鞍?,這兒,鼻涕阿三喜摁踢(bee cee arr three cee enn tee)[6]上頭,有個皮挨死極翹(pee ess zee kyew)[7]整數(shù),看見沒?”這不是小事,因為編程本就是一種社會活動。
有一家公司,程序里面寫了一個genymdhms(生成日期,年、月、日、時、分、秒),他們一般讀作“gen why emm dee aich emm ess”[8]。我有見字照拼讀的惡習,于是開口就念“gen-yah-mudda-hims”。
后來好些設(shè)計師和分析師都有樣學(xué)樣,聽起來傻乎乎的。我們知道典故,所以會覺得很搞笑。搞笑歸搞笑,實際是在強忍糟糕的命名。在給新開發(fā)者解釋變量名的意義時,他們總是讀出傻乎乎的自造詞,而非恰當?shù)挠⒄Z詞。比較
class DtaRcrd102 { private Date genymdhms; private Date modymdhms; private final String pszqint = "102"; /* ... */};
和class Customer { private Date generationTimestamp; private Date modificationTimestamp; private final String recordId = "102"; /* ... */};
現(xiàn)在讀起來就像人話了:“喂,Mikey,看看這條記錄!生成時間戳(generation timestamp)[9]被設(shè)置為明天了!不能這樣吧?”
05
使用可搜索的名稱
對于單字母名稱和數(shù)字常量,有一個問題,就是很難在一大篇文字中找出來。
找MAX_CLASSES_PER_STUDENT很容易,但想找數(shù)字7就麻煩了,它可能是某些文件名或其他常量定義的一部分,出現(xiàn)在因不同意圖而采用的各種表達式中。如果該常量是個長數(shù)字,又被人錯改過,就會逃過搜索,從而造成錯誤。
同樣,e也不是一個便于搜索的好變量名,它是英文中最常用的字母,在每個程序、每段代碼中都有可能出現(xiàn)。由此而見,長名稱勝于短名稱,搜得到的名稱勝于用自造編碼代寫就的名稱。
竊以為單字母名稱僅用于短方法中的本地變量。名稱長短應(yīng)與其作用域大小相對應(yīng) [N5]。若變量或常量可能在代碼中多處使用,則應(yīng)賦予其便于搜索的名稱。再比較:
for (int j=0; j<34; j ) { s = (t[j]*4)/5;}
和int realDaysPerIdealDay = 4;const int WORK_DAYS_PER_WEEK = 5;int sum = 0;for (int j=0; j < NUMBER_OF_TASKS; j ) { int realTaskDays = taskEstimate[j] * realDaysPerIdealDay; int realTaskWeeks = (realTaskdays / WORK_DAYS_PER_WEEK); sum = realTaskWeeks;}
注意,上面代碼中的sum并非特別有用的名稱,不過至少搜得到它。采用能表達意圖的名稱,貌似拉長了函數(shù)代碼,但要想想看,WORK_DAYS_PER_WEEK比數(shù)字5好找得多,而列表中也只剩下了體現(xiàn)作者意圖的名稱。
06
避免使用編碼
編碼已經(jīng)太多,無謂再自找麻煩。把類型或作用域編進名稱里面,徒然增加了解碼的負擔。沒理由要求每位新人都在弄清要應(yīng)付的代碼之外(那算是正常的),還要再搞懂另一種編碼“語言”。這對解決問題而言,純屬多余的負擔。帶編碼的名稱通常也不便發(fā)音,容易打錯。
匈牙利語標記法
在往昔名稱長短很重要的時代,我們毫無必要地破壞了不編碼的規(guī)矩,如今后悔不迭。Fortran語言要求首字母體現(xiàn)出類型,導(dǎo)致了編碼的產(chǎn)生。BASIC語言的早期版本只允許使用一個字母再加上一位數(shù)字。匈牙利語標記法[10](Hungarian Notation,HN)將這種態(tài)勢愈演愈烈。
在Windows的C語言API的時代,HN相當重要,那時所有名稱要么是一個整數(shù)句柄,要么是一個長指針或者void指針,要不然就是string的幾種實現(xiàn)(有不同的用途和屬性)之一。那時候編譯器并不做類型檢查,程序員需要匈牙利語標記法來幫助自己記住類型。
現(xiàn)代編程語言具有更豐富的類型系統(tǒng),編譯器也記得并強制使用類型。而且,程序員趨向于使用更小的類、更短的方法,好讓每個變量的定義都在視野范圍之內(nèi)。
Java程序員不需要類型編碼,因為對象是強類型的,代碼編輯環(huán)境已經(jīng)先進到在編譯開始前就能監(jiān)測到類型錯誤的程度!所以,如今HN和其他的類型編碼形式都純屬多余。它們增加了修改變量、函數(shù)或類的名稱或類型的難度,它們增加了閱讀代碼的難度,它們制造了讓編碼系統(tǒng)誤導(dǎo)讀者的可能性。
PhoneNumber phoneString;// name not changed when type changed!
成員前綴
也不必用m_前綴來標明成員變量。應(yīng)當把類和函數(shù)做得足夠小,以消除對成員前綴的需要。你應(yīng)當使用某種可以高亮或用顏色標出成員的編輯環(huán)境。
public class Part { private String m_dsc; // The textual description void setName(String name) { m_dsc = name; }}--------------------------------------------------------------------------------------public class Part { String description; void setDescription(String description) { this.description = description; }}
此外,人們會很快學(xué)會無視前綴(或后綴),而只看到名稱中有意義的部分。代碼讀得越多,眼中就越?jīng)]有前綴。最終,前綴變作了不入法眼的廢料,變作了舊代碼的標志物。接口和實現(xiàn)
有時也會出現(xiàn)采用編碼的特殊情形。比如,你在做一個創(chuàng)建形狀用的抽象工廠(Abstract Factory),該工廠是一個接口,要用具體類來實現(xiàn)。你怎么來命名工廠和具體類呢?IShapeFactory和ShapeFactory嗎?我喜歡不加修飾的接口。前導(dǎo)字母I被濫用到了說好聽點兒是干擾,說難聽點兒根本就是廢話的程度。
我不想讓用戶知道我給他們的是接口,而就想讓他們知道那是一個ShapeFactory。如果在接口和實現(xiàn)中必須選其一來編碼的話,我寧肯選擇實現(xiàn)。ShapeFactoryImp,甚至是丑陋的CShapeFactory,都比對接口名稱編碼好。
對代碼規(guī)范感興趣的推薦本書:《代碼整潔之道》