“好的架構圖充滿美感”,一個架構好不好,從審美的角度就能看得出來。后來我看了很多系統(tǒng)的架構,發(fā)現(xiàn)這個言論基本成立。那么反觀淘寶前面的兩個版本的架構,你看哪個比較美?
顯然第一個比較好看,后面那個顯得頭重腳輕,這也注定了它不是一個穩(wěn)定的版本,只存活了不到半年的時間。2004年初,SQL Relay的問題解決不了,數(shù)據(jù)庫必須要用Oracle,那從哪里動刀?只有換開發(fā)語言了。換什么語言好呢?Java。Java是當時最成熟的網(wǎng)站開發(fā)語言,它有比較良好的企業(yè)開發(fā)框架,被世界上主流的大規(guī)模網(wǎng)站普遍采用,另外有Java開發(fā)經(jīng)驗的人才也比較多,后續(xù)維護成本會比較低。
到2004年上半年,淘寶網(wǎng)已經(jīng)運行了一年的時間,這一年積累了大量的用戶,也快速的開發(fā)了很多功能,當時這個網(wǎng)站已經(jīng)很龐大了,而且新的需求還在源源不斷的過來。把一個龐大的網(wǎng)站的開發(fā)語言換掉,無異于脫胎換骨,在換的過程中還不能拖慢業(yè)務的發(fā)展,這無異于邊換邊跑,對時間和技術能力的要求都非常高。做這樣的手術,需要請第一流的專家來主刀?,F(xiàn)在再考一下讀者,如果你在這個創(chuàng)業(yè)團隊里面,請什么樣的人來做這事?我們的答案是請Sun的人。沒錯,就是創(chuàng)造Java語言的那家公司,世界上沒有比他們更懂Java的了。除此之外,還有一個不為人知的原因,……(此處和諧掉200字,完整版見aliway)
這幫Sun的工程師的確很強大,在筆者2004年底來淘寶的時候,他們還在,有幸跟他們共事了幾個月?,F(xiàn)在擺在他們面前的問題是用什么辦法把一個龐大的網(wǎng)站從PHP語言遷移到Java?而且要求在遷移的過程中,不停止服務,原來系統(tǒng)的bugfix和功能改進不受影響。親,你要是架構師,你怎么做?有人的答案是寫一個翻譯器,如同把中文翻譯成英文一樣,自動翻譯。我只能說你這個想法太超前了,換個說法就是“too simple, sometimes naive”。當時沒有,現(xiàn)在也沒有人能做到。他們的大致方案是給業(yè)務分模塊,一個模塊一個模塊的替換。如用戶模塊,老的member.taobao.com繼續(xù)維護,不添加新功能,新的功能先在新的模塊上開發(fā),跟老的共用一個數(shù)據(jù)庫,開發(fā)完畢之后放到不同的應用集群上,另開個域名member1.taobao.com,同時替換老的功能,替換一個把老的模塊上的功能關閉一個,逐漸的把用戶引導到member1.taobao.com,等所有功能都替換完畢之后,關閉member.taobao.com。后來很長時間里面都是在用member1這樣奇怪的域名,兩年后有另外一家互聯(lián)網(wǎng)公司開始做電子商務了,我們發(fā)現(xiàn)他們的域名也叫member1.xx.com、auction1.xx.com……
說了開發(fā)模式,再說說用到的Java MVC框架,當時的struts1.x是用的比較多的框架,但是用過webwork和struts2的同學可能知道,struts1.x在多人協(xié)作方面有很多致命的弱點,由于沒有一個輕量框架作為基礎,因此很難擴展,這樣架構師對于基礎功能和全局功能的控制就很難做到。而阿里巴巴的18個創(chuàng)始人之中,有個架構師,在Jakarta Turbine的基礎上,做了很多擴展,打造了一個阿里巴巴自己用的MVC框架WebX ( http://www.openwebx.org/docs/Webx3_Guide_Book.html ),這個框架易于擴展,方便組件化開發(fā),它的頁面模板支持JSP和velocity等、持久層支持ibatis和hibernate等、控制層可以用EJB和Spring(Spring是后來才有的)。項目組選擇了這個強大的框架,這個框架如果當時開源了,也許就沒有webwork和struts2什么事了。另外,當時Sun在全世界大力推廣他們的EJB,雖然淘寶的架構師認為這個東東用不到,但他們還是極力堅持。在經(jīng)歷了很多次的技術討論、爭論和爭吵之后,這個系統(tǒng)的架構就變成了下圖的樣子:
[!--empirenews.page--]
Java應用服務器是Weblogic,MVC框架是WebX、控制層用了EJB、持久層是ibatis,另外為了緩解數(shù)據(jù)庫的壓力,商品查詢和店鋪查詢放在搜索引擎上面。這個架構圖是不是好看了一點了,親?
這幫Sun的工程師開發(fā)完淘寶的網(wǎng)站之后,又做了一個很牛的網(wǎng)站,叫“支付寶”。
其實在任何時候,開發(fā)語言本身都不是系統(tǒng)的瓶頸,業(yè)務帶來的壓力更多的是壓到了數(shù)據(jù)和存儲上。上面一篇也說到,MySQL撐不住了之后換Oracle,Oracle的存儲一開始在本機上,后來在NAS上,NAS撐不住了用EMC的SAN存儲,再然后Oracle的RAC撐不住了,數(shù)據(jù)的存儲方面就不得不考慮使用小型機了。在2004年的夏天,DBA七公、測試工程師郭芙和架構師行癲,踏上了去北京測試小型機的道路。他們帶著小型機回來的時候,我們像歡迎領袖一樣的歡迎他們,因為那個是我們最值錢的設備了,價格表上的數(shù)字嚇死人。小型機買回來之后我們爭相合影,然后Oracle就跑在了小型機上,存儲方面從EMC低端cx存儲到Sun oem hds高端存儲,再到EMC dmx高端存儲,一級一級的往上跳。
到現(xiàn)在為止,我們已經(jīng)用上了IBM的小型機、Oracle的數(shù)據(jù)庫、EMC的存儲,這些東西都是很貴的,那些年可以說是花錢如流水啊。有人說過“錢能解決的問題,就不是問題”,但隨著淘寶網(wǎng)的發(fā)展,在不久以后,錢已經(jīng)解決不了我們的問題了?;ㄥX買豪華的配置,也許能支持1億PV的網(wǎng)站,但淘寶網(wǎng)的發(fā)展實在是太快了,到了10億怎么辦?到了百億怎么辦?在N年以后,我們不得不創(chuàng)造技術,解決這些只有世界頂尖的網(wǎng)站才會遇到的問題。后來我們在開源軟件的基礎上進行自主研發(fā),一步一步的把IOE(IBM小型機、Oracle、EMC存儲)這幾個“神器”都去掉了。這就如同在《西游記》里面,妖怪們拿到神仙的兵器會非常厲害,連猴子都能夠打敗,但最牛的神仙是不用這些神器的,他們揮一揮衣袖、翻一下手掌就威力無比。去IOE這一部分會在最后一個章節(jié)里面講,這里先埋個千里伏筆。