服務(wù)器集群技術(shù)在數(shù)字化校園中的應(yīng)用
數(shù)字化校園的建設(shè)給我們帶來了信息化的校園,但同時,高度的數(shù)據(jù)集中和業(yè)務(wù)應(yīng)用的整合,也使對服務(wù)器環(huán)境的依賴達到了空前的程度,這使得對系統(tǒng)可用性等方面的要求變得越來越高。本文討論的就是如何運用服務(wù)器集群技術(shù)在數(shù)字化校園的系統(tǒng)可用性等方面發(fā)揮出積極的作用。
1 面臨的問題和思路
隨著數(shù)字化校園建設(shè)的推進,伴隨而來的是數(shù)字化校園的各種應(yīng)用服務(wù)和數(shù)據(jù)量的急劇增長,各個級別的用戶諸如教學(xué)、科研、管理、生活服務(wù)等機構(gòu)和師生員工,對信息的收集、處理、整合、存儲、傳輸和應(yīng)用有了更深的認(rèn)識。數(shù)據(jù)集中和各項業(yè)務(wù)整合的同時,核心業(yè)務(wù)對系統(tǒng)安全性能要求在不斷提高,應(yīng)用系統(tǒng)尤其是關(guān)鍵領(lǐng)域的關(guān)鍵性應(yīng)用對可靠性要求也在不斷增加,如何搭建并且應(yīng)用真正高可靠性的服務(wù)器環(huán)境,已成為目前數(shù)字化校園建設(shè)中的迫切需求。
很顯然,在傳統(tǒng)的單機系統(tǒng)中,將應(yīng)用集中配置在一臺服務(wù)器上,往往存在巨大的潛在不穩(wěn)定威脅,主要表現(xiàn)在可用性不高,負(fù)載不能動態(tài)平衡,且數(shù)據(jù)服務(wù)丟失危險性增大,維護和擴展存在困難等等。而采用服務(wù)器集群技術(shù),可提高訪問數(shù)據(jù)庫的效率,提高可靠性和抗災(zāi)難性,這也是服務(wù)器集群技術(shù)最為顯著的特點。
針對上述問題,在數(shù)字化校園公共基礎(chǔ)平臺搭建中,本例采用IBM BladeCenter刀片服務(wù)器,是一種HAHD (HighAvailabilityHighDensity,高可用高密度)的服務(wù)器平臺。和傳統(tǒng)集群技術(shù)相比較,刀片服務(wù)器中所集群的是一個包括獨立CPU、內(nèi)存、驅(qū)動器和網(wǎng)絡(luò)組件等存儲器的服務(wù)器板,通過專門刀片服務(wù)器中集成的交換網(wǎng)絡(luò)實現(xiàn)集群。因此,其不僅在機房寶貴的空間資源上占有相當(dāng)大的優(yōu)勢,而且通過小的“刀片”集群,可組建成一個性能非常高的刀片服務(wù)器集群系統(tǒng),為數(shù)字化校園建設(shè)提供更加經(jīng)濟、技術(shù)成熟和可行的擴展方案。
通過刀片服務(wù)器集群,用以提供核心數(shù)據(jù)庫服務(wù)、郵件、文件存儲、Web服務(wù)和FTP服務(wù)等。并通過深入的資源和應(yīng)用高度集成,結(jié)合統(tǒng)一身份認(rèn)證系統(tǒng),把目前最常用的教務(wù)管理、自動化辦公、科研、設(shè)備器材、數(shù)字圖書館、網(wǎng)絡(luò)教學(xué)、郵件、學(xué)生管理、財務(wù)管理、人事管理等系統(tǒng)整合在一起,最終提供統(tǒng)一獲取信息和發(fā)布信息的個性化平臺。
2 集群(Cluster)技術(shù)
利用集群技術(shù)可使一組相互獨立的服務(wù)器在網(wǎng)絡(luò)中表現(xiàn)為單一的系統(tǒng),并以單一系統(tǒng)的模式加以管理。此單一系統(tǒng)為客戶端提供高可靠性的服務(wù),用于實現(xiàn)更高的可用性、更方便集中的可管理性以及更經(jīng)濟高效的可伸縮性。集群技術(shù)一般都用于Web服務(wù)器、應(yīng)用服務(wù)器等,即沒有共享存儲的服務(wù)。
集群技術(shù)的主要特點可概括為:實現(xiàn)服務(wù)器系統(tǒng)的高可用性,實現(xiàn)最大限度地減少因服務(wù)器的故障而造成的損失;方便在集群擴展從而實現(xiàn)整個系統(tǒng)性能的升級;集群技術(shù)便于實現(xiàn)一體化的解決方案。
3 服務(wù)器集群
服務(wù)器集群是一組協(xié)同工作并運行集群服務(wù)的獨立服務(wù)器,一個服務(wù)器集群包含多臺擁有共享數(shù)據(jù)存儲空間的服務(wù)器,各服務(wù)器之間通過內(nèi)部局域網(wǎng)進行相互通信;當(dāng)其中一臺服務(wù)器發(fā)生故障時,它所運行的應(yīng)用程序?qū)⒂善渌姆?wù)器自動接管。因為響應(yīng)的是相同的服務(wù),因此在大多數(shù)情況下,集群中所有的計算機都擁有一個共同的名稱,集群系統(tǒng)內(nèi)任意一臺服務(wù)器都可被所有的網(wǎng)絡(luò)用戶所訪問,且是透明的,用戶感覺不到任何差別。
在服務(wù)器集群系統(tǒng)中,每一臺服務(wù)器都可承擔(dān)部分計算任務(wù),并且由于集群了多臺服務(wù)器的性能,因此,整體系統(tǒng)的計算能力將得到提高。同時,每臺服務(wù)器還能承擔(dān)一定的容錯任務(wù),當(dāng)其中某臺服務(wù)器出現(xiàn)故障時,系統(tǒng)可以在專用軟件的支持下將這臺服務(wù)器與系統(tǒng)隔離,并通過各服務(wù)器之間的負(fù)載轉(zhuǎn)移機制實現(xiàn)新的負(fù)載平衡,同時向系統(tǒng)管理員發(fā)出報警信號。
服務(wù)器集群與雙機熱備份技術(shù)有本質(zhì)上的區(qū)別,即能否實現(xiàn)并行處理和節(jié)點機失效后的任務(wù)平滑接管。雙機或多機熱備份技術(shù)的原理是一臺主機做服務(wù)器,其它主機做備份機,備份機在服務(wù)器故障失效時進行接管。而刀片式服務(wù)器所應(yīng)用的集群技術(shù),較傳統(tǒng)集群又存在一定的差別,其更利于集群的形成和部署。
4 服務(wù)器集群技術(shù)在數(shù)字化校園中的優(yōu)勢
數(shù)字化校園建設(shè)中,服務(wù)器環(huán)境中的主要技術(shù)和產(chǎn)品首要綜合考慮的是實用、可靠、經(jīng)濟、安全以及可擴展、可維護等性能。隨著校園網(wǎng)用戶和應(yīng)用規(guī)模的擴大,服務(wù)器的整體性能必須能適應(yīng)數(shù)字化校園這一發(fā)展變化。針對以上需求,服務(wù)器集群主要優(yōu)勢在于可以提供更高的可用性、更方便的可管理性以及更經(jīng)濟高效的可伸縮性,表現(xiàn)為可以得到一個較高的整體性能。
4.1 關(guān)鍵應(yīng)用獲得高可用性
應(yīng)用服務(wù)器集群的最終目標(biāo)之一,就是盡量減少服務(wù)器和應(yīng)用程序的停機時間,以保證核心數(shù)據(jù)、關(guān)鍵應(yīng)用和重要業(yè)務(wù)部門的信息和服務(wù)安全,實現(xiàn)校園網(wǎng)絡(luò)及其應(yīng)用系統(tǒng)的穩(wěn)定高效運行。
服務(wù)器集群帶來的高可用性不僅適用于提供靜態(tài)數(shù)據(jù)的服務(wù),而且適用于提供動態(tài)數(shù)據(jù)的服務(wù),如公共數(shù)據(jù)庫服務(wù)、學(xué)生管理信息系統(tǒng)等,且這些數(shù)據(jù)必須得到極為穩(wěn)妥的保管,需要服務(wù)器提供足夠強大的和可靠的磁盤冗余功能。在本例的實際應(yīng)用中,通過采用三塊刀片式服務(wù)器運行Oracle核心數(shù)據(jù)庫服務(wù),即屬高可用性集群服務(wù),目的是在系統(tǒng)出現(xiàn)某些故障的情況下,仍能繼續(xù)對外提供服務(wù),以最大限度地減少服務(wù)的中斷時間。再如,通過服務(wù)器集群,資源(如Internet協(xié)議(IP)地址)的所有權(quán)會自動從故障服務(wù)器轉(zhuǎn)移到與之并行工作的服務(wù)器。即當(dāng)群集中的某個系統(tǒng)或應(yīng)用程序發(fā)生故障時,通過約定的負(fù)載轉(zhuǎn)移機制,群集軟件會在可用的服務(wù)器上重新啟動故障應(yīng)用程序,或者將工作從故障節(jié)點分散到剩下的節(jié)點上,而這個過程對用戶而言是完全透明的。這樣,即使集群中的一個服務(wù)器意外停機,使集群的配備性能降低,但它依舊可以正常運作。
在進行硬件規(guī)劃時,可以考慮根據(jù)應(yīng)用類型的不同而劃分出若干個集群,如有些校園網(wǎng)中就將網(wǎng)絡(luò)教學(xué)平臺中的服務(wù)器劃分為前端服務(wù)器集群、中間服務(wù)器集群和后端集中存儲三大組成部分。其中前端服務(wù)器集群包含多個Web服務(wù)器,中間服務(wù)器集群由數(shù)據(jù)庫服務(wù)器、流媒體服務(wù)器、語音服務(wù)器和數(shù)據(jù)備份服務(wù)器等組成。
此外,在校園網(wǎng)中,其它網(wǎng)絡(luò)應(yīng)用服務(wù)諸如郵件服務(wù)、內(nèi)部論壇、內(nèi)部資源庫服務(wù)和教學(xué)視頻點播服務(wù)等等,是校園網(wǎng)絡(luò)教學(xué)易造成瓶頸的關(guān)鍵應(yīng)用,亦要求服務(wù)器能夠處理成規(guī)模的客服端的并發(fā)訪問,這些應(yīng)用要求具有非常高的可靠性和彈力恢復(fù)能力,必須具有一定的容錯能力,保障在意外情況下不中斷用戶的正常工作。4.2 集中和方便的可管理性
因為服務(wù)器集群是作為單一系統(tǒng)進行管理的一組獨立的服務(wù)器,可以將群集作為一個單一的系統(tǒng)進行管理。管理員能夠?qū)λ屑嘿Y源的狀態(tài)一目了然,方便將工作負(fù)載分配給集群之中的服務(wù)器,有利于對服務(wù)器進行“滾動升級”,極大減少了管理員介入管理的深度。同時由于每塊“刀片”都是熱插拔的,所以,系統(tǒng)可以輕松地進行替換,亦可針對計劃釋放集群中特定服務(wù)器進行維護,或在集群中插入新的“刀片”,提高整體性能,并且將維護時間減少到最小,確保了系統(tǒng)具有良好的可管理性及可維護性。
在服務(wù)器集群模式下,可以利用內(nèi)置的轉(zhuǎn)換器將以太網(wǎng)數(shù)據(jù)和管理網(wǎng)絡(luò),以及將新型的智能KVM(Keyboard,Video,Mouse)連接集在一起,從而實現(xiàn)服務(wù)器集群可以通過KVM轉(zhuǎn)換板共享一套光驅(qū)、軟驅(qū)、鍵盤、顯示器和鼠標(biāo),以訪問多臺服務(wù)器,從而便于進行升級、維護和訪問服務(wù)器上的文件,在很大程度簡化了設(shè)備的連接和管理。顯然,集群的服務(wù)器數(shù)越多,這一優(yōu)勢更明顯。
4.3 系統(tǒng)完備的可伸縮性
數(shù)字化校園建設(shè)整體是一個循序漸進、不斷擴充的過程,系統(tǒng)的可伸縮性性能是日后進行擴展必須考量的一個重要指標(biāo),也是數(shù)字化校園建設(shè)中長期規(guī)劃的一個重要環(huán)節(jié)。在服務(wù)器平臺搭建上,主要是指可通過增加容量擴展和跨越處理器進行負(fù)載平衡的能力。
隨著需求的不斷增加和變化,服務(wù)器集群提供了隨著發(fā)展進行擴展支付的環(huán)境:向現(xiàn)有系統(tǒng)內(nèi)添加節(jié)點的能力,并重新實現(xiàn)負(fù)載平衡機制。實際應(yīng)用中所采用的刀片服務(wù)器在群集擴展能力方面,具有先天優(yōu)勢,只需要把各個“刀片”插入到刀片機箱中,利用自身的集群管理軟件就可以很輕松地擴展刀片服務(wù)器群。
除擴展性能之外,服務(wù)器集群技術(shù)亦是實現(xiàn)負(fù)載均衡的基礎(chǔ)。負(fù)載平衡意味著將相關(guān)應(yīng)用和資源從繁忙節(jié)點轉(zhuǎn)移到不繁忙節(jié)點,從而能從容應(yīng)對大量的并發(fā)式訪問請求,以減少用戶等待響應(yīng)的時間?;蛘撸瑔蝹€重負(fù)載的運算可分擔(dān)到多臺節(jié)點設(shè)備上做并行處理,使系統(tǒng)處理能力得到大幅度提高。
以Web應(yīng)用為例,Web應(yīng)用服務(wù)器集群系統(tǒng),是由一群同時運行同一個Web應(yīng)用的服務(wù)器組成的集群系統(tǒng),即通過服務(wù)器集群技術(shù)將若干服務(wù)器劃分為一個應(yīng)用群組,以建立高可用性Web服務(wù)器集群,形成負(fù)載均衡集群。在這樣的集群配置中,多臺服務(wù)器可以執(zhí)行同樣的應(yīng)用和數(shù)據(jù)庫操作。在案例中,通過Linux Virtual Server應(yīng)用層集群的部署,可提供和節(jié)點個數(shù)成正比的負(fù)載能力。
通過對數(shù)字化校園中諸如網(wǎng)絡(luò)教學(xué)等應(yīng)用的分析,Web應(yīng)用占很大的比重,數(shù)字化校園的服務(wù)承載及業(yè)務(wù)處理的主應(yīng)用服務(wù)器,主要完成來自Web服務(wù)器轉(zhuǎn)發(fā)的業(yè)務(wù)處理請求。集群服務(wù)器將眾多的訪問請求分散到系統(tǒng)中的不同節(jié)點進行處理,從而實現(xiàn)了更高的有效性和穩(wěn)定性。在外界看來,整體表現(xiàn)就像是一個服務(wù)器一樣。均衡了集群服務(wù)器的負(fù)載,則達到優(yōu)化系統(tǒng)性能的目的,而這也正是基于Web的應(yīng)用于數(shù)字化校園門戶所必須具備的特性。
4.4 快速的故障恢復(fù)能力
服務(wù)器集群把可用性和可伸縮性這兩個優(yōu)點集于一身,因此其快速的故障恢復(fù)能力是明顯的。在故障服務(wù)器重新回到聯(lián)機初始狀態(tài)時,群集服務(wù)將自動在群集中重新分配工作負(fù)荷,將應(yīng)用服務(wù)部署于剛加入的節(jié)點機中。
5 結(jié)束語
綜合以上考量,服務(wù)器集群技術(shù)為數(shù)字化校園建設(shè)提供了實現(xiàn)高可用性、高可管理性和高伸縮性能的選擇,從而為數(shù)字化校園整體性能的提升注入充足的動力。
參考文獻
[1] 康小軍,邵虹,劉吉濤.《負(fù)載均衡技術(shù)解決網(wǎng)絡(luò)教學(xué)瓶頸》. http://www.media.edu.cn/,中國教育網(wǎng)絡(luò),2007-12
[2] 王虎.《服務(wù)器集群技術(shù)及其在視頻網(wǎng)絡(luò)中的應(yīng)用》. 河南省廣播電視優(yōu)秀科技論文,2004
[3] 郎宇征,賈美英.《服務(wù)器集群為數(shù)據(jù)庫系統(tǒng)搭臺》. http://www.pcworld.com.cn/,2005
更多計算機與外設(shè)信息請關(guān)注:21ic計算機與外設(shè)頻道