當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式軟件
[導(dǎo)讀]融合NAS和SAN的存儲(chǔ)網(wǎng)絡(luò)設(shè)計(jì)

引言
  

IT技術(shù)的發(fā)展經(jīng)歷三次浪潮:第一次浪潮以處理技術(shù)為中心,以處理器的發(fā)展為核心動(dòng)力,產(chǎn)生了計(jì)算機(jī)工業(yè),促進(jìn)了計(jì)算機(jī)的迅速普及和應(yīng)用;第二次浪潮以傳輸技術(shù)為中心,以網(wǎng)絡(luò)的發(fā)展為核心動(dòng)力。這兩次浪潮極大地加速了信息數(shù)字化進(jìn)程,使得越來(lái)越多的人類(lèi)信息活動(dòng)轉(zhuǎn)變?yōu)閿?shù)字形式,從而導(dǎo)致數(shù)字化信息爆炸性地增長(zhǎng),進(jìn)而引發(fā)IT技術(shù)的第三次發(fā)展浪潮:存儲(chǔ)技術(shù)浪潮。


存儲(chǔ)技術(shù)浪潮的核心是基于網(wǎng)絡(luò)的存儲(chǔ)技術(shù)。目前,流行的網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)主要有兩種:附網(wǎng)存儲(chǔ)(NAS) 和存儲(chǔ)區(qū)域網(wǎng)(SAN)。按照存儲(chǔ)網(wǎng)絡(luò)工業(yè)協(xié)會(huì)(SNIA) 的定義:NAS 是可以直接聯(lián)到網(wǎng)絡(luò)上向用戶提供文件級(jí)服務(wù)的存儲(chǔ)設(shè)備,而SAN 是一種利用Fibre Channel 等互聯(lián)協(xié)議連接起來(lái)的可以在服務(wù)器和存儲(chǔ)系統(tǒng)之間直接傳送數(shù)據(jù)的網(wǎng)絡(luò)。NAS 是一種存儲(chǔ)設(shè)備,有其自己簡(jiǎn)化的實(shí)時(shí)操作系統(tǒng),它將硬件和軟件有效地集成在一起,用以提供文件服務(wù),具有良好的共享性、開(kāi)放性、可擴(kuò)展性。SAN 技術(shù)的存儲(chǔ)設(shè)備是用專(zhuān)用網(wǎng)絡(luò)相連的,這個(gè)網(wǎng)絡(luò)是一個(gè)基于光纖通道協(xié)議的網(wǎng)絡(luò)。 由于光纖通道的存儲(chǔ)網(wǎng)和LAN 分開(kāi),性能就很高。在SAN 中,容量擴(kuò)展、數(shù)據(jù)遷移、數(shù)據(jù)本地備份和遠(yuǎn)程容災(zāi)數(shù)據(jù)備份都比較方便,整個(gè)SAN 成為一個(gè)統(tǒng)一管理的存儲(chǔ)池( storage pool) 。由于具有這些優(yōu)異的性能,SAN 已成為企業(yè)存儲(chǔ)的重要技術(shù)。


但在實(shí)際應(yīng)用中NAS 和SAN 也存在很多缺陷,越來(lái)越不能滿足IT技術(shù)的快速發(fā)展和數(shù)字化信息爆炸性地增長(zhǎng)的需求。如NAS 設(shè)備存在如下缺陷: (1) 數(shù)據(jù)的傳輸速度慢,因?yàn)镹AS只能提供文件級(jí)而不能提供塊級(jí)的數(shù)據(jù)傳輸; (2) 數(shù)據(jù)備份時(shí)性能較低,NAS 在數(shù)據(jù)備份時(shí)要占用其大部分網(wǎng)絡(luò)帶寬,其它I/O 性能受到影響; (3) 只能管理單個(gè)NAS ,很難將位于同一局域網(wǎng)中的多個(gè)NAS 集中管理。SAN 也存在以下缺陷: (1) 設(shè)備的互操作性較差,不同廠家的設(shè)備很難互操作; (2) 構(gòu)建SAN成本高,目前只有實(shí)力較大的企業(yè)構(gòu)建自己的SAN; (3) 管理和維護(hù)成本高,企業(yè)需要花錢(qián)培訓(xùn)專(zhuān)門(mén)的管理和維護(hù)人員;(4) SAN 只能提供存儲(chǔ)空間共享而不能提供異構(gòu)環(huán)境下的文件共享。


針對(duì)NAS 和SAN 的優(yōu)缺點(diǎn),目前出現(xiàn)了多種新的網(wǎng)絡(luò)存儲(chǔ)技術(shù), 如: NAS Gateway (NAS head) 、基于IP 的SAN 技術(shù)、對(duì)象存儲(chǔ)技術(shù)。NAS 網(wǎng)關(guān)能將SAN 連結(jié)到IP 網(wǎng)絡(luò),使IP 網(wǎng)絡(luò)用戶能通過(guò)NAS 網(wǎng)關(guān)直接訪問(wèn)SAN 中的存儲(chǔ)設(shè)備,所以NAS 網(wǎng)關(guān)具有以下優(yōu)點(diǎn):能使NAS 和SAN 互連在同一LAN中,突破了FC 拓?fù)涞南拗?允許FC 設(shè)備在IP 網(wǎng)絡(luò)使用;減少了光纖設(shè)備的訪問(wèn)成本,允許訪問(wèn)未有充分利用的SAN 存儲(chǔ)空間?;贗P 的SAN 互連技術(shù)主要包括: FCIP( IP tunneling) 、iFCP、iSCSI、Infiniband、mFCP ,其代表技術(shù)是iSCSI 技術(shù)。iSCSI技術(shù)原理是將SCSI 協(xié)議映射到TCP/ IP之上,即將主機(jī)的SCSI 命令封裝成TCP/ IP 數(shù)據(jù)包,在IP 網(wǎng)絡(luò)上傳輸,到達(dá)目的節(jié)點(diǎn)后,再恢復(fù)成封裝前的SCSI 命令,從而實(shí)現(xiàn)SCSI 命令在IP網(wǎng)絡(luò)上的直接、透明傳輸,使訪問(wèn)遠(yuǎn)程的SCSI 盤(pán)可以像本地的硬盤(pán)一樣方便。 存儲(chǔ)對(duì)象具有文件和塊二者的優(yōu)點(diǎn):象數(shù)據(jù)塊一樣在存儲(chǔ)設(shè)備上被直接訪問(wèn);通過(guò)一個(gè)對(duì)象接口,能象文件一樣,在不同操作系統(tǒng)平臺(tái)上實(shí)現(xiàn)數(shù)據(jù)共享。NAS Gateway 雖實(shí)現(xiàn)了NAS 和SAN 在IP 的融合,但不是真正的融合,因?yàn)樗荒軐AS 設(shè)備和SAN 設(shè)備融合起來(lái)向用戶提供統(tǒng)一的存儲(chǔ)池,用戶也只能以文件I/O的方式訪問(wèn)存儲(chǔ)設(shè)備。對(duì)象存儲(chǔ)雖具有NAS 和SAN 的優(yōu)點(diǎn),但需要設(shè)計(jì)專(zhuān)門(mén)的對(duì)象存儲(chǔ)接口,需要對(duì)現(xiàn)有的文件系統(tǒng)進(jìn)行修改,這阻礙了它的進(jìn)一步普及推廣。


本文提出并實(shí)現(xiàn)了一種在IP 協(xié)議下融合iSCSI、NAS、SAN 的統(tǒng)一存儲(chǔ)網(wǎng)絡(luò)(簡(jiǎn)稱(chēng)USN) 。在USN 中,NAS 設(shè)備、iSCSI設(shè)備和SAN 設(shè)備并存,用戶可以塊I/O 的方式訪問(wèn)USN 中的iSCSI 設(shè)備和SAN 存儲(chǔ)設(shè)備,也可以文件I/O 方式訪問(wèn)USN 中的NAS 存儲(chǔ)設(shè)備和SAN 存儲(chǔ)設(shè)備,整個(gè)USN 是一個(gè)統(tǒng)一的存儲(chǔ)池。并且,USN 能同時(shí)提供服務(wù)器通道和附網(wǎng)高速通道向客戶機(jī)提供數(shù)據(jù),減少了服務(wù)器瓶頸,提高系統(tǒng)的I/O 速度。USN 既有NAS 的優(yōu)點(diǎn)(低成本、開(kāi)放性、文件共享) ,又有SAN 的優(yōu)點(diǎn)(高性能、高擴(kuò)展性) 。USN 同NAS Gateway(NAS head) 技術(shù)、基于IP 的SAN 技術(shù)、對(duì)象存儲(chǔ)技術(shù)相比具有明顯的優(yōu)勢(shì)。


 USN總體結(jié)構(gòu)
  

USN 系統(tǒng)的硬件結(jié)構(gòu)如圖1 所示。USN 由NAS 設(shè)備、iSCSI設(shè)備和SAN 設(shè)備,以及元數(shù)據(jù)服務(wù)器和應(yīng)用服務(wù)器組成。用戶可以文件I/O 的方式訪問(wèn)USN 中的NAS 設(shè)備和經(jīng)過(guò)NAS頭訪問(wèn)SAN 中的存儲(chǔ)設(shè)備,也可以塊I/O 的方式訪問(wèn)USN 中的iSCSI 設(shè)備和SAN 中的存儲(chǔ)設(shè)備。USN 同時(shí)向用戶提供服務(wù)器通道和附網(wǎng)高速通道,對(duì)于元數(shù)據(jù)和小數(shù)據(jù)請(qǐng)求都經(jīng)過(guò)服務(wù)器通道完成,對(duì)于大數(shù)據(jù)請(qǐng)求則經(jīng)過(guò)附網(wǎng)高速通道完成,這樣大大提高整個(gè)系統(tǒng)的I/O 速度,減少服務(wù)器瓶頸。整個(gè)USN 是用基于IP 的技術(shù)構(gòu)建,可以兼容現(xiàn)有的存儲(chǔ)系統(tǒng),添加和刪除存儲(chǔ)設(shè)備都很方便。所以,整個(gè)系統(tǒng)的性能、擴(kuò)展性都很好。USN 真正實(shí)現(xiàn)了NAS 和SAN 的統(tǒng)一,即同一存儲(chǔ)網(wǎng)絡(luò)中既有NAS 設(shè)備,又有SAN 結(jié)構(gòu);實(shí)現(xiàn)文件I/ O 和塊I/O 的統(tǒng)一,即用戶可以文件I/O 方式(文件為單位) 也可以塊I/O方式(塊為單位) 訪問(wèn)USN 中的設(shè)備;實(shí)現(xiàn)了文件協(xié)議和塊協(xié)議在TCP/ IP 協(xié)議上的統(tǒng)一,用戶可以NFS(Unix 用戶) 和CIFS(Windows 用戶) 訪問(wèn)USN ,也可以SCSI(iSCSI 用戶) 訪問(wèn)USN。

 

圖2 是USN 的軟件結(jié)構(gòu)圖,其中GMPFS 是全局多協(xié)議文件系統(tǒng),位于USN 系統(tǒng)中的各個(gè)應(yīng)用服務(wù)器上,它支持使用CIFS 協(xié)議的Windows 用戶對(duì)USN 的訪問(wèn),支持使用NFS 協(xié)議的UNIX用戶對(duì)USN 的訪問(wèn),也支持使用iSCSI 協(xié)議的塊協(xié)議用戶對(duì)USN 的訪問(wèn)。GMPFS 通過(guò)對(duì)目前存儲(chǔ)系統(tǒng)所使用的元 數(shù)據(jù)進(jìn)行擴(kuò)展,采用啟發(fā)式的方法,收集用戶應(yīng)用信息,為用戶提供統(tǒng)一、方便、快捷的存儲(chǔ)訪問(wèn)接口以及合理的數(shù)據(jù)存儲(chǔ)方案。ASA 是自主存儲(chǔ)代理模塊,它能夠自動(dòng)地發(fā)現(xiàn)海量存儲(chǔ)系統(tǒng)中存儲(chǔ)設(shè)備的種類(lèi)和可利用的各種資源,自主地對(duì)這些存儲(chǔ)設(shè)備和資源進(jìn)行有效的統(tǒng)一管理和優(yōu)化。ASA 根據(jù)應(yīng)用的不同和應(yīng)用的具體需求,安排與應(yīng)用相適應(yīng)的存儲(chǔ)設(shè)備種類(lèi)、性能以及可靠性和可用性等級(jí)等,并為I/ O 請(qǐng)求選擇合適的數(shù)據(jù)通道,使應(yīng)用得到最優(yōu)的存儲(chǔ)資源分配,從而使整個(gè)系統(tǒng)的性能達(dá)到最佳。

[!--empirenews.page--]

系統(tǒng)設(shè)計(jì)
  

USN 是一個(gè)復(fù)雜的系統(tǒng),涉及到許多復(fù)雜的技術(shù),本文主要論述其核心技術(shù)的設(shè)計(jì)和實(shí)現(xiàn),即GMPFS、ASA 和iSCSI 系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。 GMPFS 可以駐留在多種操作系統(tǒng)平臺(tái)上(UNIX,Windows ,Linux) ,支持各種協(xié)議用戶的訪問(wèn)(NFS ,CIFS ,iSCSI) ,為用戶或應(yīng)用程序提供對(duì)網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)的數(shù)據(jù)訪問(wèn)服務(wù)。 ASA 將多種存儲(chǔ)技術(shù)(這些存儲(chǔ)技術(shù)各有所長(zhǎng),也各有所短) 整合為一個(gè)統(tǒng)一的海量存儲(chǔ)系統(tǒng),充分發(fā)揮各種存儲(chǔ)技術(shù)的優(yōu)勢(shì),使得該存儲(chǔ)系統(tǒng)對(duì)特定的應(yīng)用程序而言服務(wù)性能達(dá)到最優(yōu),有效地滿足多方面的應(yīng)用需求。iSCSI 真正的實(shí)現(xiàn)了塊I/ O 和文件I/ O 在IP 網(wǎng)絡(luò)上的統(tǒng)一,文件協(xié)議和塊協(xié)議在IP 協(xié)議上的統(tǒng)一。


 全局多協(xié)議文件系統(tǒng)的設(shè)計(jì)
GMPFS 保留了分布式文件系統(tǒng)的靈活性和高性能的優(yōu)點(diǎn),而克服了其在不同I/ O 協(xié)議支持方面的缺陷,能同時(shí)支持NFS、CIFS 和iSCSI 協(xié)議用戶的訪問(wèn)。 GMPFS 在提供文件存取的方法和文件目錄結(jié)構(gòu)的同時(shí),還為每種存儲(chǔ)卷提供特定的存儲(chǔ)模式。 每種存儲(chǔ)模式包含某種文件系統(tǒng)的元數(shù)據(jù)結(jié)構(gòu),操作接口(文件類(lèi)型和數(shù)據(jù)塊類(lèi)型) ,功能函數(shù)集(格式化,檢索等) ,優(yōu)化方法(cache方法和預(yù)取等) 和存儲(chǔ)空間分配回收方法及數(shù)據(jù)結(jié)構(gòu)。對(duì)于文件卷而言,存儲(chǔ)模式包含實(shí)現(xiàn)POSIX語(yǔ)義的操作函數(shù)和文件目錄結(jié)構(gòu);對(duì)于分區(qū)卷而言,存儲(chǔ)模式必須面向特定分區(qū)類(lèi)型,如NTFS ,ext3。 所有的存儲(chǔ)模式都必須在元數(shù)據(jù)服務(wù)器中的ASA 系統(tǒng)中注冊(cè),以便ASA 為用戶的I/O 請(qǐng)求進(jìn)行通道選擇。

 

GMPFS的結(jié)構(gòu)如圖3 所示。其中協(xié)議轉(zhuǎn)換接口主要通過(guò)NFS 的擴(kuò)展程序模塊和samba 模塊的組合對(duì)NFS 協(xié)議和CIFS協(xié)議的支持,并通過(guò)iSCSI 目標(biāo)器驅(qū)動(dòng)程序的擴(kuò)展對(duì)iSCSI 協(xié)議的支持。啟發(fā)式數(shù)據(jù)管理接口主要是用啟發(fā)式方法獲得用戶對(duì)存儲(chǔ)數(shù)據(jù)的需要,如性能、使用率以及安全性等。GMPFS數(shù)據(jù)組織邏輯界面提供數(shù)據(jù)組織的邏輯視圖,這一點(diǎn)正是針對(duì)傳統(tǒng)文件系統(tǒng)文件目錄結(jié)構(gòu)對(duì)于海量數(shù)據(jù)難以管理的弱點(diǎn),在增加元數(shù)據(jù)信息的前提下,通過(guò)查詢和檢索,按照用戶需要提供各種類(lèi)型文件視圖,例如根據(jù)文件創(chuàng)建的用戶和時(shí)間進(jìn)行分類(lèi)。擴(kuò)展的文件或卷操作接口、數(shù)據(jù)組織與分配管理、元數(shù)據(jù)組織結(jié)構(gòu)和I/ O 定向器等主要是保證與傳統(tǒng)的文件系統(tǒng)操作語(yǔ)義兼容,實(shí)現(xiàn)程序級(jí)的數(shù)據(jù)訪問(wèn)。應(yīng)用程序無(wú)需修改就可以使用USN 系統(tǒng)中的數(shù)據(jù)。提供與元數(shù)據(jù)服務(wù)器中的ASA 及存儲(chǔ)資源的接口和通訊,能充分利用ASA 系統(tǒng)所掌握的存儲(chǔ)資源,合理組織數(shù)據(jù),滿足用戶或應(yīng)用程序?qū)?shù)據(jù)存儲(chǔ)的多方面、個(gè)性化要求。如通過(guò)同時(shí)提供服務(wù)器通道和附網(wǎng)高速通道,改善用戶的I/ O 性能服務(wù),減少服務(wù)器瓶頸。


iSCSI系統(tǒng)設(shè)計(jì)
iSCSI 協(xié)議定義的是SCSI 到TCP/ IP 的映射,即將主機(jī)的SCSI 命令封裝成IP 數(shù)據(jù)包,在IP 網(wǎng)絡(luò)上傳輸,到達(dá)目的節(jié)點(diǎn)后,再恢復(fù)成封裝前的SCSI 命令,從而實(shí)現(xiàn)SCSI 命令在IP 網(wǎng)絡(luò)上的直接、透明傳輸。它整合了現(xiàn)有的存儲(chǔ)協(xié)議SCSI 和主流網(wǎng)絡(luò)協(xié)議TCP/ IP 等兩種主流協(xié)議,實(shí)現(xiàn)了存儲(chǔ)和網(wǎng)絡(luò)的無(wú)縫融合。從應(yīng)用的角度看,iSCSI 一方面通過(guò)SCSI 命令的遠(yuǎn)程傳送,實(shí)現(xiàn)了和遠(yuǎn)程存儲(chǔ)設(shè)備的命令級(jí)交互,使用戶訪問(wèn)遠(yuǎn)程的SCSI 設(shè)備像本地的SCSI 設(shè)備一樣方便,而且具有高速度;另一方面也可用于改造傳統(tǒng)的NAS、SAN 技術(shù),實(shí)現(xiàn)NAS 和SAN 的融合。iSCSI 系統(tǒng)是USN 系統(tǒng)的核心部分之一,iSCSI 的設(shè)計(jì)實(shí)現(xiàn)了基于IP 的數(shù)據(jù)塊訪問(wèn)機(jī)制。


目前iSCSI 的實(shí)現(xiàn)方式可以考慮采用以下三種方式:純軟件方式、智能iSCSI 網(wǎng)卡實(shí)現(xiàn)方式、iSCSI HBA 卡實(shí)現(xiàn)方式。由于我們是設(shè)計(jì)USN 的原形系統(tǒng),所以只采用純軟件方式,iSCSI HBA 卡方式是下一步產(chǎn)品化我們將實(shí)現(xiàn)的目標(biāo)。iSCSI系統(tǒng)整體設(shè)計(jì)模型如圖4 所示(不包括管理模塊) 。服務(wù)器端(Target) 采用linux 操作系統(tǒng), 客戶端( Initiator) 采用Windows2000。SCSI 微端口驅(qū)動(dòng)在系統(tǒng)中生成一個(gè)虛擬的SCSI 磁盤(pán),過(guò)濾驅(qū)動(dòng)截獲系統(tǒng)發(fā)給SCSI 磁盤(pán)的SCSI 命令,通過(guò)核心態(tài)的網(wǎng)絡(luò)接口發(fā)給服務(wù)器處理。

 

 自主存儲(chǔ)代理系統(tǒng)的設(shè)計(jì)
自主存儲(chǔ)代理ASA 的一端面對(duì)海量存儲(chǔ)系統(tǒng)。目前的存儲(chǔ)系統(tǒng)有DAS(直連存儲(chǔ)) 、NAS、SAN、iSCSI 等,ASA 能夠自動(dòng)地發(fā)現(xiàn)海量存儲(chǔ)系統(tǒng)中存儲(chǔ)設(shè)備的種類(lèi)和可利用的各種資源,自主地對(duì)這些存儲(chǔ)設(shè)備和資源進(jìn)行有效的統(tǒng)一管理和優(yōu)化;根據(jù)應(yīng)用的不同和應(yīng)用程序的具體需求,安排與應(yīng)用程序相適應(yīng)的存儲(chǔ)設(shè)備種類(lèi)、性能以及可靠性和可用性等級(jí)等,使應(yīng)用程序得到最優(yōu)的存儲(chǔ)資源分配。


ASA 的另一端面對(duì)應(yīng)用程序(GMPFS) 。ASA 通過(guò)對(duì)目前存儲(chǔ)系統(tǒng)所使用的元數(shù)據(jù)進(jìn)行擴(kuò)展,采用啟發(fā)式的方法,收集用戶應(yīng)用信息,為用戶提供統(tǒng)一、方便、快捷的存儲(chǔ)訪問(wèn)接口以及合理的數(shù)據(jù)存儲(chǔ)方案;根據(jù)用戶I/O請(qǐng)求所涉及數(shù)據(jù)的屬性,選擇客戶端與存儲(chǔ)設(shè)備交互數(shù)據(jù)的通道,即元數(shù)據(jù)(目錄、卷信息等) 和小數(shù)據(jù)I/O請(qǐng)求,選擇服務(wù)器通道,對(duì)大數(shù)據(jù)I/O請(qǐng)求選擇高速附網(wǎng)通道。大、小數(shù)據(jù)I/O請(qǐng)求由ASA 自主地根據(jù)整個(gè)系統(tǒng)的I/O信息量進(jìn)行調(diào)整。ASA 系統(tǒng)結(jié)構(gòu)如圖5 所示。


 客戶端與USN交互流程
  

USN 系統(tǒng)中包括三類(lèi)用戶:Windows 文件I/O用戶(使用CIFS 協(xié)議) ,Unix 文件I/O用戶(使用NFS 協(xié)議) ,iSCSI 塊I/O用戶(使用iSCSI 協(xié)議) 。用戶在客戶端與USN 系統(tǒng)交互流程與圖6 所示。

 

塊I/O客戶的具體的數(shù)據(jù)讀寫(xiě)流程為(如圖6) : (1) 客戶1上的應(yīng)用程序發(fā)出的塊I/O命令(SCSI 命令) 經(jīng)iSCSI 設(shè)備驅(qū)動(dòng)層和TCP/ IP 協(xié)議棧之后,封裝成IP 數(shù)據(jù)包,在IP 網(wǎng)絡(luò)上傳輸; (2) 封裝后的SCSI 命令達(dá)到USN 服務(wù)器之后,經(jīng)解封裝,恢復(fù)成封裝前的SCSI 命令,USN 服務(wù)器利用這些SCSI 命令對(duì)iSCSI 存儲(chǔ)設(shè)備發(fā)出塊I/O讀寫(xiě)請(qǐng)求; (3) 被請(qǐng)求的數(shù)據(jù)塊經(jīng)iSCSI 設(shè)備中的iSCSI 層和TCP/ IP 協(xié)議棧封裝成PDU ,iSCSI 設(shè)備傳送的PDU 到客戶端可經(jīng)兩個(gè)途徑:一種是經(jīng)過(guò)服務(wù)器轉(zhuǎn)發(fā),一種是經(jīng)過(guò)高速附網(wǎng)通道直接傳到客戶端; (4)PDU 經(jīng)IP 網(wǎng)絡(luò)上傳輸返回到客戶1 后,PDU 經(jīng)客戶1 解封裝并由其文件系統(tǒng)組合成文件。


當(dāng)USN 系統(tǒng)提供File I/O 服務(wù)時(shí),其數(shù)據(jù)讀寫(xiě)過(guò)程(如圖6 所示) : (1) 客戶2 (文件I/O) 向USN 服務(wù)器發(fā)出文件讀寫(xiě)請(qǐng)求(其工作方式和傳統(tǒng)的NAS 相同) ; (2)USN 服務(wù)器接到客戶端的文件讀寫(xiě)請(qǐng)求后:一方面,將該I/O 請(qǐng)求發(fā)給對(duì)應(yīng)的NAS設(shè)備或NAS 頭,NAS 設(shè)備或NAS 頭將所請(qǐng)求數(shù)據(jù)傳給USN 服務(wù)器,再經(jīng)USN 服務(wù)器傳到客戶端;另一方面USN 服務(wù)器不把文件I/O 請(qǐng)求傳到NAS 或NAS 頭,而是將NAS 或NAS 頭的IP 地址傳給客戶端,客戶端通過(guò)該IP 地址直接與NAS 或NAS頭進(jìn)行數(shù)據(jù)交互。


這里的NAS 頭主要是支持FC 協(xié)議的SAN 設(shè)備能直接掛到TCP/ IP 網(wǎng)絡(luò),支持NFS/ CIFS 用戶的訪問(wèn),NAS 頭也可安裝iSCSI目標(biāo)器驅(qū)動(dòng)程序支持iSCSI 用戶的訪問(wèn)。不論是塊I/O請(qǐng)求還是文件I/O請(qǐng)求,都可通過(guò)附網(wǎng)高速通道實(shí)現(xiàn)客戶端與存儲(chǔ)設(shè)備的數(shù)據(jù)交互。


試驗(yàn)評(píng)估
  

從客戶端對(duì)構(gòu)建USN 的各子存儲(chǔ)系統(tǒng)以及整個(gè)USN 進(jìn)行功能和性能評(píng)測(cè),并作進(jìn)一步的比較。我們從兩個(gè)方面對(duì)統(tǒng)一存儲(chǔ)網(wǎng)進(jìn)行測(cè)試:功能測(cè)試和性能測(cè)試。功能測(cè)試包括: (1)構(gòu)建100M及1000M以太網(wǎng)環(huán)境,將iSCSI 存儲(chǔ)設(shè)備與服務(wù)器連接;在服務(wù)器操作系統(tǒng)中安裝iSCSI 軟件包后,使用戶能夠通過(guò)網(wǎng)絡(luò)獲得iSCSI 存儲(chǔ)設(shè)備提供的存儲(chǔ)空間,并能象使用本地硬盤(pán)一樣對(duì)其進(jìn)行操作。


本測(cè)試項(xiàng)測(cè)試服務(wù)器端iSCSI 盤(pán)安裝、設(shè)置、管理和使用等各項(xiàng)功能; (2) iSCSI 存儲(chǔ)設(shè)備作為NAS 頭的存儲(chǔ)設(shè)備,與NAS 頭組成一個(gè)NAS 存儲(chǔ)系統(tǒng),本測(cè)試項(xiàng)測(cè)試iSCSI 盤(pán)在NAS 中的安裝、設(shè)置、管理和使用等各項(xiàng)功能; (3) iSCSI 盤(pán)與本地盤(pán)、FC-RAID 盤(pán)構(gòu)成各種冗余度的RAID ,本測(cè)試項(xiàng)測(cè)試各種存儲(chǔ)盤(pán)在RAID 中的安裝、配置、管理和使用等各項(xiàng)功能; (4) 多個(gè)NAS、iSCSI 設(shè)備、NAS 頭連接FC-RAID 通過(guò)多GMPFS 和ASA 構(gòu)建成USN 海量存儲(chǔ)系統(tǒng),本項(xiàng)測(cè)試測(cè)試GMPFS 和ASA 系統(tǒng)在融合NAS、iSCSI 和SAN 的系統(tǒng)中的安裝、配置及使用等各項(xiàng)功能。


性能測(cè)試包括:測(cè)試在100M和1000M網(wǎng)環(huán)境中不同工作負(fù)載下NAS 存儲(chǔ)設(shè)備、iSCSI 存儲(chǔ)設(shè)備、FC-RAID、本地硬盤(pán)以及它們組成的海量USN系統(tǒng)的數(shù)據(jù)傳輸性能:包括單位時(shí)間內(nèi)的IO 次數(shù)、一次IO 的平均響應(yīng)時(shí)間、數(shù)據(jù)傳輸率和CPU 利用率。該項(xiàng)測(cè)試的主要思想是針對(duì)不同的網(wǎng)絡(luò)應(yīng)用環(huán)境,對(duì)各種存儲(chǔ)設(shè)備和各種傳輸通道進(jìn)行頻繁的IO 處理,在確定時(shí)間內(nèi)統(tǒng)計(jì)并計(jì)算IO 率、數(shù)傳率、響應(yīng)時(shí)間、CPU 利用率等性能參數(shù),從而得到的各種性能評(píng)估。[!--empirenews.page--]

測(cè)試環(huán)境
iSCSI 存儲(chǔ)設(shè)備:P42.0GHz CPU ,256MB DRAM, IBM DPSS318350 18G硬盤(pán),Redhat Linux 9.0 操作系統(tǒng);LINUX 服務(wù)器:Pentium 42.66GHz ( FC2PGA) CPU ,256MB DRAM, 80GB UltraATA/ 1007 ,200rpm硬盤(pán),Redhat Linux 9.0 操作系統(tǒng);WINDOWS服務(wù)器端:XEON 3.06GHz CPU ,512M DRAM 內(nèi)存,Smart Array6i (板載) 存儲(chǔ)控制器,Qlogic QLA2300 PCI FC Adapter 光纖適配器,IBM 36。4GB (32P0726) 10Krpm 硬盤(pán),Microsoft Windows2003操作系統(tǒng);FC-RAID:NexStor 4000S ,CPU 600MHZ,512M SDRAM,10 ×ST314680FC 硬盤(pán);普通NAS 存儲(chǔ)設(shè)備: P42.66GHz CPU ,512MB DDR ,Maxtor 160G硬盤(pán),Redhat Linux 9.0 操作系統(tǒng)。


網(wǎng)絡(luò)連接:iSCSI 設(shè)備和普通NAS 設(shè)備都使用100M以太網(wǎng)卡Realtek RTL8139 ;Windows 服務(wù)器使用1000M 以太網(wǎng)卡HP NC7782 Gigabit Server Adapter ;Linux服務(wù)器使用1000M以太網(wǎng)卡。HPNC7782Gigabit Server Adapter。


功能測(cè)試
根據(jù)測(cè)試流程,功能測(cè)試包括三個(gè)方面的內(nèi)容: (2) 平臺(tái)的統(tǒng)一,即在Windows 下能通過(guò)單一目錄樹(shù)方式訪問(wèn)多個(gè)存儲(chǔ)節(jié)點(diǎn),功能與Linux 下的pvfs 相似; (2) 協(xié)議的統(tǒng)一,即通過(guò)Windows 的“計(jì)算機(jī)管理”和Initiator 發(fā)起端(iSCSI 客戶端) 可以管理FC-RAID 和iSCSI Target 及普通的NAS 設(shè)備,并利用“動(dòng)態(tài)磁盤(pán)機(jī)制”實(shí)現(xiàn)多種冗余;設(shè)備的統(tǒng)一,即iSCSI Target 通過(guò)和initiator 配合,使得該Target 成為NAS 系統(tǒng)中的一個(gè)存儲(chǔ)設(shè)備。


性能測(cè)試
 

測(cè)試內(nèi)容

采用第三方的IOMETER 測(cè)試軟件進(jìn)行的測(cè)試。IOMETER是INTEL 公司專(zhuān)門(mén)開(kāi)發(fā)的用于測(cè)試系統(tǒng)I/O 性能的測(cè)試程序。 它的測(cè)試參數(shù)比較全面,能非常全面的反映服務(wù)器的I/ O性能。為了說(shuō)明USN 存儲(chǔ)系統(tǒng)的性能,在相同條件下測(cè)試以下項(xiàng)目進(jìn)行對(duì)比分析: (1) 對(duì)USN 服務(wù)器本地硬盤(pán)讀寫(xiě)性能測(cè)試; (2) 100M以太網(wǎng)環(huán)境下FC-RAID 盤(pán)讀寫(xiě)性能測(cè)試; (3)100M以太網(wǎng)環(huán)境下遠(yuǎn)程iSCSI 盤(pán)讀寫(xiě)性能測(cè)試; (4) 100M 以太網(wǎng)環(huán)境下FC-RAID 盤(pán)和遠(yuǎn)程iSCSI 盤(pán)構(gòu)建的各級(jí)RAID 盤(pán)的讀寫(xiě)性能測(cè)試; (5) 1000M以太網(wǎng)環(huán)境下遠(yuǎn)程iSCSI 盤(pán)讀寫(xiě)性能測(cè)試; (6) 100M以太網(wǎng)環(huán)境下USN 系統(tǒng)的讀寫(xiě)性能測(cè)試。


實(shí)驗(yàn)結(jié)果比較

本地IDE 硬盤(pán)、100M iSCSI 硬盤(pán)、1000M iSCSI 硬盤(pán)、FC-RAID、FC-RAID 與iSCSI 構(gòu)成的RAID0 及USN 系統(tǒng)數(shù)據(jù)傳輸率性能比較如圖7 所示。

 

本地IDE 硬盤(pán)、100M iSCSI 硬盤(pán)、1000M iSCSI 硬盤(pán)、FC-RAID 及FC-RAID 與iSCSI 構(gòu)成的RAID0 ,以及USN 的IO/ s 性能比較如圖8 所示。


本地IDE 硬盤(pán)、100M iSCSI 硬盤(pán)、1000M iSCSI 硬盤(pán)、FC-RAID及FC-RAID 與iSCSI 構(gòu)成的RAID0 ,以及USN 的平均響應(yīng)時(shí)間性能比較如圖9 所示。

 

本地IDE 硬盤(pán)、100M iSCSI 硬盤(pán)、1000M iSCSI 硬盤(pán)、FC-RAID 及FC-RAID 與iSCSI 構(gòu)成的RAID0 ,以及USN 的CPU 占用率比較如圖10 所示。

 

 實(shí)驗(yàn)結(jié)果分析

  請(qǐng)求文件或數(shù)據(jù)塊大小對(duì)存儲(chǔ)系統(tǒng)性能的影響從圖7、圖8 和圖9 中單條曲線的走勢(shì)可以看出,當(dāng)請(qǐng)求文件或數(shù)據(jù)塊較大時(shí),從目的盤(pán)或系統(tǒng)上讀寫(xiě)數(shù)據(jù)耗費(fèi)的時(shí)間長(zhǎng),通過(guò)網(wǎng)絡(luò)傳輸?shù)臅r(shí)間也相應(yīng)增加,所以:小包的平均響應(yīng)時(shí)間< 大包的平均響應(yīng)時(shí)間,小包的IOps > 大包的IOps。請(qǐng)求包大時(shí),針對(duì)一個(gè)請(qǐng)求包所進(jìn)行的額外操作較請(qǐng)求包小時(shí)少,連續(xù)的讀寫(xiě)所耗費(fèi)的時(shí)間小于小包讀寫(xiě)所耗費(fèi)的時(shí)間,因此:小包的MBps < 大包的MBps。


服務(wù)器端iSCSI 盤(pán)的各項(xiàng)性能表現(xiàn)趨勢(shì)在100M以太網(wǎng)和千兆以太網(wǎng)環(huán)境中不同請(qǐng)求包大小的情況下符合上述規(guī)律,本地IDE 硬盤(pán)、FC-RAID 和USN 系統(tǒng)也符合上述述規(guī)律。


 性能分析

從圖7、圖8 和圖9 可以看出, I/O 請(qǐng)求在1k~128kB 時(shí),USN系統(tǒng)的I/O 請(qǐng)求響應(yīng)速度比本地IDE 硬盤(pán)、FC-RAID、100M遠(yuǎn)程iSCSI 硬盤(pán)和1000M iSCSI 硬盤(pán)快的多。 當(dāng)I/O 請(qǐng)求大于128kB 時(shí),USN 系統(tǒng)的I/O 請(qǐng)求響應(yīng)速度比FC-RAID 的 I/ O 請(qǐng)求響應(yīng)速度略慢,比其它存儲(chǔ)子系統(tǒng)的速度快的多,最高速度可達(dá)45MB/ s。 其原因是我們?cè)赨SN 的服務(wù)器端除加載了GMPFS(支持使用多種訪問(wèn)協(xié)議用戶) 和ASA(提供服務(wù)器通道和附網(wǎng)高速通道) 的同時(shí),還加載了我們實(shí)驗(yàn)室以前開(kāi)發(fā)的智能預(yù)取、硬盤(pán)緩存技術(shù)(DCD) 、負(fù)載均衡和零拷貝系統(tǒng)或軟件模塊,所以,不論是大I/O 請(qǐng)求還小I/O 請(qǐng)求,都能提供極好的I/O 請(qǐng)求響應(yīng)性能。 而FC-RAID 由于自身的數(shù)據(jù)校驗(yàn)等時(shí)延等特性,對(duì)小的I/O 請(qǐng)求響應(yīng)速度較慢,對(duì)越大的I/O請(qǐng)求響應(yīng)速度越快。


對(duì)于USN 的iSCSI 盤(pán)存儲(chǔ)子系統(tǒng),從實(shí)驗(yàn)結(jié)果可以看出,當(dāng)請(qǐng)求數(shù)據(jù)塊較小時(shí),100M網(wǎng)絡(luò)環(huán)境下的性能和1000M網(wǎng)絡(luò)環(huán)境下的性能差別不明顯,隨著請(qǐng)求塊或文件逐步增大,兩者IOps 和MBps 的差距越來(lái)越大。請(qǐng)求數(shù)據(jù)塊為1024K時(shí),僅更換網(wǎng)絡(luò)傳輸中的數(shù)據(jù)鏈路層和物理層,從100M 網(wǎng)絡(luò)環(huán)境提升到1000M網(wǎng)絡(luò)環(huán)境,磁盤(pán)數(shù)據(jù)傳輸率得到較大的提高,后者約是前者的3 倍。


從圖10 可以看出,100M的iSCSI 存儲(chǔ)子系統(tǒng)的CPU 占用率最高,原因是在響應(yīng)用戶的I/O 請(qǐng)求,要求服務(wù)器不斷的對(duì)iSCSI 的協(xié)議數(shù)據(jù)單元進(jìn)行封裝和解封裝。 本地的IED 硬盤(pán)CPU 占用率最低,USN 系統(tǒng)的服務(wù)器端CPU 占用率次之,原因是USN 系統(tǒng)中小的I/O 請(qǐng)求直接經(jīng)過(guò)服務(wù)器處理,而大的I/O 請(qǐng)求經(jīng)過(guò)附網(wǎng)高速通道由存儲(chǔ)設(shè)備自身處理。


結(jié)論和展望
  

我們提出、設(shè)計(jì)和實(shí)現(xiàn)的統(tǒng)一存儲(chǔ)網(wǎng)絡(luò)系統(tǒng),全部采用IP互聯(lián)設(shè)備,價(jià)格比光纖通道低得多,在管理軟件的開(kāi)發(fā)實(shí)現(xiàn)上以及系統(tǒng)的使用維護(hù)上,都具有多得多的資源和經(jīng)驗(yàn)。 并且,千兆以太網(wǎng)技術(shù)比光纖通道技術(shù)發(fā)展迅速,10Gbps 以太網(wǎng)交換機(jī)已經(jīng)推出并在市場(chǎng)上熱銷(xiāo),其性能前景也比光纖通道交換機(jī)好得多。 所有這些為統(tǒng)一存儲(chǔ)網(wǎng)絡(luò)的產(chǎn)品化打下了堅(jiān)實(shí)的基礎(chǔ)。


目前,我們已經(jīng)從理論、結(jié)構(gòu)和實(shí)踐上實(shí)現(xiàn)了統(tǒng)一存儲(chǔ)網(wǎng)絡(luò)原型系統(tǒng),現(xiàn)在,我們正在開(kāi)發(fā)和完善多用戶、多功能、多種平臺(tái)支持的iSCSI 設(shè)備,設(shè)計(jì)和實(shí)現(xiàn)新的安全和高可用文件系統(tǒng),以便為統(tǒng)一存儲(chǔ)網(wǎng)絡(luò)系統(tǒng)產(chǎn)品化后能真正為廣大企業(yè),尤其是為廣大中小企業(yè)提供開(kāi)放性、性能、可展性、性/ 價(jià)比都更好的海量存儲(chǔ)系統(tǒng)。 

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉