基于網(wǎng)絡(luò)編碼的多信源組播通信系統(tǒng),包括源代碼,原理圖等(二)
2 多信源組播系統(tǒng)結(jié)構(gòu)及整體設(shè)計(jì)方案
2.1項(xiàng)目研究需求、目標(biāo)和內(nèi)容
網(wǎng)絡(luò)編碼能夠提高網(wǎng)絡(luò)吞吐量,提升魯棒性、安全性等網(wǎng)絡(luò)性能。具有網(wǎng)絡(luò)編碼功能的路由器是未來網(wǎng)絡(luò)發(fā)展的趨勢。組播通信在網(wǎng)絡(luò)通信中有重要的作用,事實(shí)上,任何一個網(wǎng)絡(luò)都可以認(rèn)為是組播網(wǎng)的一個特例。然而,目前在世界上研究網(wǎng)絡(luò)編碼在組播上的應(yīng)用大多集中在單信源組播方面,例如,單信源多信宿網(wǎng)絡(luò)如何達(dá)到最大傳輸速率問題[25],基于網(wǎng)絡(luò)編碼的組播路由算法和性能評估[26], 基于網(wǎng)絡(luò)編碼的組播通信網(wǎng)絡(luò)的拓?fù)湓O(shè)計(jì)[27], 多信源隨機(jī)線性網(wǎng)絡(luò)編碼在組播通信的研究[28]以及單信源組播網(wǎng)中編碼節(jié)點(diǎn)的研究[29],以上研究都是以軟件仿真為主,沒有形成實(shí)際的硬件平臺和系統(tǒng)。
多信源組播的應(yīng)用非常廣泛,如P2P內(nèi)容分發(fā)網(wǎng)絡(luò)等。事實(shí)上,任何一個網(wǎng)絡(luò)都可以作為多信源組播的一個特例,因此研究多信源組播是有意義且必要的。
本項(xiàng)目的主要研究目標(biāo)是基于網(wǎng)絡(luò)編碼的多信源組播系統(tǒng)的實(shí)現(xiàn)。在基于國內(nèi)外網(wǎng)絡(luò)編碼理論在組播通信中的最新研究成果和技術(shù),對網(wǎng)絡(luò)編碼理論進(jìn)行深入學(xué)習(xí)和探討,提出一種基于網(wǎng)絡(luò)編碼的多信源組播系統(tǒng)和網(wǎng)絡(luò),然后依據(jù)此系統(tǒng)設(shè)計(jì)出可實(shí)現(xiàn)組播的通信協(xié)議和相關(guān)算法,再利用開放式的網(wǎng)絡(luò)設(shè)計(jì)硬件平臺NetFPGA[30],使提出的協(xié)議和算法在硬件上實(shí)現(xiàn),最后在實(shí)際的環(huán)境中用若干電腦和NetFPGA組成一個小型組播通信網(wǎng)絡(luò)進(jìn)行系統(tǒng)測試和性能評估。
2.2 NetFPGA——新一代開放式網(wǎng)絡(luò)研究平臺簡介
由斯坦福大學(xué)開發(fā)的NetFPGA是一個基于Linux操作系統(tǒng)的可重用開放性硬件平臺,允許用戶在實(shí)驗(yàn)室內(nèi)搭建高性能的網(wǎng)絡(luò)模型進(jìn)行仿真和研究。它具有以下特點(diǎn)[31]:
(1)很好地支持模塊化設(shè)計(jì),它可以使研究人員在硬件上搭建Gb/s高性能網(wǎng)絡(luò)系統(tǒng)模型。(2)NetFPGA是一個基于Linux系統(tǒng)的開放性平臺,可以利用平臺上現(xiàn)有的資源,在前人開發(fā)的基礎(chǔ)上添加自己的模塊和修改現(xiàn)有的系統(tǒng),而不需要重復(fù)地搭建外圍模塊、開發(fā)驅(qū)動和GUI等,大大減輕了網(wǎng)絡(luò)研究的任務(wù)。
NetFPGA的硬件主要包含了4個1Gb/s的以太網(wǎng)接口(GigE),一個用戶可編程的FPGA,以及兩片SRAM和一片DRAM。NetFPGA開發(fā)板通過標(biāo)準(zhǔn)的PCI總線接口連接到PC機(jī)或服務(wù)器,模塊框圖如圖2.2-1所示。
圖 2.2-1:NetFPGA平臺的組成框圖
在外部硬件接口方面,除了連接PC主機(jī)的PCI總線插口,一個Broadcom公司的物理層收發(fā)器(PHY)包含了四個千兆位以太網(wǎng)接口,板子上的兩個SATA連接口使得系統(tǒng)內(nèi)部的多個NetFPGA可以通過SATA數(shù)據(jù)線連接起來,互相之間直接以很高的速度交換數(shù)據(jù),而不必再通過PCI總線。NetFPGA通過PCI總線與主機(jī)CPU連接,提供了硬件加速的數(shù)據(jù)通道,分擔(dān)CPU的處理任務(wù)。主機(jī)CPU按照DMA方式讀寫NetFPGA上的寄存器和存儲器來配置NetFPGA的工作模式,并對NetFPGA的工作狀態(tài)進(jìn)行監(jiān)控。
NetFPGA平臺的軟件系統(tǒng)包括操作系統(tǒng)、作為軟件接口的驅(qū)動程序、實(shí)現(xiàn)各種硬件功能的邏輯代碼、執(zhí)行控制功能的軟件程序、系統(tǒng)測試的腳本程序,以及計(jì)算機(jī)輔助設(shè)計(jì)軟件工具。
2.3 利用NetFPGA實(shí)現(xiàn)本設(shè)計(jì)的總體構(gòu)想
基于網(wǎng)絡(luò)編碼的組播通信系統(tǒng)將充分運(yùn)用NetFPGA上面的各種硬件和軟件資源,實(shí)現(xiàn)系統(tǒng)的設(shè)計(jì)目標(biāo),具體是:(1)根據(jù)項(xiàng)目的需求,合理且充分利用NetFPGA卡上面的各種硬件資源,如FPGA、存儲芯片和輸入輸出接口;(2)由于基于NetFPGA實(shí)現(xiàn)的IPv4原理性路由器是一個開源的系統(tǒng),因此我們可以運(yùn)用其提供的部分代碼和已經(jīng)設(shè)計(jì)好的底層硬件平臺,來幫助我們實(shí)現(xiàn)設(shè)計(jì)目標(biāo)。例如,我們的系統(tǒng)的編碼、解碼工作主要在網(wǎng)絡(luò)層完成,因此我們可以利用NetFPGA中已有的物理層、MAC層硬件邏輯來實(shí)現(xiàn)數(shù)據(jù)的接收和發(fā)送;(3)在軟件方面,由于NetFPGA平臺選擇了CentOS操作系統(tǒng),并且開發(fā)了軟硬件接口的驅(qū)動程序,基于Linux內(nèi)核的設(shè)備驅(qū)動程序和Java程序開發(fā)的圖形用戶界面(Java GUI)等,因此我們可以對其應(yīng)用、改進(jìn),使我們的系統(tǒng)更加完善,方便調(diào)試和后續(xù)的進(jìn)一步研究。
2.4系統(tǒng)實(shí)現(xiàn)的整體設(shè)計(jì)方案說明
2.4.1 系統(tǒng)拓?fù)鋱D及說明
如圖2.4-1所示,是擬采用的組播通信網(wǎng)絡(luò)的拓?fù)鋱D:
圖2.4-1基于網(wǎng)絡(luò)編碼組播的網(wǎng)絡(luò)拓?fù)鋱D
說明:為了易于在工程上實(shí)現(xiàn),將網(wǎng)絡(luò)編碼路由器分為編碼路由器EC(Encoding router)和解碼路由器DC(Decoding router),分別專門負(fù)責(zé)編碼和解碼。具體講,如圖1所示,信源S1,S2,S3發(fā)送數(shù)據(jù)包,編碼路由器EC0和EC1負(fù)責(zé)將接收到的數(shù)據(jù)包以隨機(jī)的系數(shù)進(jìn)行線性編碼后發(fā)送給組播路由器R,注意,這里的組播路由器更準(zhǔn)確地說是轉(zhuǎn)發(fā)路由器,因?yàn)樗墓δ苤皇菍⑹盏降臄?shù)據(jù)包轉(zhuǎn)發(fā)到其三個輸出端口,而沒有IGMP(組播管理)和相應(yīng)的組播路由功能。當(dāng)然,我們也可以直接在EC上實(shí)現(xiàn)轉(zhuǎn)發(fā)的功能,增加R的原因是考慮到NetFPGA端口數(shù)量的限制(每塊NetFPGA只有4個端口)。解碼路由器DC接收編碼的數(shù)據(jù)并解碼,并將它發(fā)送給下游的信宿主機(jī),在這里,由于PC數(shù)量的限制,我們使用雙口網(wǎng)卡可以將解碼路由器和信宿放到同一臺主機(jī)上,這對網(wǎng)絡(luò)性能的測試和實(shí)現(xiàn)沒有任何影響。
2.4.2編碼策略與方案
作為一種編碼結(jié)構(gòu)的提出,我們將編碼只限于不同信源數(shù)據(jù)包之間,暫不考慮信源包內(nèi)部編碼。相同信源的數(shù)據(jù)包之間分“代”,以便在解碼時區(qū)分信息先后順序[32]。不同信源的包之間不區(qū)分代的概念。
定義:為了討論的方便性和簡潔性,我們將信源S1的第1代記為S(1,1),信源S2的第3代記為S(2,3),……依此類推。依據(jù)包頭和緩存,每個信源的代的編號從0開始,至1023結(jié)束,即信源n的最大的代編號為S(n,1023)
在編碼路由器EC上對不同信源的IP數(shù)據(jù)包進(jìn)行編碼,編碼系數(shù)矢量隨機(jī)選擇,編碼方法是線性編碼。例如,在上圖中的編碼路由器EC0,設(shè)兩個鏈路的輸入的全局編碼向量為:in(e)= 由于只有兩個信源之間的編碼有且只有一條邊輸出,則本地編碼向量為(α β),依據(jù)文章[33]的公式:
則輸出out(e)=(α β) =αS(1,x)+βS(2,y)。編碼后的數(shù)據(jù)以NCP(network coding protocol)包頭封裝,然后再封裝在IP數(shù)據(jù)報(bào)中,如圖2.4-2所示:
圖2.4-2:編碼后數(shù)據(jù)的封裝格式
為減小相應(yīng)的編碼負(fù)擔(dān)和提高編碼效率,我們只對網(wǎng)絡(luò)中的IP數(shù)據(jù)報(bào)中的有效載荷進(jìn)行編碼(已經(jīng)編碼過的數(shù)據(jù)包可以再進(jìn)行編碼),不對ARP等其他數(shù)據(jù)包編碼。在編碼路由器中,我們?yōu)椴煌妮斎胪ǖ篱_辟不同的FIFO以進(jìn)行順序存取和編碼
2.4.3隨機(jī)系數(shù)的選擇
根據(jù)相關(guān)資料可知,隨即編碼系數(shù)矢量的選擇可以從Galois Field中進(jìn)行選擇,依據(jù)論文[33][34],我們選擇域?yàn)镚F256,即 ,此時可以解碼的概率為1- =0.996,這個概率可以滿足大多數(shù)的應(yīng)用需求。
2.4.4 NCP數(shù)據(jù)包頭的格式
為了能夠在解碼路由器上進(jìn)行解碼,我們需要在被編碼的有效載荷前增加NCP數(shù)據(jù)包頭[35],根據(jù)我們的方案,其包頭格式如圖2.4-4:
版本 4位 |
首部長度 4位 |
總長度 16位) |
標(biāo)志 2位 |
保留 6位 |
|||||||||
第1個包信源號 |
第2個包信源號 |
…… |
…… |
|
|
|
第8個包信源號 |
||||||
第1個包的填充長度(10位) |
編碼系數(shù)矢量1 (8位) |
代的編號(10位) |
編碼次數(shù) (4位) |
||||||||||
第2個包的填充長度 |
編碼系數(shù)矢量2 |
代的編號 |
編碼次數(shù) |
||||||||||
……………… |
…… |
…… |
|
||||||||||
第n個包的填充長度 |
編碼系數(shù)n |
代的編號 |
編碼次數(shù) |
||||||||||
編碼后的有效載荷 |
|||||||||||||
圖2.4-4:NCP數(shù)據(jù)包的包頭格式
先將包頭各個字段的含義說明如下:
?、侔姹荆篘CP數(shù)據(jù)包格式的版本,為了后續(xù)開發(fā)研究和以前版本的區(qū)分,第一個版本為0001.
?、谑撞块L度和總長度:首部長度是指除了有效數(shù)據(jù)載荷以外的部分,共4位,單位是4字節(jié),其最小值為2。當(dāng)首部長度為3時,意味著該包的載荷沒有被編碼,只是加了包頭。當(dāng)其值大于3時,其值減去3為被編碼的信源數(shù)。
總長度是之首部長度和有效載荷之和的長度,16位,單位為字節(jié)。
③標(biāo)志:若進(jìn)入編碼路由器的只是一個沒有編碼過的IP數(shù)據(jù)包時,不進(jìn)行編碼,直接將包頭前2行加在原IP數(shù)據(jù)包的有效載荷的前面即可。當(dāng)僅有一個NCP數(shù)據(jù)包進(jìn)入編碼路由器時,我們不進(jìn)行編碼,直接進(jìn)行轉(zhuǎn)發(fā),如圖2.4-5所示:
有效載荷的數(shù)據(jù)包類型 |
標(biāo)志位 |
沒有編碼的IP數(shù)據(jù)包 |
01 |
編碼后的NCP數(shù)據(jù)包 |
10 |
保留 |
00 |
保留 |
11 |
圖2.4-5:標(biāo)志位的含義
?、芫幋a次數(shù):即從原始數(shù)據(jù)包算起,被編碼的次數(shù),因?yàn)樵谝粋€實(shí)際的網(wǎng)絡(luò)中,數(shù)據(jù)的編碼可以是遞歸的,即可以多次被編碼。有時,只有一個數(shù)據(jù)源時,直接在其前面加上NCP包頭而不進(jìn)行編碼。增加編碼次數(shù)是為了能夠在多次編碼后進(jìn)行解碼。若編碼前數(shù)據(jù)包為IP數(shù)據(jù)包,其編碼次數(shù)為0,若為NCP數(shù)據(jù)包,則次數(shù)≥1.當(dāng)一個IP數(shù)據(jù)包和一個已編碼的數(shù)據(jù)包編碼時,利用編碼次數(shù),可以避免解碼路由器將NCP數(shù)據(jù)包誤以為IP數(shù)據(jù)包而交給主機(jī)。
?、莸谝粋€包的填充長度:因?yàn)椴煌瑪?shù)據(jù)源的數(shù)據(jù)包的長度可能不一樣,為了便于編碼計(jì)算,將它們前位補(bǔ)0使得長度一致。由于一個典型的以太網(wǎng)數(shù)據(jù)包的長度在500~1500字節(jié)之間,所以填充長度不超過1000字節(jié)。另外,我們還要考慮MAC層的最大傳送單元(MTU)的限制,即編碼后的MAC幀的長度不能超過1518字節(jié)。由此可以計(jì)算出,被編碼的數(shù)據(jù)包的最大長度是1499字節(jié)
?、蘧幋a系數(shù):即隨機(jī)選擇的編碼矢量的系數(shù),是在一個GF256的有限域中隨機(jī)選擇。
⑦代的編號:即被編碼的數(shù)據(jù)包的代的編號,是按照順序產(chǎn)生的編號,目的是方便解碼。
?、喟男旁刺枺?位,對進(jìn)入編碼路由器的數(shù)據(jù)包的信源進(jìn)行編號,其目的是為了方便解碼,在我們目前的體系中,最多允許8個數(shù)據(jù)包同時被編碼。注意:當(dāng)信源數(shù)少于8個時,例如有3個,則分別將對應(yīng)的數(shù)據(jù)包的信源號分別填為0000,0001,0010,其余的都填寫為1111。
2.4.5 轉(zhuǎn)發(fā)(組播)路由器R工作流程
在實(shí)際的應(yīng)用中,R應(yīng)該是具有組播功能的路由器,即可以運(yùn)行網(wǎng)際組播管理協(xié)議IGMP和多播路由選擇協(xié)議DVMRP等,從而它可以知道網(wǎng)絡(luò)的局部的拓?fù)浜蜐M足組播成員的要求。為了初期容易實(shí)現(xiàn),我們將其功能簡化為轉(zhuǎn)發(fā)功能(即廣播功能)。
2.4.6數(shù)據(jù)包的解碼
(1) 高速緩存和CAM的使用
數(shù)據(jù)包的解碼由DC解碼路由器完成。每個解碼路由器DC有三個輸入通道,分別連接到R0,R1,R2其解碼的策略是:我們先在DC中開辟三塊不同的高速緩存(DRAM)和與之分別對應(yīng)的3個CAM,它們分別對應(yīng)于R0、R1、R2,緩存和CAM的大小為代的編號的大小,即 =1024,在這三個緩存中存放按照順序接收到的數(shù)據(jù)。根據(jù)前面的數(shù)據(jù)處理過程,顯然,對應(yīng)于每個緩存中的數(shù)據(jù),雖然有的是真正編碼后的數(shù)據(jù)包,有的只是在IP數(shù)據(jù)包前增加了一個包頭,但我們都可以認(rèn)為是NCP數(shù)據(jù)包。在將數(shù)據(jù)存入高速緩存的同時,提取NCP數(shù)據(jù)包頭中的信源號和代的編號,將它們存入到內(nèi)容可尋址存儲器CAM(content addressable memory),則CAM的輸出即為對應(yīng)數(shù)據(jù)在高速緩存的地址。
使用CAM的原因是:由于經(jīng)過編碼,以及網(wǎng)絡(luò)環(huán)境非理想,解碼路由器收到的encoded packet可能是亂序的。因此考慮使用CAM做檢索鏈接,以便快速尋址當(dāng)前解碼所需要的packet。[!--empirenews.page--]
(2) 解碼順序
根據(jù)實(shí)際情況的考慮,目前有兩種解碼的順序,一種情況是按照信源號和代的編號的順序進(jìn)行解碼,第二種情況是按照緩存及其緩存地址的順序來解碼。
在已知網(wǎng)絡(luò)拓?fù)涞那闆r下,我們按照信源號和代的編號的順序來進(jìn)行解碼,即對于信源采用輪詢策略,對于內(nèi)部代的編號采用小數(shù)優(yōu)先策略。例如,在我們的拓?fù)鋱D中,解碼順序是:S(1,1),S(2,1),S(3,1)→S(1,2),S(2,2),S(3,2)→……S(1,n),S(2,n),S(3,n)……。
在未知網(wǎng)絡(luò)拓?fù)涞那闆r下,我們按照高速緩存的地址順序來進(jìn)行解碼,即先對高速緩存采用輪詢策略,對每個緩存中,采用地址由小到大的順序進(jìn)行解碼,如圖2.4-7所示,進(jìn)行解碼的順序是PZ1
→PX1→ PY1→ PZ2→ PX2→PY2→PZ3……
高速緩存1 高速緩存2 高速緩存3
地址 數(shù)據(jù)包 地址 數(shù)據(jù)包 地址 數(shù)據(jù)
01 PZ1 01 PX1 01 PY1
02 PZ2 02 PX2 02 PY2
03 PZ3 03 PX3 03 PY3
04 …… 04 …… 04 ……
……
圖2.4-7 按照高速緩存的地址順序來進(jìn)行解碼
上面的兩種解碼方式各有優(yōu)點(diǎn):在一般情況下,按照信源號和代的編號的順序來進(jìn)行解碼可獲得較高的解碼速率,但在網(wǎng)絡(luò)環(huán)境惡化的情況下,其丟包率(無法解碼的概率)會比第2中方案高一些。由于在我們已有的網(wǎng)絡(luò)環(huán)境一般較好,為了體現(xiàn)網(wǎng)絡(luò)編碼的傳輸?shù)母咝裕覀儼凑盏?種順序進(jìn)行解碼。
(3) 解碼流程
為了避免高速緩存的寫數(shù)據(jù)溢出,我們將設(shè)置二級緩存,二級緩存也有3個,可用SRAM構(gòu)造,將SRAM分為3塊地址上獨(dú)立的區(qū)域,每個SRAM 大小為256×1800bytes,分別對應(yīng)不同的信源,我們將解碼后的數(shù)據(jù),根據(jù)其代的編號,分別暫存在對應(yīng)SRAM的對應(yīng)地址上。例如,將S(1,1)存儲在SRAM1的第1個地址空間,S(2,4)則存儲在SRAM2的第4個地址空間。每個RAM各有1個讀、寫指針,可以同時按順序讀寫數(shù)據(jù),按照地址由小到大的順序讀出的數(shù)據(jù)被發(fā)送到輸出隊(duì)列中。
如圖2.4-8所示為數(shù)據(jù)包的解碼過程,每個告訴緩存各有1個讀、寫指針,在解碼過程中,讀取緩存是按照解碼的順序進(jìn)行的,而在寫緩存是按地址順序?qū)懙摹?/p>
圖2.4-8:數(shù)據(jù)包解碼流程
(4) 解碼策略與方法
我們按照信源號和代的編號的順序來進(jìn)行解碼,即對于信源采用輪詢策略,對于內(nèi)部代的編號采用小數(shù)優(yōu)先策略。例如,在我們的拓?fù)鋱D中,解碼順序是:S(1,1),S(2,1),S(3,1)→S(1,2),S(2,2),S(3,2)→……S(1,n), S(2,n), S(3,n)……
假定我們按照上述順序準(zhǔn)備解碼S(1,x),解碼程序如圖9:
圖2.4-9 數(shù)據(jù)包S(1,x)的解碼過程
無法求解一個數(shù)據(jù)包的原因可能是:該數(shù)據(jù)包由于延遲或者丟失,在CAM中搜尋不到,再有就是線性相關(guān),無法解出來。在我們的系統(tǒng)中,由于其拓?fù)涞奶厥庑裕瑳]有線性相關(guān)的情況,因此無法解碼的情況只發(fā)生在解碼因子丟失的情況下。
解碼子任務(wù):解碼子任務(wù)的輸入是包頭信息,由調(diào)用它的程序給出,輸出有兩個變量:解碼后的數(shù)據(jù)包和解碼標(biāo)志,解碼標(biāo)志告訴調(diào)用它的程序是否可以解碼,我們假定現(xiàn)在要對S(i,j)解碼,子任務(wù)流程如圖2.4-10:
圖2.4-10:解碼子任務(wù)流程[!--empirenews.page--]
(5) 解碼后數(shù)據(jù)包暫存SRAM的讀寫策略
我們將解碼后的數(shù)據(jù)包暫存在SRAM中等待發(fā)送,每個信源對應(yīng)一個SRAM區(qū)域,同一個信源的解碼后的人數(shù)據(jù)包存儲在同一個RAM中,存儲地址為該包的代的編號。每個RAM各有一個讀指針,寫數(shù)據(jù)按照RAM的地址大小順序?qū)懭?。讀數(shù)據(jù)時按照信源編號和代的大小讀取。由于發(fā)送速率一般會高于解碼速率,因此RAM不用很大,暫定為256×1800。
每讀取一個數(shù)據(jù)后,指針加1,若讀取某個SRAM時無數(shù)據(jù)(可能是延遲或丟失造成),則不用等待,直接進(jìn)行下一個SRAM的讀取,3次輪詢之后還沒有到達(dá),則強(qiáng)行加讀指針加1,讀取下一個數(shù)據(jù)包。如圖2.4-11所示為SRAM的讀寫操作。
圖2.4-11 二級緩存SRAM的讀寫操作
(6)舉例說明
為了更清楚地顯示整個解碼的操作過程,我們以DC3為例,圖2.4-12顯示的是DC3的3個高速緩存和CAM,解碼過程如下
圖2.4-12 數(shù)據(jù)包S(1,x)解碼過程
數(shù)據(jù)包S(1,x)解碼過程如下:
先將S(1,x)的包頭3個CAM中搜索,在CAM1中得到索引為00,我們利用該索引得到S(1,x)在高速緩存1的地址為00,從高速緩存1讀取數(shù)據(jù),得到a S(1,x)+b S(2,y),為了求解S(1,x)我們調(diào)用解碼子任務(wù)先求解S(2,y),為了防止出現(xiàn)死循環(huán),解碼子任務(wù)只在CAM2和CAM3中搜尋S(2,y),在CAM2中得到地址為02,于是讀取高速緩存2的02地址數(shù)據(jù),得到eS(2,y)+f S(3,z),于是再調(diào)用子任務(wù)求解S(3,z),在CAM3中搜索S(3,z)后解出S(3,z), 于是可以解出S(2,y),最后再解出S(1,x),同時,分別將S(3,z)、 S(2,y) 、S(1,x)存入SRAM3,SRAM2,SRAM1相應(yīng)的地址中。
2.5 系統(tǒng)軟硬件接口及相關(guān)軟件功能
在系統(tǒng)中,并非只有硬件邏輯在不同的模塊之間處理數(shù)據(jù)包,而且還有相應(yīng)的軟件和控制程序。如圖2.5-1所示,是數(shù)據(jù)包在系統(tǒng)中的通道與處理流程。數(shù)據(jù)在系統(tǒng)中的通道分為data bus和register bus,data bus主要進(jìn)行數(shù)據(jù)的硬件處理,register bus則是軟硬件的接口。在數(shù)據(jù)傳輸?shù)拿總€階段對軟件應(yīng)該是可控的、透明的,這些軟件在更高層次上執(zhí)行更復(fù)雜的算法和協(xié)議,或者處理一些異常情況,同時,對于系統(tǒng)開發(fā)人員,也應(yīng)該是可控的,因?yàn)殚_發(fā)人員往往需要配置和調(diào)試硬件。使用通用的寄存器接口就可以使數(shù)據(jù)處理對軟件透明化,這是靠映射內(nèi)部的硬件寄存器來完成的,即所謂的存儲映射技術(shù)。對于軟件來講,映射寄存器相當(dāng)于一個I/O接口,它可以由軟件訪問和修改。
圖2.5-1:系統(tǒng)中的register bus 和data bus
Register bus中每個模塊的register連接在一起,組成一個信息環(huán)路。這些register塊中存儲了數(shù)據(jù)處理在每個模塊中的狀態(tài)和階段,任何一個模塊都可以響應(yīng)來自PCI總線寄存器的訪問和控制要求,而PCI總線寄存器可以通過軟件來控制。也就是說,硬件和軟件的通信是通過PCI總線完成的。
數(shù)據(jù)以及控信息在硬件和主機(jī)系統(tǒng)之間是通過PCI總線傳輸?shù)?,以Linux網(wǎng)絡(luò)存儲棧作為接口的。NetFPGA向主機(jī)發(fā)送分組數(shù)據(jù)的過程如圖2.5-2a所示:
分組到達(dá),發(fā)往CPU隊(duì)列;
中斷程序通知驅(qū)動程序有分組到達(dá);
驅(qū)動程序設(shè)置和初始化DMA傳送器;
NetFPGA通過DMA總線發(fā)送分組;
中斷程序發(fā)送DMA結(jié)束信號;
驅(qū)動程序把分組傳遞到網(wǎng)絡(luò)存儲棧;
圖2.5-2a:NetFPGA向主機(jī)發(fā)送數(shù)據(jù) 圖2.5-2b:主機(jī)向NetFPGA發(fā)送數(shù)據(jù)
主機(jī)向NetFPGA發(fā)送分組數(shù)據(jù)的過程如圖2.5-2b所示:
控制軟件通過網(wǎng)絡(luò)socket發(fā)送分組,分組被遞交給驅(qū)動程序;
驅(qū)動程序設(shè)置和初始化DMA傳送器;
中斷程序發(fā)送DMA結(jié)束信號;
主機(jī)訪問寄存器是通過系統(tǒng)調(diào)用系統(tǒng)內(nèi)核的ioctl( )函數(shù)作為接口的。讀寫寄存器的操作函數(shù)如下,這兩個函數(shù)內(nèi)部調(diào)用了ioctl( )函數(shù)。
readReg(nf2device *dev, int address, unsigned *rd_data)
writeReg(nf2device *dev, int address, unsigned *wr_data)
例如: readReg(&nf2, OQ_NUM_PKTS_STORED_0, &val);
主機(jī)訪問NetFPGA寄存器的過程如下:
(1)控制軟件調(diào)用ioctl( )函數(shù)操作網(wǎng)絡(luò)socket,由函數(shù)ioctl傳遞給驅(qū)動程序;
(2)驅(qū)動程序完成PCI寄存器的讀寫