FPU加法器的設(shè)計(jì)與實(shí)現(xiàn)
摘要:浮點(diǎn)運(yùn)算器的核心運(yùn)算部件是浮點(diǎn)加法器,它是實(shí)現(xiàn)浮點(diǎn)指令各種運(yùn)算的基礎(chǔ),其設(shè)計(jì)優(yōu)化對(duì)于提高浮點(diǎn)運(yùn)算的速度和精度相當(dāng)關(guān)鍵。文章從浮點(diǎn)加法器算法和電路實(shí)現(xiàn)的角度給出設(shè)計(jì)方法,通過(guò)VHDL語(yǔ)言在OuartusII中進(jìn)行設(shè)計(jì)和驗(yàn)證,此加法器通過(guò)狀態(tài)機(jī)控制運(yùn)算,有效地降低了功耗,提高了速度,改善了性能。
關(guān)鍵詞:浮點(diǎn)運(yùn)算;加法器;設(shè)計(jì);VHDL;狀態(tài)機(jī)
在一般的處理器中,浮點(diǎn)加法、減法、轉(zhuǎn)換和傳送最終都是可以轉(zhuǎn)換為采用浮點(diǎn)加法器實(shí)現(xiàn),所以浮點(diǎn)加法器的使用頻率高達(dá)55%,是使用頻率最高的浮點(diǎn)運(yùn)算模塊。浮點(diǎn)加法的兩個(gè)特點(diǎn),一是它復(fù)雜,二是它被使用的頻率在所有操作里面是最高的,所以它是現(xiàn)代微處理器和數(shù)字信號(hào)處理器中非常關(guān)鍵的部分。因此.浮點(diǎn)加法器的設(shè)計(jì)對(duì)FPU的整體性能十分重要。
1 運(yùn)算方法
最基本的浮點(diǎn)加法算法需要相對(duì)最多的串行運(yùn)算操作,它需要完成兩個(gè)浮點(diǎn)操作數(shù)的求和運(yùn)算,包括尾數(shù)部分的求和以及相應(yīng)修改結(jié)果的指數(shù)值,而且最終結(jié)果必須是符合正IEEE754標(biāo)準(zhǔn)的規(guī)格化浮點(diǎn)數(shù)。
根據(jù)IEEE754浮點(diǎn)數(shù)表示方法與運(yùn)算規(guī)則,其表示如公式(1)所示:
公式中:s為尾數(shù)的符號(hào);t為指數(shù)的符號(hào);e為尾數(shù);f為指數(shù)。存儲(chǔ)格式如圖1所示。
為方便浮點(diǎn)數(shù)的乘除法運(yùn)算,文中將e=1.n的表示方法改為e=1n,這樣不斷減少了進(jìn)行乘除運(yùn)算后的額外移位操作而且不增加加減法運(yùn)算的運(yùn)算量。
一般情況下,在浮點(diǎn)運(yùn)算中為了提高數(shù)據(jù)表示的精度,通常需要將一段離散數(shù)據(jù)在實(shí)數(shù)軸上集中表示,這就需要對(duì)浮點(diǎn)數(shù)的表示方法進(jìn)行限制,因此在浮點(diǎn)數(shù)中尾數(shù)的位數(shù)應(yīng)大于指數(shù)的值,這樣表示的優(yōu)點(diǎn)是其數(shù)據(jù)精度相對(duì)較高。
本浮點(diǎn)加法模塊,將采用突破浮點(diǎn)數(shù)表示方法的上述限制,使指數(shù)的值可以遠(yuǎn)遠(yuǎn)大于尾數(shù)的位數(shù),這樣數(shù)據(jù)的表達(dá)范圍增大,實(shí)數(shù)軸上較寬的一段離散數(shù)據(jù)就可表達(dá)。然而這種做法的缺點(diǎn)是,一方面當(dāng)數(shù)據(jù)表示寬度增大后,其精度就會(huì)降低,原因是表示的匯聚點(diǎn)距離拉大;另外一種情況是會(huì)出現(xiàn)數(shù)據(jù)移空現(xiàn)象,例如當(dāng)一個(gè)操作數(shù)很大,而另一個(gè)操作數(shù)很小時(shí),如果要進(jìn)行減法運(yùn)算,會(huì)出現(xiàn)在對(duì)階移位的過(guò)程中將一個(gè)操作數(shù)移成了空數(shù)據(jù),其值將會(huì)變成零。因此當(dāng)兩個(gè)操作數(shù)進(jìn)行加法運(yùn)算時(shí),假如它們之間的差距很大,就可以不進(jìn)行運(yùn)算,直接將較大的操作數(shù)直接輸出作為運(yùn)算結(jié)果,就可將無(wú)謂操作避免,從而節(jié)省運(yùn)行時(shí)間。
對(duì)于浮點(diǎn)數(shù)加法運(yùn)算來(lái)說(shuō),它要求參與運(yùn)算的兩個(gè)操作數(shù)有一個(gè)共同的特點(diǎn),那就是指數(shù)相同。只有當(dāng)兩個(gè)操作數(shù)的指數(shù)相同時(shí)才能夠進(jìn)行加法運(yùn)算。浮點(diǎn)數(shù)加法如公式(2)所示:
簽于浮點(diǎn)加法運(yùn)算的特殊要求,兩個(gè)浮點(diǎn)操作數(shù)存進(jìn)行運(yùn)算時(shí)需要通過(guò)以下幾個(gè)步驟完成。第1步進(jìn)行0操作數(shù)的檢查,如果判定兩個(gè)操作數(shù)中任意一個(gè)操作數(shù)為零,則沒(méi)有必要進(jìn)行后續(xù)一系列的操作,直接輸出結(jié)果,從而節(jié)省運(yùn)算時(shí)間;第2步,看它們的階碼是否相同,也就是小數(shù)點(diǎn)是否對(duì)齊,若相同則表示對(duì)齊,否則就必須通過(guò)對(duì)階使小數(shù)點(diǎn)對(duì)齊,即階碼相同。第3步,對(duì)階結(jié)束后,進(jìn)行尾數(shù)求和,方法和定點(diǎn)加法運(yùn)算相同。第4步,對(duì)結(jié)果進(jìn)行規(guī)格化。第5步,進(jìn)行必要的舍入處理。另外在進(jìn)行加法器設(shè)計(jì)時(shí),將和減法一起進(jìn)行考慮,采用補(bǔ)碼運(yùn)算,這樣將來(lái)的操作就可以直接調(diào)用加法核去完成。
2 加法器的設(shè)計(jì)實(shí)現(xiàn)
2.1 電路原理圖
浮點(diǎn)加法運(yùn)算模塊電路原理如圖2所示。主要由6個(gè)模塊構(gòu)成,分別是Subcell模塊、exchange模塊、move模塊、M_add模塊、standat模塊、cntrl模塊。下面將分別對(duì)這6個(gè)模塊進(jìn)行介紹。
1)Subcell模塊
此模塊的功能主要有以下4個(gè)方面:①0操作數(shù)的檢查。將有關(guān)信息送到cntrl模塊和standar模塊,用于決定是否進(jìn)行后續(xù)操作,以便節(jié)省運(yùn)算的時(shí)間。②階碼大小的比較。將小數(shù)a_little傳送到cntrl模塊。③對(duì)階。比較兩個(gè)操作數(shù)的階碼,求出它們階碼的差值sub[6..0],送到move模塊。④當(dāng)這個(gè)模塊運(yùn)算結(jié)束或者有新操作數(shù)輸入時(shí),告知cntrl模塊。
在圖2中,當(dāng)rst_sub=‘0’,此模塊就正常工作;若rst_sub=‘1’,則所有的輸出都是0。在零操作數(shù)檢查的過(guò)程中,如果發(fā)現(xiàn)有0操作數(shù)的存在,則就令num_z<=‘1’;在此操作數(shù)的檢查過(guò)程中還可以區(qū)分到底是哪一個(gè)操作數(shù)為零,假如操作數(shù)x為零,則就令z_find<=“0 1”;若是操作數(shù)y為零,則就令z_find<=“10”;若無(wú)0操作數(shù),則z_find<=“00”。當(dāng)對(duì)參與運(yùn)算的兩個(gè)操作數(shù)進(jìn)行0操作數(shù)判別結(jié)束后,本模塊在實(shí)現(xiàn)的過(guò)程中主要采用了5個(gè)條件語(yǔ)句來(lái)實(shí)現(xiàn)兩個(gè)操作數(shù)大小的比較,通過(guò)比較可以算出階碼的差值。若兩數(shù)的階碼相同,即小數(shù)點(diǎn)是對(duì)齊的,則進(jìn)行位數(shù)的比較,當(dāng)然這所有的比較都是通過(guò)不同的條件語(yǔ)句來(lái)實(shí)現(xiàn)的。所有的比較完畢,end_sub設(shè)為1。當(dāng)有新的數(shù)據(jù)從x,y端輸入的時(shí)候,根據(jù)程序的設(shè)置,相關(guān)進(jìn)程會(huì)被喚醒,控制模塊接收到進(jìn)程發(fā)送來(lái)的脈沖change,就知道有新的操作數(shù)據(jù)輸入,因此再次啟動(dòng)控制模塊,進(jìn)而進(jìn)入另一個(gè)新的周期。
2)exchange模塊
此模塊的功能為:①向move模塊輸入小冪次浮點(diǎn)數(shù)尾數(shù),②向M_ADD模塊輸入大冪次浮點(diǎn)數(shù)尾數(shù)。
此模塊包含一個(gè)Process進(jìn)程,當(dāng)rst_exchange=‘0’并且en_exchange=‘1’,浮點(diǎn)數(shù)x,y的冪和尾數(shù)被拆開,存入不同變量。然后執(zhí)行本模塊所設(shè)置的4個(gè)條件語(yǔ)句,分別對(duì)兩個(gè)浮點(diǎn)數(shù)進(jìn)行處理,一方面將冪次小的操作數(shù)位數(shù)進(jìn)行擴(kuò)充,擴(kuò)充為33位后傳送到move模塊中;另一方面將冪次大的操作數(shù)擴(kuò)充成32為傳送到M_ADD模塊中。進(jìn)程結(jié)束后,end_exchange置高電平,告知控制模塊。
3)move模塊
此模塊的功能主要是為了實(shí)現(xiàn)兩個(gè)操作數(shù)的對(duì)階。在這個(gè)模塊中設(shè)計(jì)了一個(gè)進(jìn)程process(clk),它以clk為敏感信號(hào),此進(jìn)程還包含有2個(gè)條件語(yǔ)句模塊。第1個(gè)模塊主要是對(duì)變量進(jìn)行更新。第2個(gè)模塊主要是判斷移位是否已經(jīng)結(jié)束,并對(duì)相應(yīng)的標(biāo)志位進(jìn)行設(shè)置。假如所移操作數(shù)的后8位是不為0的,那么在每個(gè)時(shí)鐘的上升沿到來(lái)時(shí)繼續(xù)進(jìn)行向右的移動(dòng)。
4)M_add模塊
此模塊的主要功能是對(duì)階完成以后,對(duì)尾數(shù)進(jìn)行運(yùn)算。通過(guò)在每個(gè)尾數(shù)前加一位0來(lái)檢測(cè)運(yùn)算結(jié)果是否需要規(guī)格化。程序如下:
在進(jìn)行加減法運(yùn)算中分兩種情況:當(dāng)add_sub=“11”,執(zhí)行Mx+My;當(dāng)add_sub=“00”,執(zhí)行Mx-My。具體由Cntrl模塊的分析中給出。
5)standar模塊
此模塊的主要功能是對(duì)浮點(diǎn)運(yùn)算的結(jié)果進(jìn)行規(guī)格化處理。這個(gè)模塊中有兩個(gè)變量分別是ntemp和texp,該模塊在首次執(zhí)行時(shí)對(duì)它們進(jìn)行初始化,否則只有當(dāng)控制模塊發(fā)出rst命令的時(shí)候才能對(duì)它們的初始值進(jìn)行改變。當(dāng)add_sub的值不同時(shí),則將條件語(yǔ)句分成了不同的部分:
①當(dāng)add_sub的取值為“00”或者當(dāng)其取值為“01”的時(shí)候,可得M_ADD模塊進(jìn)行的是減法運(yùn)算;如果運(yùn)算結(jié)果是0,那么就直接將0輸出;假如運(yùn)算結(jié)果不為0,就需要對(duì)numb(15)進(jìn)行考慮;假如其值是1的話,就不需要進(jìn)行左移,直接執(zhí)行語(yǔ)句:“sum_standar<=signal_b& temp_exp(5 downto0)&ntemp(14 downto 6);”。但是如果numb(15)的值是為0的,就需要進(jìn)行左移。
②當(dāng)add_sub=‘11’時(shí),則M_ADD模塊執(zhí)行加法運(yùn)算;如果numb(16)的值為1,就需要進(jìn)行右移。而當(dāng)numb(16)的值為0時(shí),則不用進(jìn)行規(guī)格化,直接輸出。
6)cntrl模塊
在這個(gè)模塊中主要采用的是Mealy狀態(tài)機(jī),它和輸入、輸出、狀態(tài)皆有關(guān);一方面Mealy狀態(tài)機(jī)要完成其狀態(tài)的轉(zhuǎn)化,需要等待本模塊中CLK_m時(shí)鐘信號(hào)的上升沿。另一方面如果subcell模塊有了新的操作數(shù)的輸入,本模塊收到告知信號(hào)后,會(huì)將狀態(tài)機(jī)重新運(yùn)行。
在此對(duì)本設(shè)計(jì)模塊中所使用狀態(tài)機(jī)所包含的各個(gè)部分進(jìn)行簡(jiǎn)要的闡述:
①說(shuō)明部分
本部分主要是在ARCHITECTURE和BEGIN之間,用TYPE語(yǔ)句定義枚舉型的數(shù)據(jù)類型(包含既定狀態(tài)元素)status,狀態(tài)變量xt_status和ct_st atus定義為信號(hào)signal。主要用以下語(yǔ)句實(shí)現(xiàn):
type status is(rst1,rst2,rst3,rst4,rst5,rst6,rst7);
signal xt_status,ct_status:status;
②主控時(shí)序進(jìn)程
本部分主要以同步時(shí)序的方式工作,負(fù)責(zé)在時(shí)鐘驅(qū)動(dòng)下狀態(tài)的轉(zhuǎn)換進(jìn)程。一般情況下,主控時(shí)序進(jìn)程是不負(fù)責(zé)下一個(gè)具體狀態(tài)的取值,只是簡(jiǎn)單機(jī)械地將代表次態(tài)ct_status信號(hào)中的內(nèi)容送人現(xiàn)態(tài)信號(hào)xt_status。而ct_status信號(hào)的內(nèi)容完全由其他進(jìn)程根據(jù)實(shí)際情況來(lái)決定。當(dāng)然此進(jìn)程可以防止一些同步或異步的清零或者置位控制信號(hào)。在本部分中包含了敏感信號(hào)進(jìn)程。
此進(jìn)程的狀態(tài)如下:
I Rst1:所有的信號(hào)進(jìn)行初始化,準(zhǔn)備跳至下一個(gè)狀態(tài)。
ⅡRst2:?jiǎn)?dòng)subcell和exchange模塊,跳至下一狀態(tài)。
ⅢRst3:如果num_z=‘1’,也就是其中有一個(gè)操作數(shù)是零,就跳至狀態(tài)Rst5,停止subcell和exchange兩個(gè)模塊。假如都不為零,則end_sub=‘1’和end_exchange=‘1’,開啟move模塊,轉(zhuǎn)至Rst4狀態(tài)。
ⅣRst4:停止move模塊,開啟M_ADD模塊。
V Rst5:若有操作數(shù)為0,就直接開啟standar模塊,若無(wú)0,就等待M_ADD模塊結(jié)束以后,再開啟。開啟后,M_ADD模塊不可用。
ⅥRst6:standar模塊運(yùn)行結(jié)束以后,當(dāng)clk_m=‘1’,關(guān)閉模塊。當(dāng)clk_m=‘0’,跳至Rst1。
ⅦRst7:這個(gè)狀態(tài)稱為不能夠使用狀態(tài)。
③主控組合進(jìn)程
本部分的功能主要有兩個(gè)方面,一方面是根據(jù)外部輸入的控制信號(hào)和當(dāng)前狀態(tài)的狀態(tài)值決定下一個(gè)狀態(tài)的去向;另外一個(gè)方面是確定內(nèi)外控制信號(hào)的內(nèi)容。
④輔助進(jìn)程
本模塊的主要輔助進(jìn)程為process(a_small,sign_x,sign_v,add_sub),這個(gè)進(jìn)程的主要作用是能夠?qū)\(yùn)算所產(chǎn)生結(jié)果的符號(hào)進(jìn)行確定。
浮點(diǎn)加法運(yùn)算模塊的功能仿真如圖3所示。
3 結(jié)束語(yǔ)
現(xiàn)代信號(hào)處理技術(shù)通常都需要進(jìn)行大量高速浮點(diǎn)運(yùn)算。由于浮點(diǎn)數(shù)系統(tǒng)操作比較復(fù)雜,需要專用硬件來(lái)完成相關(guān)的操作,在浮點(diǎn)運(yùn)算中的浮點(diǎn)加法運(yùn)算幾乎占到全部運(yùn)算操作的一半以上,因此,浮點(diǎn)加法器是現(xiàn)代信號(hào)處理系統(tǒng)中最重要的部件之一,它的設(shè)計(jì)與改進(jìn)具有重要意義。