當前位置:首頁 > 工業(yè)控制 > 電子設計自動化
[導讀]摘要:設計了一種支持IEEE754浮點標準的32位高速流水線結構浮點乘法器。該乘法器采用新型的基4布思算法,改進的4:2壓縮結構和部分積求和電路,完成Carry Save形式的部分積壓縮,再由Carry Look-ahead加法器求得乘積。時

摘要:設計了一種支持IEEE754浮點標準的32位高速流水線結構浮點乘法器。該乘法器采用新型的基4布思算法,改進的4:2壓縮結構和部分積求和電路,完成Carry Save形式的部分積壓縮,再由Carry Look-ahead加法器求得乘積。時序仿真結果表明該乘法器可穩(wěn)定運行在80M的頻率上,并已成功運用在浮點FFT處理器中。

1 引言

在數字化飛速發(fā)展的今天,人們對微處理器的性能要求也越來越高。作為衡量微處理器 性能的主要標準,主頻和乘法器運行一次乘法的周期息息相關。因此,為了進一步提高微處 理器性能,開發(fā)高速高精度的乘法器勢在必行。同時由于基于IEEE754 標準的浮點運算具 有動態(tài)范圍大,可實現高精度,運算規(guī)律較定點運算更為簡捷等特點,浮點運算單元的設計 研究已獲得廣泛的重視。 本文介紹了 32 位浮點乘法器的設計,采用了基4 布思算法,改進的4:2 壓縮器及布思 編碼算法,并結合FPGA 自身特點,使用流水線設計技術,在實現高速浮點乘法的同時,也 使是系統具有了高穩(wěn)定性、規(guī)則的結構、易于FPGA 實現及ASIC 的HardCopy 等特點。

2 運算規(guī)則及系統結構

2.1 浮點數的表示規(guī)則

本設計采用單精度IEEE754 格式【2】。設參與運算的兩個數A、B 均為單精度浮點數, 即:


2.2 浮點乘法器的硬件系統結構

本設計用于專用浮點FFT 處理器,因此對運算速度有較高要求。為了保證浮點乘法器 可以穩(wěn)定運行在80M 以下,本設計采用了流水線技術。流水線技術可提高同步電路的運行 速度,加大數據吞吐量。而FPGA 的內部結構特點很適合在其中采用流水線設計,并且只需 要極少或者根本不需要額外的成本。綜上所述,根據系統分割,本設計將采用5 級流水處理, 圖1 為浮點乘法器的硬件結構圖。



3 主要模塊設計與仿真

3.1 指數處理模塊(E_Adder)設計

32位浮點數格式如文獻【2】中定義。由前述可知,浮點乘法的主要過程是兩個尾數相 乘,同時并行處理指數相加及溢出檢測。對于32位的浮點乘法器而言,其指數為8位,因而 本設計采用帶進位輸出的8位超前進位加法器完成指數相加、去偏移等操作,具體過程如下。

E_Adder 模塊負責完成浮點乘法器運算中指數域的求和運算,如下式所示:



其中,E[8]為MSB 位產生的進位。Bias=127 是IEEE754 標準中定義的指數偏移值。 Normalization 完成規(guī)格化操作,因為指數求和結果與尾數相乘結果有關。在本次設計中,通 過選擇的方法,幾乎可以在Normalization 標志產生后立刻獲得積的指數部分,使E_Adder 不處于關鍵路徑。

本設計收集三級進位信號,配合尾數相乘單元的 Normalization 信號,對計算結果進行 規(guī)格化處理,并決定是否輸出無窮大、無窮小或正常值。

根據 E_Adder 的時序仿真視圖,可看出設計完全符合應用需求。

3.2 改進的Booth 編碼器設計

由于整個乘法器的延遲主要決定于相加的部分積個數,因此必須減少部分積的數目才能 進而縮短整個乘法器的運算延遲。本設計采用基4 布思編碼器,使得部分積減少到13 個, 并對傳統的編碼方案進行改進。編碼算法如表1 所示。


由于 FPGA 具有豐富的與、或門資源,使得該方法在保證速度和準確性的前提下,充分 利用了FPGA 內部資源,節(jié)省了面積,同時符合低功耗的要求。

3.3 部分積產生與壓縮結構設計

3.3.1 部分積產生結構

根據布思編碼器輸出結果,部分積產生遵循以下公式【4】:



其中,PPi 為部分積;Ai 為被乘數。經過隱藏位和符號位的擴展后,26 位的被乘數尾數將產 生13 個部分積。在浮點乘法器中,尾數運算采用的是二進制補碼運算。因此,當NEG=1 時要在部分積的最低位加1,因為PPi 只完成了取反操作。而為了加強設計的并行性,部分 積最低位加1 操作在部分積壓縮結構中實現。另外,為了完成有符號數相加,需對部分積的 符號位進行擴展,其結果如圖4 所示。13 個部分積中,除第一個部分積是29 位以外,其余 部分積擴展為32 位。其中,第一個部分積包括3 位符號擴展位“SSS”,第2 至13 個部分 積的符號擴展位為“SS”,加一操作位為“NN”,遵循如下公式:


其中,i 為部分積的行數,sign(i)為第i 行部分積的符號。

3.3.2 部分積壓縮結構

本設計混合使用 4:2 壓縮器、3:2 壓縮器、全加器和半加器,實現了13 個部分積的 快速壓縮,并保證了精度。本文部分積壓縮結構的劃分如圖2 所示。


圖 2 中,虛線給出了傳統部分積的壓縮劃分,而實線描述的是本文采用的部分積壓縮結 構劃分,這樣的劃分有利于簡化第二級的壓縮結構,從而在保證速度的基礎上,節(jié)省FPGA 內部資源。從圖2 中可看出,有些位不必計算,因為這些位是由Booth 編碼時引入的乘數尾 數的符號位產生的,48 位足以表達運算結果。

3.3.3 改進的4:2 壓縮器

本設計采用廣泛使用的 4:2 壓縮器,并針對FPGA 內部資源特點,對其進行了改進。 如圖3 所示。 傳統的 4:2 壓縮器即兩個全加器級聯,共需要四個異或門和8 個與非門。而改進的4: 2 壓縮器需要四個異或門和兩個選擇器(MUX)。8 個與非門需要36 個晶體管,而兩個MUX 需要20 個晶體管。同時,FPGA 內部集成了大量的異或門和選擇器資源,這種設計方法也是對FPGA 的一個充分利用。



由于壓縮部分積需要大量的4:2 壓縮器,所以改進的電路能 在一定程度上減小版圖的面積,也為該乘法器的ASIC 后端設計帶來了優(yōu)勢。另外,改進的 壓縮器的4 個輸入到輸出S 的延時相同,都是3 級XOR 門延時。

4 32 位浮點乘法器的實現與仿真

圖 4 顯示了本設計的FPGA 時序仿真結果,時序仿真環(huán)境為Quartus II 7.0,目標芯片為 Cyclone 系列的EP1C6Q240C8,功能仿真環(huán)境為Modelsim 6.0b。整個設計采用VHDL 語言進行結構描述,綜合策略為面積優(yōu)先。由仿真視圖可看出,該浮點乘法器可穩(wěn)定運行在80M 及以下頻率,在延時5 個周期后,以后每一個周期可穩(wěn)定輸出一級乘法運算結果,實現了高 吞吐量。如果采用全定制進行后端版圖布局布線,乘法器的性能將更加優(yōu)越。


5 結語

本文作者創(chuàng)新點:針對FPGA 器件內部資源特性,獨創(chuàng)地提出了一種適合FPGA 實現 的5 級流水高速浮點乘法器。該乘法器支持IEEE754 標準32 位單精度浮點數,采用了基4 布思算法、改進的布思編碼器、部份積壓縮結構等組件,從而在保證高速的前提下,縮小了 硬件規(guī)模,使得該乘法器的設計適合工程應用及科學計算,并易于ASIC 的后端版圖實現。 該設計已使用在筆者設計的浮點FFT 處理器中,取得了良好效果。



參考文獻:

[1].EP1C6Q240C8datasheethttp://www.dzsc.com/datasheet/EP1C6Q240C8_1135222.html.


來源:xiaobai0次

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯合牽頭組建的NVI技術創(chuàng)新聯盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯...

關鍵字: VI 傳輸協議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉