曾瑞淮,鐘冬慶 摘要:本文從移位器的功能描述、結構分析入手,并詳細闡述了一款16位dsp處理器的高頻率低功耗移位器的三個模塊的設計。
關鍵詞:移位器;dsps;設計 在一般的微處理器中,沒有單獨設計的移位器,移位功能在算術邏輯單元中實現(xiàn)。但由于dsp處理器對運算速度要求較高,通過alu來實現(xiàn)一些移位功能無法滿足其要求,所以在dsp中一般設有專門的移位器。移位器不僅可以提高一般移位功能的速度,還可以更加高速地實現(xiàn)與2的n次冪的乘法運算。因此對dsp處理器的移位器(shifter)的研究很有必要的?! ∫莆黄魇鞘菆?zhí)行單元的重要組成部分,所有算法的實現(xiàn)都是由執(zhí)行單元的基本功能組合而成,所有的其他單元例如控制、數(shù)據(jù)通路都是為執(zhí)行單元服務的,控制執(zhí)行部件的具體動作,為執(zhí)行部件提供充分的數(shù)據(jù)。嵌入式定點16位dsp的執(zhí)行單元結構如圖1所示。dsp執(zhí)行單元包含3個子單元:16位(結果為40位)移位單元(shift)、16位算術邏輯單元(alu)和16位(結果為40位)乘法累加單元(mac)。并行的對數(shù)據(jù)寄存器堆(dreg)進行數(shù)據(jù)的存取。dreg包含16個16位的通用寄存器,流水線的最后一級從dreg中讀取數(shù)據(jù),將指令執(zhí)行的結果,寫回到dreg中,而所有的這些運算操作在一個時鐘周期內完成[1]?! ?6位dsp處理器的移位器主要執(zhí)行的是兩類功能:一是實現(xiàn)移位操作,它的輸入是16位,移位后的輸出是40位。二是指數(shù)檢測,即從16位的輸入數(shù)據(jù)中檢測出前導冗余位的位數(shù)(從高位起),作為結果指數(shù)輸出到寄存器?! ∫莆徊僮髦饕腥N:邏輯移位,算術移位和規(guī)格化操作。它們都可以在左右兩個方向進行,但不能進行循環(huán)移位。執(zhí)行邏輯移位時,它的輸入看作是無符號數(shù),移位后左右兩邊的空位均用0填充;算術移位時,輸入看作有符號補碼數(shù),移位后左邊的空位填充符號位,右邊補0;規(guī)格化操作和上述兩種移位操作相似,但擴展位情況比較復雜一些,移位后右邊填0,左邊的空位要根據(jù)移位控制信號的不同情況填充0、符號位或算術狀態(tài)寄存器中的進位標志位ac。三種移位操作中移出邊界(sr39或sr0)的位都被舍棄。 指數(shù)檢測的目的是進行類似于定點到浮點的數(shù)據(jù)轉換。一個定點數(shù),可以用一個包含尾數(shù)和指數(shù)(也稱階碼)的浮點數(shù)來表示,這樣可以提高數(shù)據(jù)的表數(shù)范圍,同時使得我們的定點dsp能在不增加浮點算法開銷的情況下獲得浮點dsp的某些運算能力。指數(shù)檢測(也稱為指數(shù)提?。┑慕Y果就作為指數(shù),然后用這個指數(shù)作為移位控制碼對輸入數(shù)據(jù)進行規(guī)格化操作,就得到了尾數(shù)。也可以采用這個方法使一串數(shù)據(jù)(數(shù)據(jù)塊)共用同一個指數(shù),只是各自的尾數(shù)不同,這種數(shù)據(jù)格式稱為塊浮點格式。1. 結構分析 移位器陣列是一個16×40的桶形移位器[2]。它用于實現(xiàn)各種移位功能:邏輯移位,算術移位和規(guī)格化操作。輸入數(shù)據(jù)都是16位寬,移位后的40位結果分為三部分分別送到三個移位結果寄存器(統(tǒng)稱為sr):sr2,sr1,sr0。移位操作由一個移位控制碼(shift_code)和一個參考信號 (hi/lo) 來控制。移位控制碼是一個8位的有符號數(shù),它表示移位的方向和位數(shù),當它為正時左移,為負時右移。根據(jù)不同的移位操作,它的來源有4個:移位器指數(shù)寄存器se的內容,se寄存器的內容的相反數(shù),來自指令的立即數(shù),指令立即數(shù)的相反數(shù)。對于算術移位和邏輯移位,移位控制碼來自移位器指數(shù)寄存器se或指令中的立即數(shù);對于規(guī)格化操作,移位控制碼為移位器指數(shù)寄存器se內容或指令中立即數(shù)取反。移位器陣列可實現(xiàn)-128-127范圍內任意位數(shù)的移位。參考信號(hi/lo)決定移位操作相對于輸出域的參考點,它主要是為了實現(xiàn)32位雙精度數(shù)據(jù)移位操作而設的。當參考信號為hi時,認為輸入是32位數(shù)據(jù)的高16位,移位以40位輸出域的高16位為參考點;當參考信號為lo時,認為輸入是32位數(shù)據(jù)的低16位,移位的參考點為輸出域的低16位。連續(xù)進行兩次不同參考點的16位輸入的移位操作,然后把兩個結果相“或”,就可實現(xiàn)一個雙精度32位數(shù)據(jù)的移位操作。移位擴展位(x)就是移位操作后左邊的填充位,根據(jù)不同的移位操作,這個擴展位可以是0、輸入數(shù)的符號位或astat中的進位標志位ac。若為邏輯移位,擴展位為0;若為算術移位,擴展位為輸入符號位;若是規(guī)格化操作,情況較為復雜,又分3種情況[3]:如果是高位規(guī)格化,即參考信號為hi時,左移時擴展位為符號位,右移時擴展位為進位標志位ac;如果是低位規(guī)格化,無論左移還是右移,擴展位都為0?! r/pass邏輯就可實現(xiàn)上述的“或”操作。它根據(jù)sr_or控制信號決定是否對結果進行“或”操作,如果是普通的16位操作或32位雙精度數(shù)移位的第一次操作,就不需要進行“或”操作,移位結果直接輸出到結果寄存器;若進行的是32位操作的第2次16位移位操作,移位結果就要和第1次操作的結果相“或”后送到結果寄存器。 指數(shù)檢測器實現(xiàn)的是從16位輸入中提取指數(shù)的功能,這個指數(shù)可看作冗余符號