;;; 摘要:介紹一種在8096/96系列單片機上實現(xiàn)的單精度浮點數(shù)快速除法。該算法采用了預(yù)估一修正的數(shù)值計算方法,并充分利用了16位CPU中的乘除法指令,計算速度快、精度高,有很強的實用性。 ;;; 關(guān)鍵詞:浮點數(shù) 除法 尾數(shù) 預(yù)估-修正 誤差 精度 在較為復(fù)雜的單片機系統(tǒng)中,為擴大取值范圍,實現(xiàn)復(fù)雜的計算和控制,一般都要涉及浮點數(shù)的運算。而一般單片機是沒有浮點數(shù)運算指令的,必須自行編制相應(yīng)軟件。在進行除法計算時,通常使用的方法是比較除法[1],即利用循環(huán)移位和減法操作來得到24~32位商,效率很低。有些文獻給出了一些改進方法[2],但思想不清晰,很難推廣使用。這里給出一種浮點數(shù)除法運算的實用快速算法。該方法以數(shù)值計算中的預(yù)估-修正方法為指導(dǎo),充分利用了16位單片機的乘除法功能,很輕易地實現(xiàn)了浮點數(shù)的除法。 1 浮點數(shù)格式 IEEE的浮點數(shù)標準規(guī)定了單精度(4字節(jié))、雙精度(8字節(jié))和擴展精度(10字節(jié))三種浮點數(shù)的格式。最常用的是單精度浮點數(shù),格式如圖1所示。但是這種格式的階碼不在同一個字節(jié)單元內(nèi),不易尋址,從而會影響運算速度。 通常在單片機上采用的是一種變形格式的浮點數(shù),如圖2所示。其中的23位尾數(shù)加上隱含的最高位1,構(gòu)成一個定點原碼小數(shù),即尾數(shù)為小于1大于等于0.5的小數(shù)。有關(guān)浮點數(shù)格式的詳細內(nèi)容請參考有關(guān)文獻[1][2]。 2 快速除法的算法原理 在16位單片機中只有16位的乘除法,而浮點數(shù)的精度(即尾數(shù)的有效位數(shù))達24位,因此無法直接相除,但依然可以利用16位的乘除法指令來實現(xiàn)24位除法。不過,如果只進行一次16位的除法必定會帶來很大誤差,因此問題的關(guān)鍵在于如何消除這個誤差,從而達到要求的精度。這其實就是通常數(shù)值計算中所采用的預(yù)估-修正方法。 假設(shè)兩個浮點數(shù)經(jīng)過預(yù)處理后,被除數(shù)和除數(shù)尾數(shù)擴展為32位(末8位為0)分別放入X和Y中。鄰YL為Y的低16位,并記YH=Y-YL。顯然YH≈Y,X/Y與Y/YH相差不多: (X/Y)/(X/YH)=(YH/Y) =YH/(YH+YL) =1/(1+YL/YH) ≈1-YL/YH =(YH-YL)/YL 可見只需要在X/YH的基礎(chǔ)上再乘以一個修正因子(YH-YL)/YH,就可以得到X/Y的一次校準值。不難證明這個值已經(jīng)達到了24位的精度要求。事實上,相對誤差滿足:
;;; 這說明這個一次校準值完全可以作為最終的結(jié)果。 3 算法的具體實現(xiàn) 在具體實現(xiàn)本算法時,主要經(jīng)過下列步驟: (1)計算預(yù)估值Q0=X/YH; (2)計算修正因子Q1=(YH-YL)/YH; (3)計算校準值Q=Q0×Q1,并作為最后結(jié)果。 這里的YH雖仍是32