Cortex-M3內(nèi)核浮點(diǎn)型運(yùn)算的研究與實(shí)現(xiàn)
摘要:通過(guò)分析Cortex-M3內(nèi)核的結(jié)構(gòu)與浮點(diǎn)型格式,充分利用Cortex-M3內(nèi)核中的分支預(yù)測(cè)、單周期乘法、硬件除法等眾多功能強(qiáng)大的特性,使用Thumb-2指令集實(shí)現(xiàn)了單精度浮點(diǎn)型的加、減、乘、除與比較運(yùn)算,并給出了加減法運(yùn)算的流程圖和除法運(yùn)算的源程序。
關(guān)鍵詞:Cortex-M3內(nèi)核;浮點(diǎn)型;速度
引言
在一些較為復(fù)雜的運(yùn)算中,經(jīng)常需要處理取值范圍大、精度高的浮點(diǎn)型數(shù)據(jù)。但一般的低端嵌入式內(nèi)核中沒(méi)有浮點(diǎn)型硬件運(yùn)算器,因此處理語(yǔ)音信號(hào)等數(shù)據(jù)比較困難。本文提出了一種基于Cortex-M3內(nèi)核的浮點(diǎn)型運(yùn)算的處理方法。
1 Thumb-2指令集與COrtex-M3內(nèi)核結(jié)構(gòu)
Thumb-2指令集具有以下優(yōu)點(diǎn):許多指令(包括乘法相關(guān)指令、突破性的32位硬件除法指令等)都是單周期的,并且位段處理指令取指都按32位處理。
Cortex-M3是一個(gè)32位處理器內(nèi)核,采用哈佛結(jié)構(gòu),擁有獨(dú)立的指令總線和數(shù)據(jù)總線,可以讓取指與數(shù)據(jù)訪問(wèn)并行不悖。它具有如下特點(diǎn):功耗低,有睡眠、停機(jī)和待機(jī)3種模式;實(shí)時(shí)性好;響應(yīng)中斷快,而且響應(yīng)中斷所需的周期數(shù)是確定的;采用Thumb-2指令集,使得代碼
密度和執(zhí)行效率更高。
2 浮點(diǎn)數(shù)的格式
IEEE的浮點(diǎn)型數(shù)據(jù)標(biāo)準(zhǔn)規(guī)定,浮點(diǎn)數(shù)具有單精度(4字節(jié))、雙精度(8字節(jié))和擴(kuò)展精度(10字節(jié))三種浮點(diǎn)型格式。在實(shí)際的應(yīng)用中,使用最多的是單精度浮點(diǎn)數(shù),格式如下:
浮點(diǎn)數(shù)表示為:X=MsEsEm-1…E1E0 M-1M-2…M-n。IEEE標(biāo)準(zhǔn)規(guī)定:階碼用移碼;尾數(shù)的符號(hào)位用1表示負(fù)數(shù),0表示正數(shù);尾數(shù)的數(shù)據(jù)位用原碼表示,并且隱藏了第24位(即M-1),M-1為1,所以尾數(shù)是大于等于0.5小于1的小數(shù)。
階碼用移碼表示、尾數(shù)用原碼表示浮點(diǎn)數(shù)的好處:
①浮點(diǎn)數(shù)據(jù)零的所有位均為零。
②2個(gè)浮點(diǎn)數(shù)比較大小時(shí),可不必區(qū)分階碼位和數(shù)據(jù)位,視為有符號(hào)32位整型數(shù)據(jù)比較。
3 浮點(diǎn)型運(yùn)算的具體實(shí)現(xiàn)
3.1 加減運(yùn)算
Cortex-M3是32位的內(nèi)核,可以把單精度浮點(diǎn)數(shù)存儲(chǔ)為32位的有符號(hào)整數(shù),這樣便于比較運(yùn)算。加減運(yùn)算的流程如圖1所示。
3.2 乘法運(yùn)算
對(duì)于浮點(diǎn)型乘法運(yùn)算,因?yàn)镃ortex-M3內(nèi)核支持單周期乘法指令,所以運(yùn)算速度比較快。運(yùn)算流程與加減運(yùn)算相似,不同之處有:階碼相加最高位取反得結(jié)果的階碼;尾數(shù)不用正負(fù)號(hào)調(diào)整,直接相乘,而尾數(shù)的符號(hào)位異或即可得結(jié)果的符號(hào)位;兩個(gè)24位尾數(shù)相乘的結(jié)果為48位,尾數(shù)規(guī)格化的時(shí)候,判斷第48位是否為1,如果為1則階碼加1,如果為O則第47位一定為1,階碼不必調(diào)整。
3.3 除法運(yùn)算
除法運(yùn)算中,提取階碼、重現(xiàn)尾數(shù)、提取尾數(shù)以及尾數(shù)符號(hào)位的操作與乘法運(yùn)算相同,因此除法運(yùn)算過(guò)程與乘法運(yùn)算過(guò)程的基本相似,只是計(jì)算X、Y尾數(shù)的商有所不同。
計(jì)算商的方法為:先把X的尾數(shù)左移8位,與Y的尾數(shù)相除得結(jié)果Z1,并計(jì)算出余數(shù)W1=X-Z1*Y;W1先左移8位,與Y的尾數(shù)相除得結(jié)果Z2,并計(jì)算出余數(shù)W2=W1-Z2*Y;W2左移8位,與Y的尾數(shù)相除得結(jié)果Z3。調(diào)整Z1、Z2、Z3并組裝成24位或25位尾數(shù)。除法運(yùn)算的源程序如下:
3.4 浮點(diǎn)型數(shù)據(jù)比較
從浮點(diǎn)型數(shù)據(jù)存儲(chǔ)的格式來(lái)看,可以把浮點(diǎn)數(shù)按照有符號(hào)整型數(shù)據(jù)來(lái)比較大小。比較的結(jié)果:相等輸出O,大于輸出1,小于輸出-1。
4 測(cè)試結(jié)果
利用基于Cortex-M3內(nèi)核的STM32F103VET6處理器測(cè)試浮點(diǎn)型運(yùn)算的速度,處理器的工作頻率為72 MHz,測(cè)試的方法為:每完成一次浮點(diǎn)型運(yùn)算,處理器的一引腳變化一次電平。經(jīng)測(cè)試,變化一次電平耗時(shí)153ns。圖2、圖3是對(duì)乘法運(yùn)算和除法運(yùn)算的測(cè)試結(jié)果。從圖中可以看出,乘法的運(yùn)算速率約為0.717μs/次,除法的運(yùn)算速率約為0.957μs/次??梢?jiàn),運(yùn)算速率比較高,精度較高,可以滿足實(shí)際應(yīng)用要求。
結(jié)語(yǔ)
測(cè)試結(jié)果表明,在Cortex-M3內(nèi)核上實(shí)現(xiàn)浮點(diǎn)型運(yùn)算,可以達(dá)到所要求的精度,運(yùn)算速度較快,具有較高的實(shí)時(shí)性。本文提出的浮點(diǎn)型運(yùn)算的處理方法在基于Cortex-M3內(nèi)核的處理器上有著較高的應(yīng)用價(jià)值。希望對(duì)從事這方面的人員有所幫助。