ARM程序優(yōu)化及其在嵌入式TCP/IP協(xié)議實(shí)現(xiàn)中的應(yīng)用

時(shí)間：2012-04-20 13:14:48

關(guān)鍵字： ARM 嵌入式 TCP/IP協(xié)議

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]隨著嵌入式技術(shù)的發(fā)展，人們對(duì)系統(tǒng)的智能化、小型化的要求也越來越高?；贏RM結(jié)構(gòu)的微處理器以其高性能、低功耗、低價(jià)格等方面的優(yōu)勢(shì)被廣泛應(yīng)用于各種電子產(chǎn)品，特別是一些高端的嵌入式控制應(yīng)用中，例如移動(dòng)電話、工

隨著嵌入式技術(shù)的發(fā)展，人們對(duì)系統(tǒng)的智能化、小型化的要求也越來越高。基于ARM結(jié)構(gòu)的微處理器以其高性能、低功耗、低價(jià)格等方面的優(yōu)勢(shì)被廣泛應(yīng)用于各種電子產(chǎn)品，特別是一些高端的嵌入式控制應(yīng)用中，例如移動(dòng)電話、工業(yè)控制、網(wǎng)絡(luò)通信等方面。ARM技術(shù)具有很好的性能和功效，其合作伙伴包括許多世界頂級(jí)的半導(dǎo)體公司?？梢哉fARM技術(shù)幾乎無處不在。

TCP/IP互聯(lián)網(wǎng)協(xié)議族在全世界范圍內(nèi)已經(jīng)成為開放系統(tǒng)互聯(lián)的協(xié)議，它提供了很好的交互操作能力，可兼容多種網(wǎng)絡(luò)技術(shù)。嵌入式技術(shù)與TCP/IP技術(shù)的結(jié)合已經(jīng)展現(xiàn)出強(qiáng)勁的發(fā)展勢(shì)頭和巨大的市場(chǎng)潛力。如何開發(fā)面向 ARM的高效代碼，尤其是提高類似于TCP/IP協(xié)議棧等基礎(chǔ)性的軟件模塊的執(zhí)行效率已成為每個(gè)從事基于ARM的嵌入式系統(tǒng)開發(fā)人員必須思考的問題。

面向ARM的程序優(yōu)化

開發(fā)高效的程序涉及很多方面，包括優(yōu)秀的算法實(shí)現(xiàn)、良好的編程風(fēng)格以及針對(duì)目標(biāo)的程序優(yōu)化。程序優(yōu)化是指軟件編程基本結(jié)束后，利用軟件開發(fā)工具對(duì)程序代碼進(jìn)行調(diào)整和改進(jìn)，使程序能夠更加充分地利用有限的軟硬件資源，縮減代碼尺寸，提高運(yùn)行效率的過程。

在實(shí)際的程序設(shè)計(jì)過程中，程序優(yōu)化的兩個(gè)目標(biāo)（運(yùn)行速度和代碼大?。┩腔ハ嗝艿?。為了提高程序運(yùn)行效率，就要以犧牲存儲(chǔ)空間、增加代碼量為代價(jià)；而為了減少程序代碼量、壓縮存儲(chǔ)器空間，可能又要以降低程序運(yùn)行效率為代價(jià)。按照優(yōu)化的側(cè)重點(diǎn)不同，程序優(yōu)化可分為運(yùn)行速度優(yōu)化和代碼尺寸優(yōu)化。隨著微電子技術(shù)的不斷發(fā)展，存儲(chǔ)空間已不再是制約系統(tǒng)集成的主要因素。面向ARM的程序優(yōu)化主要是討論如何在了解匯編語言和編譯規(guī)則的基礎(chǔ)上編寫出能夠高效運(yùn)行的C語言程序。

作為高性能、低功耗的RISC芯片，ARM的C語言編譯器已經(jīng)非常成熟。盡管如此，在編寫面向ARM的C源程序時(shí)，對(duì)程序進(jìn)行必要的優(yōu)化仍是提高程序運(yùn)行效率的有效途徑。以下是一些在實(shí)現(xiàn)TCP/IP協(xié)議過程中用到的比較典型的優(yōu)化原則和方法，這些技術(shù)也適用于其他RISC

指令集微處理器。

變量定義

32位 ARM處理器的指令集支持有符號(hào)/無符號(hào)的8位、16位、32位整型和浮點(diǎn)型變量類型，這不僅可以節(jié)省代碼，而且可以提高代碼的運(yùn)行效率。按照作用范圍的不同，C語言的變量可以劃分為全局變量和局部變量。ARM編譯器通常將全局變量定位在存儲(chǔ)空間中，局部變量分配給通用寄存器。

在全局變量聲明時(shí)，需要考慮最佳的存儲(chǔ)器布局，使得各種類型的變量能以32位的空間位基準(zhǔn)對(duì)齊，從而減少不必要的存儲(chǔ)空間浪費(fèi)，提高運(yùn)行效率。如：

這里定義的四個(gè)變量形式相同，只是次序不同，卻導(dǎo)致了在最終映像中不同的數(shù)據(jù)布局，如圖1所示。顯然第二種方式節(jié)約了更多的存儲(chǔ)器空間。

對(duì)于局部變量，要盡量不使用32位以外的變量類型。當(dāng)一個(gè)函數(shù)的局部變量數(shù)目不多時(shí)，編譯器會(huì)把局部變量分配給內(nèi)部寄存器，每個(gè)變量占一個(gè)32位的寄存器。這樣short和char類型的變量不但起不到節(jié)省空間的作用，反而會(huì)耗費(fèi)更多的指令周期來完成short和char的存取操作。C語言代碼及其編譯結(jié)果如下所示：

條件執(zhí)行

條件執(zhí)行是程序中必不可少的基本操作。典型的條件執(zhí)行代碼序列是由一個(gè)比較指令開始的，接下來是一系列相關(guān)的執(zhí)行語句。ARM中的條件執(zhí)行是通過對(duì)運(yùn)算結(jié)果標(biāo)志位進(jìn)行判斷實(shí)現(xiàn)的，一些帶標(biāo)志位的運(yùn)算結(jié)果中，N和Z標(biāo)志位的結(jié)果與比較語句的結(jié)果相同。盡管在C語言中沒有帶標(biāo)志位的指令，但在面向ARM的C語言程序中，如果運(yùn)算結(jié)果是與0作比較，編譯器會(huì)移去比較指令，通過一條帶標(biāo)志位指令實(shí)現(xiàn)運(yùn)算和判斷。例如：

因此，面向ARM的C語言程序設(shè)計(jì)的條件判斷應(yīng)當(dāng)盡量采用“與0比較”的形式。C語言中，條件執(zhí)行語句大多數(shù)應(yīng)用在if條件判斷中，也有應(yīng)用在復(fù)雜的關(guān)系運(yùn)算（<，==，>等）及位操運(yùn)算（&&，！，and等）中的。面向ARM的C語言程序設(shè)計(jì)中，有符號(hào)型變量應(yīng)盡量采取x& lt;0、x>=0、x==0、x!=0的關(guān)系運(yùn)算；對(duì)于無符號(hào)型的變量應(yīng)采用x==0、x!=0（或者x>0）關(guān)系運(yùn)算符。編譯器都可以對(duì)條件執(zhí)行進(jìn)行優(yōu)化。

對(duì)于程序設(shè)計(jì)中的條件語句，應(yīng)盡量簡(jiǎn)化if和else判斷條件。與傳統(tǒng)的C語言程序設(shè)計(jì)有所不同，面向ARM的C語言程序設(shè)計(jì)中，關(guān)系表述中類似的條件應(yīng)該集中在一起，使編譯器能夠?qū)ε袛鄺l件進(jìn)行優(yōu)化。

循環(huán)

循環(huán)是程序設(shè)計(jì)中非常普遍的結(jié)構(gòu)。在嵌入式系統(tǒng)中，微處理器執(zhí)行時(shí)間在循環(huán)中運(yùn)行的比例較大，因此關(guān)注循環(huán)的執(zhí)行效率是非常必要的。除了在保證系統(tǒng)正確工作的前提下盡量簡(jiǎn)化核循環(huán)體的過程以外，正確和高效的循環(huán)結(jié)束標(biāo)志條件也非常重要。按照以上所述的“與0比較”原則，程序中的循環(huán)結(jié)束條件應(yīng)該是“減到0” 的循環(huán)，結(jié)束條件盡量簡(jiǎn)單。應(yīng)盡可能在關(guān)鍵循環(huán)中采取上述的判斷形式，這樣可以在關(guān)鍵循環(huán)中省去一些不必要的比較語句，減少不必要的開銷，提高性能。如下面二個(gè)示例：

fact1 和fact2中通過定義局部變量a來減少對(duì)n的load/store操作。fact2函數(shù)遵循了“與0比較”原則，省去了fact1編譯結(jié)果中的比較指令，并且，變量n在整個(gè)循環(huán)過程不參與運(yùn)算，也不需要保存。由于省去了寄存器分配，從而給其他部分程序的編譯帶來了方便，提高了運(yùn)行效率。

“減到0”的方法同樣適用于while和do語句。如果一個(gè)循環(huán)體只循環(huán)幾次，可以用展開的方法提高運(yùn)行效率。當(dāng)循環(huán)展開后，不需要循環(huán)計(jì)數(shù)器和相關(guān)的跳轉(zhuǎn)語句，雖然代碼的長(zhǎng)度有所增加，但是得到了更高的執(zhí)行效率。

除法和求余

ARM 指令集中沒有提供整數(shù)的除法，除法是由C語言函數(shù)庫中的代碼（符號(hào)型_rt_sdiv和無符號(hào)型的_rt_udiv）實(shí)現(xiàn)的。一個(gè)32位數(shù)的除法需要 20～140個(gè)周期，依賴于分子和分母的取值。除法操作所用的時(shí)間是一個(gè)時(shí)間常量乘每一位除法所需要的時(shí)間：

Time（分子/分母）=C0+C1×log2（分子/分母）

=C0+C1×（log2（分子）-log2（分母））

由于除法的執(zhí)行周期長(zhǎng)，耗費(fèi)的資源多，程序設(shè)計(jì)中應(yīng)當(dāng)盡量避免使用除法。以下是一些避免調(diào)用除法的變通辦法：

（1）在某些特定的程序設(shè)計(jì)時(shí)，可以把除法改寫為乘法。例如：（x/y）>z，在已知y是正數(shù)而且y×z是整數(shù)的情況下，就可以寫為x>（z×y）。

（2）盡可能使用2的次方作為除數(shù)，編譯器使用移位操作完成除法，如128就比100更加適合。在程序設(shè)計(jì)中，使用無符號(hào)型的除法要快于符號(hào)型的除法。

（3）使用求余運(yùn)算的一個(gè)目的是為了按模計(jì)算，這樣的操作有時(shí)可以使用if的判斷語句來完成，考慮如下的應(yīng)用：

uintcounter1（uintcount）uintcounter2（uintcount）

{{return（++count`）；if（++count>=60）}count=0;

return（count）；}

（4）對(duì)于一些特殊的除法和求余運(yùn)算，采用查找表的方法也可以獲得很好的運(yùn)行效果。

在除以某些特定的常數(shù)時(shí)，編寫特定的函數(shù)完成此操作會(huì)比編譯產(chǎn)生的代碼效率高很多。ARM的C語言庫中就有二個(gè)這樣的符號(hào)型和無符號(hào)型數(shù)除以10的函數(shù)，用來完成十進(jìn)制數(shù)的快速運(yùn)算。在toolkit子目錄的examplesexplasmdiv.c和examplesthumbdiv.c文件中，有這二個(gè)函數(shù)的ARM和Thumb版本。

面向ARM的程序優(yōu)化在嵌入式TCP/IP協(xié)議實(shí)現(xiàn)中的應(yīng)用

筆者采用ATMEL公司的AT91RM9200微處理器，配合以太網(wǎng)物理層驅(qū)動(dòng)芯片（DM9161）構(gòu)建面向網(wǎng)絡(luò)的嵌入式系統(tǒng)硬件平臺(tái)，如圖2所示。在此平臺(tái)上，實(shí)現(xiàn)基于ARM微處理器的嵌入式TCP/IP協(xié)議處理。

基于ARM的嵌入式系統(tǒng)直接面向以太網(wǎng)數(shù)據(jù)，典型的以太網(wǎng)數(shù)據(jù)封裝格式如圖3所示。根據(jù)以上的優(yōu)化方法，在變量定義時(shí)需要考慮最佳的存儲(chǔ)器布局，使得各種類型的變量能以32位的空間位基準(zhǔn)對(duì)齊，對(duì)于功能函數(shù)中參加運(yùn)算的數(shù)據(jù)應(yīng)盡量采用32位的數(shù)據(jù)進(jìn)行處理。

嵌入式TCP/IP協(xié)議的實(shí)現(xiàn)通常采用Linux中的TCP/IP網(wǎng)絡(luò)結(jié)構(gòu)層次。TCP/IP協(xié)議實(shí)現(xiàn)網(wǎng)絡(luò)層和控制層的ARP/RARP、IP、ICMP、 TCP、UDP等協(xié)議，直接為HTTP、SMTP、FTP、TELNET等這樣的應(yīng)用層協(xié)議提供支持。每個(gè)系統(tǒng)都需要具體定義應(yīng)用層程序和協(xié)議軟件之間的接口。

協(xié)議處理的一般流程如圖4所示。協(xié)議處理過程中需要多次條件判斷，對(duì)IP地址和TCP數(shù)據(jù)的校驗(yàn)和處理循環(huán)比較是無法避免的，因此可以充分利用“與0比較”的條件判斷和“減到0”的循環(huán)來優(yōu)化程序設(shè)計(jì)。

結(jié)束語

除了以上所述的面向ARM的程序優(yōu)化的原則和方法以外，C語言程序設(shè)計(jì)本身還有很多程序優(yōu)化的方法。在上述基于ARM嵌入式系統(tǒng)硬件平臺(tái)的系統(tǒng)開發(fā)過程中，充分利用面向ARM的C程序優(yōu)化設(shè)計(jì)方法，可將TCP/IP協(xié)議處理模塊的可執(zhí)行代碼減少5%以上，執(zhí)行效率有所提高。實(shí)踐證明，基于ARM的嵌入式系統(tǒng)設(shè)計(jì)中，在透徹了解ARM匯編指令的特性和編譯過程的基礎(chǔ)上，合理地使用程序優(yōu)化的原則和方法可以有效地提高編譯效率和代碼執(zhí)行效率。