ARM嵌入式軟件編程經(jīng)驗(yàn)談

時(shí)間：2012-08-25 03:10:28

關(guān)鍵字：嵌入式軟件軟件編程 ARM嵌入式 AI

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]ARM嵌入式軟件編程經(jīng)驗(yàn)談

ARM 系列處理器是 RISC (Reducded InSTructiON Set Computing)處理器。很多基于ARM的高效代碼的程序設(shè)計(jì)策略都源于RISC 處理器。和很多 RISC 處理器一樣，ARM 系列處理器的內(nèi)存訪問(wèn)，也要求數(shù)據(jù)對(duì)齊，即存取“字(Word)”數(shù)據(jù)時(shí)要求四字節(jié)對(duì)齊，地址的bits[1：0]==0b00;存取“半字(Halfwords)”時(shí)要求兩字節(jié)對(duì)齊，地址的bit[0]==0b0;存取“字節(jié)(Byte)”數(shù)據(jù)時(shí)要求該數(shù)據(jù)按其自然尺寸邊界(Natural Size Boundary)定位。

ARM 編譯程序通常將全局變量對(duì)齊到自然尺寸邊界上，以便通過(guò)使用 LDR和 STR 指令有效地存取這些變量。這種內(nèi)存訪問(wèn)方式與多數(shù) CISC (Complex Instruction Set Computing)體系結(jié)構(gòu)不同，在CISC體系結(jié)構(gòu)下，指令直接存取未對(duì)齊的數(shù)據(jù)。因而，當(dāng)需要將代碼從CISC 體系結(jié)構(gòu)向 ARM 處理器移植時(shí)，內(nèi)存訪問(wèn)的地址對(duì)齊問(wèn)題必須予以注意。在RISC體系結(jié)構(gòu)下，存取未對(duì)齊數(shù)據(jù)無(wú)論在代碼尺寸或是程序執(zhí)行效率上，都將付出非常大的代價(jià)。

本文將從以下幾個(gè)方面討論在ARM體系結(jié)構(gòu)下的程序設(shè)計(jì)問(wèn)題。

未對(duì)齊的數(shù)據(jù)指針

C和C++編程標(biāo)準(zhǔn)規(guī)定，指向某一數(shù)據(jù)類型的指針，必須和該類型的數(shù)據(jù)地址對(duì)齊方式一致，所以ARM 編譯器期望程序中的 C 指針指向存儲(chǔ)器中字對(duì)齊地址，因?yàn)檫@可使編譯器生成更高效的代碼。

比如，如果定義一個(gè)指向 int 數(shù)據(jù)類型的指針，用該指針讀取一個(gè)字，ARM 編譯器將使用LDR 指令來(lái)完成此操作。如果讀取的地址為四的倍數(shù)(即在一個(gè)字的邊界)即能正確讀取。但是，如果該地址不是四的倍數(shù)，那么，一條 LDR 指令返回一個(gè)循環(huán)移位結(jié)果，而不是執(zhí)行真正的未對(duì)齊字載入。循環(huán)移位結(jié)果取決于該地址向?qū)τ谧值倪吔绲钠屏亢拖到y(tǒng)所使用的端序(Endianness)。例如，如果代碼要求從指針指向的地址 0x8006 載入數(shù)據(jù)，即要載入 0x8006、0x8007、0x8008 和 0x8009 四字節(jié)的內(nèi)容。但是，在 ARM 處理器上，這個(gè)存取操作載入了0x8004、0x8005、0x8006 和 0x8007 字節(jié)的內(nèi)容。這就是在未對(duì)齊的地址上使用指針存取所得到的循環(huán)移位結(jié)果。

因而，如果想將指針定義到一個(gè)指定地址(即該地址為非自然邊界對(duì)齊)，那么在定義該指針時(shí)，必須使用 __packed 限定符來(lái)定義指針：例如，

__packed int *pi; // 指針指向一個(gè)非字對(duì)其內(nèi)存地址

使用了_packed限定符限定之后，ARM 編譯器將產(chǎn)生字節(jié)存取命令(LDRB或STRB指令)來(lái)存取內(nèi)存，這樣就不必考慮指針對(duì)齊問(wèn)題。所生成的代碼是字節(jié)存取的一個(gè)序列，或者取決于編譯選項(xiàng)、跟變量對(duì)齊相關(guān)的移位和屏蔽。但這會(huì)導(dǎo)致系統(tǒng)性能和代碼密度的損失。

值得注意的是，不能使用 __packed 限定的指針來(lái)存取存儲(chǔ)器映射的外圍寄存器，因?yàn)?ARM 編譯程序可使用多個(gè)存儲(chǔ)器存取來(lái)獲取數(shù)據(jù)。因而，可能對(duì)實(shí)際存取地址附近的位置進(jìn)行存取，而這些附近的位置可能對(duì)應(yīng)于其它外部寄存器。當(dāng)使用了位字段(Bitfield)時(shí)， ARM 程序?qū)⒃L問(wèn)整個(gè)結(jié)構(gòu)體，而非指定字段。

編譯器的缺省行為

多數(shù)嵌入式應(yīng)用程序最初都是在原型環(huán)境下開(kāi)發(fā)的。無(wú)論什么樣的原型環(huán)境的資源與最終產(chǎn)品環(huán)境都是有差異的。因此，考慮如何將嵌入式應(yīng)用程序從其所依賴的開(kāi)發(fā)工具或調(diào)試環(huán)境中移植到在目標(biāo)硬件上獨(dú)立運(yùn)行是非常重要的。

開(kāi)始編寫(xiě)嵌入式應(yīng)用程序時(shí)，開(kāi)發(fā)者可能并不清楚目標(biāo)硬件的具體規(guī)格。如，目標(biāo)系統(tǒng)使用了什么樣的外圍設(shè)備、存儲(chǔ)器映射情況甚至不能確定處理器的型號(hào)。為在了解這些詳細(xì)信息前能夠繼續(xù)軟件的開(kāi)發(fā)，RVCT 工具提供了很多默認(rèn)的操作，使用戶能編譯和調(diào)試與目標(biāo)系統(tǒng)無(wú)關(guān)的應(yīng)用程序代碼。下面詳細(xì)介紹介紹這些編譯選項(xiàng)，只有深入了解這些編譯選項(xiàng)設(shè)置，才能使開(kāi)發(fā)更順利的進(jìn)行。

調(diào)整 C 庫(kù)使其適應(yīng)目標(biāo)硬件

默認(rèn)情況下，C 庫(kù)利用semihostig機(jī)制來(lái)提供設(shè)備驅(qū)動(dòng)級(jí)的功能，使得主機(jī)主機(jī)能夠用作輸入和輸出設(shè)備。這種機(jī)制對(duì)于嵌入式開(kāi)發(fā)十分有用，因?yàn)橛糜陂_(kāi)發(fā)的硬件系統(tǒng)通常沒(méi)有最終系統(tǒng)的輸入和輸出設(shè)備。

最簡(jiǎn)單的函數(shù)重定向的例子就是用戶希望fputc()函數(shù)能夠?qū)⒆址麖哪繕?biāo)系統(tǒng)的串口輸出而不是在調(diào)試時(shí)，將字符從調(diào)試器的控制臺(tái)輸出。這時(shí)就需要重新實(shí)現(xiàn)該函數(shù)。下面的例子將fputc() 的輸入字符參數(shù)重新指向一連續(xù)輸出函數(shù) sendchar()，將定該例在一個(gè)獨(dú)立的源文件中實(shí)現(xiàn)的。這樣，fputc() 在依目標(biāo)而定的輸出和 C 庫(kù)標(biāo)準(zhǔn)輸出函數(shù)之間充當(dāng)一個(gè)抽象層。

圖1 C庫(kù)函數(shù)重定向

例子程序的代碼如下所示。

extern void sendchar(char *ch);

int fputc(int ch, FILE *f)

{?? /* e.g. write a character to an UART */

char tempch = ch;

sendchar(&tempch);

return ch;

}

映象文件存儲(chǔ)器映射調(diào)整

映像由域(Regions)和輸出段(Output Sections)組成。每個(gè)域可以有不同的加載地址和執(zhí)行地址。

分散加載可以更加方便準(zhǔn)確的指定映像存儲(chǔ)器映射，為映像組件分組和布局提供了全面控制。它能夠描述由載入時(shí)和執(zhí)行時(shí)分散在存儲(chǔ)器映射中的多個(gè)區(qū)組成的復(fù)雜映像映射。雖然，分散加載可以用于簡(jiǎn)單映像，但它通常僅用于具有復(fù)雜存儲(chǔ)器映射的映像。

要構(gòu)建映像的存儲(chǔ)器映射，必須向armlink 提供以下信息：

·? 分組信息? 決定如何將各輸入段組織成相應(yīng)的輸出段和域;

·? 定位信息? 決定各域在存儲(chǔ)空間的起始地址。

有兩種方法可以實(shí)現(xiàn)指定映像文件的分組和定位信息：如果映像文件中地址映射關(guān)系比較簡(jiǎn)單，可以使用命令行選項(xiàng);如果映像文件中地址映射關(guān)系比較復(fù)雜的情況，可以使用一個(gè)配置文件。使用該配置文件可以高速鏈接器相關(guān)的地址映射關(guān)系。配置文件又叫Scatter文件，是一個(gè)文本文件，通過(guò)下面的鏈接選項(xiàng)來(lái)實(shí)現(xiàn)。

-scatter? filename

復(fù)位和初始化

ARM嵌入式系統(tǒng)的初始化序列如圖2所示。系統(tǒng)啟動(dòng)時(shí)立即執(zhí)行復(fù)位處理程序，然后進(jìn)入$Sub$main()的代碼執(zhí)行。

復(fù)位處理程序是用匯編語(yǔ)言編寫(xiě)的代碼塊，它在系統(tǒng)復(fù)位時(shí)執(zhí)行，完成系統(tǒng)必須初始化操作。對(duì)于具有局部存儲(chǔ)器的內(nèi)核，如Caches、緊密藕荷存儲(chǔ)器 (TCM)、存儲(chǔ)管理單元 (MMU) 和存儲(chǔ)器保護(hù)單元 (MPU) 等，在初始化過(guò)程這一階段完成必要的配置。復(fù)位處理程序在執(zhí)行之后，通常跳轉(zhuǎn)到 __main 以開(kāi)始 C 庫(kù)的初始化序列。

一般情況下，系統(tǒng)初始化代碼和主應(yīng)用程序是分開(kāi)的。系統(tǒng)初始化要在主應(yīng)用程序啟動(dòng)前完成。但部分與硬件相關(guān)的系統(tǒng)初始化過(guò)程，如啟用Cache和中斷，必須在C庫(kù)初始化代碼執(zhí)行完成后才能執(zhí)行。

為了在進(jìn)入主應(yīng)用程序之前，完成系統(tǒng)初始化，可以使用$sub和$super函數(shù)標(biāo)識(shí)符在進(jìn)入主程序之前插入一個(gè)例程。這一機(jī)制可以在不改變?cè)创a的情況下擴(kuò)展函數(shù)的功能。

下面的例子說(shuō)明了如何使用$sub和$super函數(shù)標(biāo)識(shí)。鏈接程序通過(guò)調(diào)用$sub$$main()函數(shù)取代對(duì)main()的調(diào)用。所以用戶可以在自己編寫(xiě)的$sub$$main()例程中啟用Cache或使能中斷。

extern void $Super$$main(void);

void $Sub$$main(void)

{

cache_enable();??? // enables caches

int_enable();????? // enables interrupts

$Super$$main();??? // calls original main()

}

在$Sub$$main(void)函數(shù)中，鏈接程序通過(guò)調(diào)用$Super$$main()，是代碼跳轉(zhuǎn)到實(shí)際的main()函數(shù)。

在完成硬件初始化之后，必須考慮主應(yīng)用程序運(yùn)行在何種模式。如果應(yīng)用程序運(yùn)行在特權(quán)模式(Privileged mode)，只需在退出復(fù)位處理程序前切換到適當(dāng)?shù)哪Ｊ?如果應(yīng)用程序運(yùn)行在用戶模式下，要在完成系統(tǒng)初始化之后，再切換到用戶模式。模式的切換工作，一般在$Sub$$main(void)函數(shù)中完成。

圖2 ARM嵌入式系統(tǒng)的初始化序列