當(dāng)前位置:首頁 > 嵌入式 > 嵌入式教程
[導(dǎo)讀]本章主要講解C編譯器在代碼優(yōu)化時(shí)遇到的一些問題。要編寫高效的C語言源代碼,必須了解C編譯器對什么形式的代碼有所改動(dòng),編譯器涉及的處理器結(jié)構(gòu)的限制,以及一些特殊的C編譯器的限制。

本章將幫助讀者在ARM處理器上編寫高效的C代碼。本章涉及的一些技術(shù)不僅適用于ARM處理器,也適用于其他RISC處理器。本章首先從ARM編譯器及其優(yōu)化入手,講解C編譯器在優(yōu)化代碼時(shí)所碰到的一些問題。理解這些問題,將有助于編寫出在提高執(zhí)行速度和減少代碼尺寸方面更高效的C源代碼。

本章假定讀者熟悉C語言,并且有一些匯編語言編程方面的知識(shí)。有關(guān)ARM編程的詳細(xì)信息,請參閱本書的相關(guān)章節(jié)。

14.1C編譯器及其優(yōu)化

本章主要講解C編譯器在代碼優(yōu)化時(shí)遇到的一些問題。要編寫高效的C語言源代碼,必須了解C編譯器對什么形式的代碼有所改動(dòng),編譯器涉及的處理器結(jié)構(gòu)的限制,以及一些特殊的C編譯器的限制。

14.1.1為編譯器選擇處理器結(jié)構(gòu)

在編譯C源文件時(shí),必須為編譯器指定正確的處理器類型。這樣可以使編譯的代碼最大限度地利用處理器的硬件結(jié)構(gòu),如對半字加載(HalfwordLoad)、存儲(chǔ)指令(StoreInstructions)和指令調(diào)度(InstructionScheduling)的支持。所以編譯程序時(shí),應(yīng)該盡量準(zhǔn)確地告訴編譯器該代碼是運(yùn)行在什么類型的處理器上。有些處理器類型編譯器是不能直接支持,如SA-1100,這時(shí)可以使用與該類型處理器為同一指令集的基本處理器,比如對于SA-100,可以使用StrongARM。

注意

指定目標(biāo)處理器可能使代碼與其他ARM處理器不兼容。例如,編譯時(shí)指定了ARMv6體系結(jié)構(gòu)的代碼,可能不能運(yùn)行在ARM920T的處理器上(如果代碼中使用了ARMv6體系結(jié)構(gòu)中特有的指令)。

選擇處理器類型可以使用--cpuname編譯選項(xiàng)。該選項(xiàng)生成用于特定ARM處理器或體系結(jié)構(gòu)的代碼。

如果name是處理器名稱。

·輸入名稱必須和ARM數(shù)據(jù)表中所示嚴(yán)格一致,例如ARM7TDMI。該選項(xiàng)不接受通配符字符。有效值是任何ARM6或更高版本的ARM處理器。

·選擇處理器操作會(huì)選擇適當(dāng)?shù)捏w系結(jié)構(gòu)、浮點(diǎn)單元(FPU)以及存儲(chǔ)結(jié)構(gòu)。

·某些--cpu選擇暗含--fpu選擇。例如,當(dāng)使用--arm選項(xiàng)編譯時(shí),--cpuARM1136JF-S暗含--fpuvfpv2。隱式FPU只覆蓋命令行上出現(xiàn)在--cpu選項(xiàng)前面的顯式--fpu選項(xiàng)。如果沒有指定--fpu選項(xiàng)和--cpu選項(xiàng),則使用--fpusoftvfp。

14.1.2調(diào)試選項(xiàng)

如果在編譯C源程序時(shí),設(shè)置了調(diào)試選項(xiàng),這將很大程度地影響最終代碼的大小和執(zhí)行效率。因?yàn)閹д{(diào)試信息的代碼映像,為了能夠在調(diào)試程序時(shí)正確地顯示變量或設(shè)置斷點(diǎn),包含很多冗余的代碼和數(shù)據(jù)。所以如果想最大限度地提供程序執(zhí)行效率、減少代碼尺寸,就要在編譯源文件時(shí),去除編譯器的調(diào)試選項(xiàng)。

以下選項(xiàng)指定調(diào)試表生成方法。

·-g(--debug):該選項(xiàng)啟用生成當(dāng)前編譯的調(diào)試表。無論是否使用-g選項(xiàng),編譯器都生成的代碼是相同的。惟一差別是調(diào)試表的存在與否。編譯器是否對代碼進(jìn)行優(yōu)化是由-O選項(xiàng)指定調(diào)的。默認(rèn)情況下,使用-g選項(xiàng)等價(jià)于使用:-g-dwarf2--debug_macros。

注意

編譯程序時(shí),只使用-g選項(xiàng)而沒有使用優(yōu)化選項(xiàng),編譯器會(huì)提示警告信息。

·--no_debug:該選項(xiàng)禁止生成當(dāng)前編譯的調(diào)試表。這是默認(rèn)選項(xiàng)。

·--no_debug_macros:當(dāng)與-g一起使用時(shí),該選項(xiàng)禁止生成預(yù)處理程序宏定義的調(diào)試表?xiàng)l目(Entry)。這會(huì)減小調(diào)試映像的大小。-gt-p是-gtp的同義字。

--debug_macros當(dāng)與-g一起使用時(shí),該選項(xiàng)啟用生成預(yù)處理程序宏定義的調(diào)試表?xiàng)l目。這是默認(rèn)選項(xiàng),會(huì)增加調(diào)試映像的大小。一些調(diào)試程序忽略預(yù)處理程序條目。

14.1.3優(yōu)化選項(xiàng)

使用-Onum選擇編譯器的優(yōu)化級別。優(yōu)化級別分別為。

·-O0:除一些簡單的代碼編號之外,關(guān)閉所有優(yōu)化。使用該編譯選項(xiàng)可以提供最直接的優(yōu)化信息。

·-O1:關(guān)閉嚴(yán)重影響調(diào)試效果的優(yōu)化功能。使用該編譯選項(xiàng),編譯器會(huì)移除程序中未使用到的內(nèi)聯(lián)函數(shù)和靜態(tài)函數(shù)。如果與--debug一起使用,該選項(xiàng)可以在較好的代碼密度下,給出最佳調(diào)試視圖。

·-O2:生成充分優(yōu)化代碼。如果與--debug一起使用,調(diào)試效果可能不令人滿意,因?yàn)槟繕?biāo)代碼到源代碼的映射可能因?yàn)榇a優(yōu)化而發(fā)生變化。

如果不生成調(diào)試表,這是默認(rèn)優(yōu)化級別。

·-O3:最高優(yōu)化級別。使用該優(yōu)化級別,使生成的代碼在時(shí)間和空間上尋求平衡。該選項(xiàng)常和-Ospace和-Otime配合使用。

·-O3–Otime:使用該選項(xiàng)編譯的代碼比-O2–Otime選項(xiàng)編譯的代碼,在執(zhí)行速度上要快,但占用的空間也更大。

·-O3-Ospace:產(chǎn)生的代碼比使用-O2-Ospace選項(xiàng)產(chǎn)生的代碼尺寸小,但執(zhí)行效率可能會(huì)差。

如果要使編譯的代碼更側(cè)重于代碼的尺寸或執(zhí)行效率(兩者往往不可兼得),可以使用下面的編譯選項(xiàng)。

·-Ospace:指示編譯程序執(zhí)行優(yōu)化,以延長執(zhí)行時(shí)間為代價(jià)減小映像大小。例如,由外部函數(shù)調(diào)用代替內(nèi)聯(lián)函數(shù)。如果代碼大小比性能更重要,則使用該選項(xiàng)。這是編譯器的默認(rèn)設(shè)置。

·-Otime:指示編譯程序執(zhí)行優(yōu)化,以增大映像大小為代價(jià)縮短執(zhí)行時(shí)間。如果執(zhí)行時(shí)間比代碼大小更重要,則使用該選項(xiàng)。例如,它編譯:

while(expression)body;

為:

if(expression){

dobody;

while(expression);

}

如果既不指定-Otime也不指定-Ospace,則編譯器默認(rèn)使用-Ospace。可使用-Otime編譯代碼中對時(shí)間要求嚴(yán)格的部分,使用-Ospace編譯其余部分。但不能在同一編譯程序調(diào)用中同時(shí)指定-Otime和-Ospace。

14.1.4AAPCS選項(xiàng)

ARM結(jié)構(gòu)過程調(diào)用標(biāo)準(zhǔn)AAPCS(ProcedureCallStandardfortheARMArchitecture)是ARM體系結(jié)構(gòu)二進(jìn)制接口ABI(ApplicationBinaryInterfacefortheARMArchitecture【BSABI】)標(biāo)準(zhǔn)的一部分。使用該標(biāo)準(zhǔn)可以很方便的執(zhí)行C和匯編語言的相互調(diào)用。

編譯程序時(shí),使用--apcs選項(xiàng)可以指定所使用得AAPCS標(biāo)準(zhǔn)的版本。如果沒有指定--apcs或--cpu選項(xiàng),則編譯器使用下面默認(rèn)編譯選項(xiàng)。

--apcs/noswst/nointer/noropi/norwpi--cpuARM7TDMI--fpusoftvfp

有關(guān)AAPCS的詳細(xì)信息,請參加ARM相關(guān)文檔。

14.1.5編譯選項(xiàng)對代碼生成影響示例

本節(jié)舉例說明編譯器的優(yōu)化選項(xiàng)如何影響代碼生成。

1.使用-O0選項(xiàng)

下面的例子顯示了即使使用-O0編譯選項(xiàng)對代碼進(jìn)行編譯時(shí),有些冗余代碼還是會(huì)被編譯器自動(dòng)清除。

intf(int*p)

{

return(*p==*p);

}

使用armcc-c-O0對源程序進(jìn)行編譯,生成的匯編代碼如下所示。

f

MOVr1,r0

MOVr0,#1

MOVpc,lr

通過上面的例子可以看到,編譯出的最終代碼中沒有加載(Load)指針P的值,變量*p被編譯器優(yōu)化掉了。如果不想讓編譯器對變量*p做優(yōu)化,可以使用“volatile”對變量進(jìn)行聲明。下面的例子,顯示了將變量聲明為“volatile”類型后,使用armcc編譯(-O2的優(yōu)化級別)后的結(jié)果。

f

LDRr1,[r0]

LDRr0,[r0]

CMPr1,r0

MOVNEr0,#0

MOVEQr0,#1

MOVpc,lr

另外,編譯的代碼中的“MOVr1,r0”并沒有實(shí)際意義,只是為了方便調(diào)試程序時(shí)設(shè)置斷點(diǎn)使用。

2.冗余代碼的清除

下面例子顯示了一段急待優(yōu)化的代碼。

intdummy()

{

inta=10,b=20;

intc;

c=a+b;

return0;

}

當(dāng)使用arm–c–O0進(jìn)行編譯時(shí),產(chǎn)生的匯編碼如下所示。

dummy:

0000807CE3A0100AMOV r1,#0xa

>>>REDUNDANT\#3inta=10,b=20;

00008080E3A02014MOV r2,#0x14

>>>REDUNDANT\#5c=a+b;

00008084E0813002ADD r3,r1,r2

>>>REDUNDANT\#6return0;

00008088E3A00000MOV r0,#0

>>>REDUNDANT\#7}

0000808CE12FFF1EBX r14

從上面的匯編輸出可以看到,編譯器并沒有對程序中的冗余變量做任何工作。但上面這段代碼在編譯時(shí),編譯器會(huì)給出警告,警告信息如下所示。

Warning:#550-D:variable"c"wassetbutneverused

Redundant.cline4intc;

但如果將編譯器的優(yōu)化級別提高,如使用arm–c–O1命令,則編譯器輸出的匯編代碼如下所示。

dummy:

0000807CE3A00000MOVr0,#0

>>>REDUNDANT\#7}

00008080E12FFF1EBXr14

從上面的例子看出,當(dāng)優(yōu)化級別提高到-O1時(shí),程序中的冗余變量就會(huì)被清除。

3.指令重排

當(dāng)指定編譯器對程序代碼進(jìn)行優(yōu)化時(shí),編譯器會(huì)對程序中排列不合理的匯編指令序列進(jìn)行重排(只有在-O1及其以上的優(yōu)化級別中才有),重排的目的是為了減少指令互鎖(interload)。所謂互鎖就是指如果一條指令需要前一條指令的執(zhí)行結(jié)果,而這時(shí)結(jié)果還沒有出來,那么處理器就會(huì)等待。這被稱為流水線冒險(xiǎn)(pipelinehazard),也被稱為流水線互鎖。

下面例子顯示了對同一程序使用代碼重排和不使用代碼重排所產(chǎn)生的匯編碼的區(qū)別。÷

程序的源代碼如下所示。

intf(int*p,intx)

{return*p+x*3;}

使用-O0選項(xiàng)對代碼進(jìn)行編譯(無代碼重排),產(chǎn)生的結(jié)果如下所示。

ADDr1,r1,r1,LSL#1

LDRr0,[r0,#0]

ADDr0,r0,r1 ;ARM9上產(chǎn)生互鎖

MOVpc,lr

使用-O1選項(xiàng)對代碼進(jìn)行編譯(存在代碼重排),產(chǎn)生的結(jié)果如下所示。

ADDr1,r1,r1,LSL#1

ADDr0,r0,r1

MOVpc,lr

指令重排發(fā)生在寄存器定位和代碼產(chǎn)生階段。代碼重排只對ARM9及其以后的處理器版本產(chǎn)生作用。當(dāng)使用代碼重排時(shí),代碼的執(zhí)行速度平均提供4%??梢允褂?zpno_optimize_
scheduling編譯選項(xiàng)關(guān)閉代碼重排。

4.內(nèi)嵌函數(shù)

通常情況下,如果不指定編譯選項(xiàng),編譯器會(huì)將一些代碼量小且調(diào)用次數(shù)少的函數(shù)內(nèi)嵌進(jìn)調(diào)用函數(shù)中。如果某段子程序在其他模塊中沒有被調(diào)用,請使用Static關(guān)鍵字將其標(biāo)識(shí)。

編譯選項(xiàng)的--autoinline和--no_autoinline可以作為內(nèi)嵌函數(shù)的使能開關(guān)。--no_autoinline選項(xiàng)為-O0和-O1選項(xiàng)的默認(rèn)選項(xiàng),但如果指定-O2或-O3的優(yōu)化選項(xiàng),編譯器將默認(rèn)使用--autoinline選項(xiàng)。

有關(guān)內(nèi)嵌函數(shù)的詳細(xì)信息,請參見本書內(nèi)嵌函數(shù)一節(jié)。

下面的例子顯示了同一段程序,使用內(nèi)嵌功能和不使用內(nèi)嵌功能編譯出的不同結(jié)果。

要編譯的源文件如下。

intbar(inta)

{

a=a+5;

returna;

}

intfoo(inti)

{

i=bar(i);

i=i-2;

i=bar(i);

i++;

returni;

}

下面的匯編程序?yàn)椴皇褂脙?nèi)嵌功能時(shí)編譯出的結(jié)果。

bar

ADDr0,r0,#5

MOVpc,lr

foo

STRlr,[sp,#-4]!

BLbar

SUBr0,r0,#2

BLbar

ADDr0,r0,#1

LDRpc,[sp],#4

下面的匯編碼是使用內(nèi)嵌功能時(shí)編譯出的結(jié)果。

foo

ADDr0,r0,#5

SUBr0,r0,#2

ADDr0,r0,#5

ADDr0,r0,#1

MOVpc,lr

從上面的例子可以看出在使用內(nèi)嵌功能時(shí),函數(shù)間的相互調(diào)用減少了數(shù)據(jù)的壓棧和出棧,節(jié)省了程序的執(zhí)行時(shí)間,但如果內(nèi)嵌函數(shù)被調(diào)用多次會(huì)造成空間的浪費(fèi)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉