當(dāng)前位置:首頁 > 嵌入式 > 嵌入式教程
[導(dǎo)讀]基于ARM的高效C語言編程

  引言

  ARM處理器以其高性能、低功耗、低成本等優(yōu)勢被廣泛應(yīng)用于各種成功的32位嵌入式系統(tǒng)中。提高執(zhí)行速度和減小代碼尺寸是嵌入式軟件設(shè)計的關(guān)鍵需求。盡管大多數(shù)的ARM編譯器和調(diào)試器都帶有性能優(yōu)化工具,但是為了保證其正確性,編譯器必須是穩(wěn)妥和安全的,而且它還受到處理器自身結(jié)構(gòu)的限制。因此,編程人員必須在理解編譯器工作特點的基礎(chǔ)上來實現(xiàn)代碼優(yōu)化。代碼的優(yōu)化方法較多,本文針對函數(shù)優(yōu)化方法進行闡述。

  1  函數(shù)局部變量的數(shù)據(jù)類型

  局部變量包括函數(shù)內(nèi)局部變量、函數(shù)參數(shù)、函數(shù)返回值。由于ARM數(shù)據(jù)操作都是32位,即使數(shù)據(jù)本身只需要8位或16位,對于這三類局部變量也應(yīng)盡可能使用32位的數(shù)據(jù)類型int或lONg,以提高代碼執(zhí)行效率。下面以簡單求和函數(shù)為例進行分析。

  函數(shù)add1計算包含10個字的數(shù)組array的累加和,add2與add1功能相同,只是將函數(shù)add1的參數(shù)array類型改為16位的short,函數(shù)內(nèi)局部變量i類型改為8位的char,sum改為16位的short。add1、add2的C源代碼如下:

  int add1(int *array){

  unsigned int i;

  int sum=0;

  for(i=0;i<10;i++)

  sum=sum+array[i];

  return sum;

  }

  short add2(short *array){

  char i;

  short sum=0;

  for(i=0;i<10;i++)

  sum= sum+array[i];

  return sum;

  }

  add1經(jīng)編譯產(chǎn)生的匯編代碼:

  add1

  mov r2,r0

  mov r0,#0

  mov r1,#0

  add1_loop

  ldr r3,[r2,r1,lsl #2]

  add r1,r1,#1

  cmp r1,#0x0a

  add r0,r3,r0

  bcc add1_loop

  mov pc,r14

  add2經(jīng)編譯產(chǎn)生的匯編代碼:

  add2

  mov r2,r0

  mov r0,#0

  mov r1,#0

  add2_loop[!--empirenews.page--]

  add r3,[r2,r1,lsl #1];增加語句①

  ldrh r3,[r3,#0]

  add r1,r1,#1

  and r1,r1,0xff;增加語句②

  cmp r1,#0x0a

  add r0,r3,r0

  bcc add2_loop

  mov r0,r0,lsl #16;增加語句③

  mov r0,r0,asr #16;增加語句④

  mov pc,r14

  比較add1和add2兩個函數(shù)的匯編代碼,可以發(fā)現(xiàn)add2_loop循環(huán)比add1_loop循環(huán)增加了4條語句。

  語句①:函數(shù)add2中變量sum為16位short類型,ARM指令中l(wèi)drh指令不支持移位地址偏移,因此增加add指令計算數(shù)組下標(biāo)地址。

  語句②:由于函數(shù)add2中循環(huán)變量i為8位的char類型,而ARM處理器的寄存器為32位,此語句用于處理循環(huán)變量累加過程中引起的溢出問題。即:當(dāng)i累加到255時,再加1應(yīng)該為0,而不是256。

  語句③、④:函數(shù)add2中返回結(jié)果sum為short類型,在返回前需將32位寄存器的前16位用符號位填充,即轉(zhuǎn)換為16位short類型。

  2  函數(shù)局部變量的個數(shù)

  為了加快程序的執(zhí)行速度,函數(shù)編譯時應(yīng)盡可能將局部變量都分配在寄存器中。*部變量多于可用的寄存器時,編譯器會將多余的變量壓入堆棧(即存入存儲器中),因此必須控制局部變量的個數(shù)。

  ARM處理器采用RISC結(jié)構(gòu),帶有豐富的內(nèi)部寄存器。在編譯器使用apcs開關(guān)選項,即支持ATPCS(ARMThumb Procedure Call STandard)標(biāo)準時,理論上有14個寄存器(R0~R12,R14)可以用來存放局部變量。但是實際上有些寄存器有自身特殊的用途,例如R9在與讀寫位置無關(guān)(RWPI)的編譯情況下作為靜態(tài)基址寄存器使用,R12作為子程序內(nèi)部調(diào)用的臨時過渡寄存器使用。ATPCS規(guī)則中的寄存器名稱及說明如表1所列。

表1  ATPCS規(guī)則中寄存器說明


  因此,應(yīng)盡量限制局部變量的數(shù)目:①對于函數(shù)的參數(shù)個數(shù)應(yīng)控制在4個以內(nèi),只有R0~R3可用來保存參數(shù),當(dāng)參數(shù)多于4個時將被壓入堆棧。如果由于實際應(yīng)用的需要,參數(shù)多于4個,也可以采用結(jié)構(gòu)體來組織參數(shù),傳遞結(jié)構(gòu)體指針來實現(xiàn)。②函數(shù)內(nèi)部局部變量的個數(shù)應(yīng)控制在12個以內(nèi)(R0~R11),R12~R15都有特定用途。

  3  函數(shù)內(nèi)代碼的編寫

  3.1  循環(huán)代碼的編寫

  循環(huán)的控制條件設(shè)為遞減到零的形式,可以減少指令條數(shù)。以求10個數(shù)的累加和為例進行分析。

  代碼1:

  int sum=0;

  for(int i=0;i<10;i++)

  sum=sum+i;

  代碼2:

  int sum=0;

  for(int i=10;i!=0;i--)

  sum=sum+i;[!--empirenews.page--]

  匯編代碼1:

  mov r0,#0

  mov r1,#0

  add1

  add r1,r1,#1

  cmp r1,#0x0a

  add r0,r1,r0

  bcc add1

  匯編代碼2:

  mov r0,#0

  mov r1,#0x0a

  add2

  subs r1,r1,#1

  add r0,r1,r0

  bne add2

  比較代碼1和代碼2,兩者的功能是相同的,但是代碼2在循環(huán)中少了1條指令。該循環(huán)的執(zhí)行次數(shù)為10次,即在執(zhí)行時共減少了10條指令。

  3.2  內(nèi)聯(lián)函數(shù)的使用

  當(dāng)函數(shù)體代碼較少(通常只有一兩條語句),且又被經(jīng)常調(diào)用時,可將它設(shè)為內(nèi)聯(lián)函數(shù)(inline)。對內(nèi)聯(lián)函數(shù)的調(diào)用類似于宏定義的展開,因此沒有函數(shù)調(diào)用的開銷(即參數(shù)的傳遞和函數(shù)值的返回),只是增加了被調(diào)用函數(shù)的代碼量。

  例如在嵌入式系統(tǒng)中,經(jīng)常訪問的外設(shè)端口的讀寫代碼就可以設(shè)成內(nèi)聯(lián)函數(shù),以提高執(zhí)行效率。外設(shè)寄存器的讀寫函數(shù)如下:

  inline unsigned short reg_read(unsigned short reg){

  return (unsigned short)*(volatile unsigned short *)( reg);//外設(shè)寄存器的讀函數(shù)

  }

  inline void reg_write(unsigned short reg, unsigned short val){

  *(volatile unsigned short *)(reg)=val;//外設(shè)寄存器的寫函數(shù)

  }

  這兩個函數(shù)的共同特點是:函數(shù)體的代碼很少,只有1個語句;使用的局部變量很少,只有1~2個參數(shù)。由于定義為內(nèi)聯(lián)函數(shù),程序的可讀性較好;在執(zhí)行時由于沒有調(diào)用開銷,執(zhí)行效率較高;函數(shù)體很小,在被展開時空間開銷不大。

  結(jié)語

  由于嵌入式系統(tǒng)對存儲空間的限制和實時性的需求,在編寫代碼時必須采用相應(yīng)的方法和原則以減少代碼的空間開銷和時間開銷。代碼優(yōu)化需要花費時間,并且代碼優(yōu)化后將降低源代碼的可讀性。因此,只有對經(jīng)常被調(diào)用且對性能影響較大的函數(shù)進行優(yōu)化,才能最有效地優(yōu)化系統(tǒng)。

 

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉