arm匯編部分: a. 條件執(zhí)行 cmp r0,#5 beq bypass add r1,r1,r0 sub r1,r1,r2 bypass ...... 可以替代為: cmp r0,#5 addne r1,r1,r0 subne r1,r1,r2 ...... 如果被跳過的指令序列并不進(jìn)行復(fù)雜的操作,使用條件執(zhí)行都要比使用轉(zhuǎn)移好,因為arm轉(zhuǎn)義指令一般要用3個周期來執(zhí)行。 對于以下的條件執(zhí)行可以這樣來寫匯編: ; if ( (a = = b) && (c = = d) ) e++ cmp r0,r1 cmpeq r2,r3 addeq r4,r4,#1 c語言部分: a. 很多人認(rèn)為以下兩種變量定義空間效率一樣的:① char a;short b;char c;int d;② char a;char b;short c;int d; 其實不然,定義次序的不同導(dǎo)致最終映像中不同的數(shù)據(jù)布局,實際中第二種定義方式能夠節(jié)約更多的存儲空間,所以在變量聲名時,最好把所有相同類型的變量放在一起定義,這樣可以優(yōu)化存儲器布局?! . 我們總是設(shè)法使用short或者char來定義變量,認(rèn)為這樣能夠節(jié)省存儲空間,但也有例外,我們先來看下這幾段c代碼及其相應(yīng)的匯編: ?、?c代碼:int addition(int a) { return a+1; } 匯編: add a1,a1,#1 ② c代碼: short addition(short a){ return a+1; } 匯編:add a1,a1,#1mov a1,a1,lsl #16mov a1,a1,asr #16mov pc,lr ?、?c代碼: char addition(char a){ return a+1; } 匯編:add a1,a1,#1and a1,a1,# &ffmov pc,lr 因為char 類型、short類型分別是8位、16位,完成加法操作后,需要在32位的寄存器中進(jìn)行符號擴(kuò)展,所以使用32位的int以及unsinged int做加法效率最高。 c.冗余變量要消耗空間,許多人都不贊同使用它,但是下面這種情況就不同了。int m ( void ); int n ( void ); int fg; ① void func_1 ( void ){ fg += m ( );fg += n ( );} ?、?void func_2 ( void ) { int tmp = fg; tmp += m ( ); tmp += n ( ); fg = tmp;} 在func_1 ( ) 中每次對全局變量fg的加法操作都需要從存儲器load到寄存器里,加完數(shù)據(jù)后還要store回原來的存儲器,所以這個函數(shù)就進(jìn)行了兩次load和兩次store操作。在func_2 ( ) 中,tmp作為局部變量,系統(tǒng)為其分配一寄存器,首先執(zhí)行一次load操作后,由tmp進(jìn)行加法,最后只需一次store操作把結(jié)果送給fg,節(jié)省了很多時間,畢竟讀/寫存儲器的時間耗費要比讀/寫寄存器高得多?! .關(guān)于計數(shù)循環(huán)的問題,一般我們都會使用累加計數(shù)的方式,遞減計數(shù)用得比較少,雖然從c代碼上看累加和遞減兩種方式時間復(fù)雜度相同,但是在對時間要求嚴(yán)格的嵌入式領(lǐng)域,這兩者執(zhí)行時間還是有差別的?! 、?累加計數(shù)方式: for ( i = 1; i < times; i ++ ) { tmp = tmp * i ;} 匯編:……0x06: mul r2,r1,r20x10: add r1,r1,#10x14: cmp r2,r00x18: ble 0x06…… ?、?遞減計數(shù)方式: for ( i = times; i > 1; i -- ) { tmp = tmp * i ;} 匯編:……0x06: mul r0,r1,r00x10: sub r1,r1,#10x14: bne 0x06 …… 從上面的匯編可以看出,累加計數(shù)需要用到專門的cmp指令來判斷條件,而遞減計數(shù)只需要利用條件執(zhí)行的ne進(jìn)行判別,當(dāng)循環(huán)次數(shù)的量很大的話時間效率就有差別了。