燕雙鷹終于輸了,輸在碼農(nóng)做的子彈有BUG,俄羅斯轉(zhuǎn)輪有風險|布爾表達式和布爾類型
上一篇文章《C語言bool占用4個字節(jié)?匯編之下無秘密|帶你看extern》分析在C99標準下bool類型占用1Byte,而不是1bit,C語言 不存在內(nèi)存長度小于8bit的數(shù)據(jù)類型,思考:
1、如果bool類型高7bit不是0,使用bool類型是否出現(xiàn)匪夷所思的結(jié)果?
2、執(zhí)行if判斷bool類型時,它判斷的是所有8比特?還是最低比特?
接下來我分享一個奇特的案例現(xiàn)象,并在從反匯編角度去解釋現(xiàn)象產(chǎn)生原因。
1. 俄羅斯轉(zhuǎn)輪
玩?zhèn)€勇敢者的賭槍游戲——俄羅斯轉(zhuǎn)輪。
左輪手槍彈槽篩入一顆子彈,快速旋轉(zhuǎn)彈槽,合上彈槽,朝著對方腦袋開槍,活下來的勝利。接下來友請賭槍游戲必勝客“燕雙鷹”。
燕雙鷹:“我有個習慣,會殺死向自己開槍的人,哪怕他的槍里沒有子彈……”
我:“等等燕大俠,沒搶、沒搶。解放了70年咯,1966年在大會堂玻璃被子彈擊穿事件后,周總理就下達指令全民禁槍、民眾自愿上繳槍械。”
燕雙鷹:“那為什么請我出場?”
我:“21世紀國家科研、資本家壓榨都講成本,沒有槍械,可以模擬呀。自動駕駛不一定都需要先造車再去馬路上跑,完全能建立3D場景,在游戲虛擬環(huán)境下訓練自動駕駛算法。同樣賭槍游戲也能模擬。
“子彈放在8bit寄存器里,寄存器相當于彈槽,最低比特相當于蓄勢待發(fā)的子彈。下面是游戲的源代碼?!?/span>
傳入0:表示搶里沒有子彈。
傳入1:表示子彈在第1激發(fā)位置。
傳入2:表示子彈在第2激發(fā)位置。
傳入4:表示子彈在第3激發(fā)位置。
燕雙鷹:“明白,來~咱們弄點刺激的,隨機放入2顆子彈如何,編劇從來沒允許我在賭搶上輸過?!?/span>
我:“大俠且慢,暖男郭先生說沖動是魔鬼,咱們1顆子彈試試水。”
篩入1顆子彈,子彈落入第2激發(fā)位置,扣動扳機,屏幕上顯示“false:燕雙鷹贏”。燕雙鷹臉上漏出招牌式微笑。
下一刻屏幕緊跟著輸出“true:Bang 燕雙鷹你輸了”,燕雙鷹眉頭顯出深深的“川”字紋。
各位看官,你能想到燕雙鷹中彈原因嗎?當然,如果你能保證絕對不會往布爾類型傳遞0/1以外的值,本文不用繼續(xù)往下讀。
all: @gcc bool-char.c -g @objdump a.out -S > a.dis @./a.out 0 @./a.out 1 @./a.out 2 @./a.out 3
2. 匯編解釋
接下來解釋燕雙鷹為什么會輸。
同樣的代碼在x86、ARM、mips架構(gòu)下用gcc編譯,執(zhí)行結(jié)果都一樣,至于匯編我只解釋x86架構(gòu)下的指令。
兩條件表達式的匯編都差不多,唯一區(qū)別是第一條多一個異或指令。
movzbl -0x9(%rbp),%eax:以4Byte方式載入數(shù)據(jù)到eax寄存器,eax是32bit寄存器,eax存儲的是彈槽子彈位置。
test %al, %al:al寄存器的值和它自己“與”操作,al是eax的低8bit寄存器。只要al寄存器8bit不全為0,則返回真。
test指令和and指令都是執(zhí)行“與”操作,不過test指令會影響3個標志位:SF(執(zhí)行后數(shù)據(jù)的正負)、ZF(執(zhí)行后結(jié)果是否為0)、PF(執(zhí)行后二進制1的個數(shù)是否為偶數(shù)),and指令不會修改他們, 本文關注的是ZF標志位。
xor $0x1,%eax:僅對eax寄存器的最低比特執(zhí)行異或。
C代碼“if(!a)”的感嘆號“!”被編譯器翻譯成xor和test的組合。注意到了嗎,只要eax不是0或1,兩條指令都會執(zhí)行。
2.1. 執(zhí)行if(!a)
如果eax=0x00,則xor結(jié)果eax=0x01;test返回真
如果eax=0x01,則xor結(jié)果eax=0x00;test返回假
如果eax=0x02,則xor結(jié)果eax=0x03;test返回真
2.2. 執(zhí)行if(a)
如果eax=0x00,test返回假
如果eax=0x01,test返回真
如果eax=0x02,test返回真
3. 小白才寫得出的代碼
看官或許會想:“正常情況誰會這么寫例子上的垃圾代碼,往bool傳遞0/1以外的數(shù)據(jù),八成是作者為了水文章瞎弄文案?!?/span>
“No No No?!?/span>
6年前我曾今寫過一個C函數(shù),函數(shù)需要傳遞bool類型“指針”。在同事眼里:“布爾類型嘛,懂~,老熟人咯?!?/span>
于是,他強制轉(zhuǎn)換char為bool,向我的函數(shù)傳遞變量指針。
絕大多數(shù)C語言學習者的實操平臺要么是Keil C51、要么是Trubo C,兩個編譯環(huán)境都使用C89標準,按照C89的套路,bool類型通常都是重新定義char得來(typedef char bool),殊不知bool類型已經(jīng)被C99正式收編,GCC也給它名份,成了C語言家族的第9房小妾(其他妻妾包括char、short、int、long、float、double、void、指針)。
void fun(bool *a){ if (!*a) { printf("false\r\n"); } if (*a) { printf("true\r\n"); }}int main(int argc, char **argv) { char in = 2; fun((bool*)&in); return 0;}
若同事規(guī)規(guī)矩矩的向布爾類型賦值0(false)或1(true)還好,可誰曾想到他某次傳遞一個2進去,一個表達式憑什么既可能是true、也同時是false呢?
$ ./a.out falsetrue
猜測同事把布爾類型和布爾表達式搞混了:
布爾類型:只觀察最低比特。
布爾表達式:非0即是真。
4. 指令修改
從匯編角度來說,如果“test %al, %al”能改成“test %0x1, %al”就沒有匪夷所思的問題了,如此一來應該會降低CPU的效率,畢竟執(zhí)行指令還需要一個立即數(shù),我沒搞過編譯器也沒設計過CPU,純屬瞎猜,能搞編譯器的家伙都是大牛的存在,咱們吃瓜的參合個啥!