當前位置:首頁 > 公眾號精選 > 嵌入式大雜燴
[導讀]本文詳細解析extern "C"的底層原理與實際應用。


前言

本文詳細解析extern "C"的底層原理與實際應用。


在你工作過的系統(tǒng)里,不知能否看到類似下面的代碼。

這好像沒有什么問題,你應該還會想:“嗯?是啊,我們的代碼都是這樣寫的,從來沒有因此碰到過什么麻煩啊~”。

你說的沒錯,如果你的頭文件從來沒有被任何C++程序引用過的話。

這與C++有什么關系呢? 看看__cplusplus(注意前面是兩個下劃線) 的名字你就應該知道它與C++有很大關系。__cplusplus是一個C++規(guī)范規(guī)定的預定義宏。你可以信任的是:所有的現(xiàn)代C++編譯器都預先定義了它;而所有C語言編譯器則不會。另外,按照規(guī)范__cplusplus的值應該等于1 9 9 7 1 1 L ,然而不是所有的編譯器都照此實現(xiàn),比如g++編譯器就將它的值定義為1。

所以,如果上述代碼被C語言程序引用的話,它的內容就等價于下列代碼。

在這種情況下,既然extern "C" { }經過預處理之后根本就不存在,那么它和#include指令之間的關系問題自然也就是無中生有。

extern "C"的前世今生

在C++編譯器里,有一位暗黑破壞神,專門從事一份稱作“名字粉碎”(name mangling)的工作。當把一個C++的源文件投入編譯的時候,它就開始工作,把每一個它在源文件里看到的外部可見的名字粉碎的面目全非,然后存儲到二進制目標文件的符號表里。

之所以在C++的世界里存在這樣一個怪物,是因為C++允許對一個名字給予不同的定義,只要在語義上沒有二義性就好。比如,你可以讓兩個函數(shù)是同名的,只要它們的參數(shù)列表不同即可,這就是函數(shù)重載(function overloading);甚至,你可以讓兩個函數(shù)的原型聲明是完全相同的,只要它們所處的名字空間(namespace)不一樣即可。事實上,當處于不同的名字空間時,所有的名字都是可以重復的,無論是函數(shù)名,變量名,還是類型名。

另外,C++程序的構造方式仍然繼承了C語言的傳統(tǒng):編譯器把每一個通過命令行指定的源代碼文件看做一個獨立的編譯單元,生成目標文件;然后,鏈接器通過查找這些目標文件的符號表將它們鏈接在一起生成可執(zhí)行程序。

編譯和鏈接是兩個階段的事情;事實上,編譯器和鏈接器是兩個完全獨立的工具。編譯器可以通過語義分析知道那些同名的符號之間的差別;而鏈接器卻只能通過目標文件符號表中保存的名字來識別對象。

所以,編譯器進行名字粉碎的目的是為了讓鏈接器在工作的時候不陷入困惑,將所有名字重新編碼,生成全局唯一,不重復的新名字,讓鏈接器能夠準確識別每個名字所對應的對象。

但 C語言卻是一門單一名字空間的語言,也不允許函數(shù)重載,也就是說,在一個編譯和鏈接的范圍之內,C語言不允許存在同名對象。比如,在一個編譯單元內部,不允許存在同名的函數(shù),無論這個函數(shù)是否用static修飾;在一個可執(zhí)行程序對應的所有目標文件里,不允許存在同名對象,無論它代表一個全局變量,還是一個函數(shù)。所以,C語言編譯器不需要對任何名字進行復雜的處理(或者僅僅對名字進行簡單一致的修飾(decoration),比如在名字前面統(tǒng)一的加上單下劃線_)。

C++的締造者Bjarne Stroustrup在最初就把——能夠兼容C,能夠復用大量已經存在的C庫——列為C++語言的重要目標。但兩種語言的編譯器對待名字的處理方式是不一致的,這就給鏈接過程帶來了麻煩。

例如,現(xiàn)有一個名為my_handle.h的頭文件,內容如下:

然后使用C語言編譯器編譯my_handle.c,生成目標文件my_handle.o。由于C語言編譯器不對名字進行粉碎,所以在my_handle.o的符號表里,這三個函數(shù)的名字和源代碼文件中的聲明是一致的。

隨后,我們想讓一個C++程序調用這些函數(shù),所以,它也包含了頭文件my_handle.h。假設這個C++源代碼文件的名字叫my_handle_client.cpp,其內容如下:

其中,粗體的部分就是那三個函數(shù)的名字被粉碎后的樣子。

然后,為了讓程序可以工作,你必須將my_handle.o和my_handle_client.o放在一起鏈接。由于在兩個目標文件對于同一對象的命名不一樣,鏈接器將報告相關的“符號未定義”錯誤。

為了解決這一問題,C++引入了鏈接規(guī)范(linkage specification)的概念,表示法為extern"language string",C++編譯器普遍支持的"language string"有"C"和"C++",分別對應C語言和C++語言。

鏈接規(guī)范的作用是告訴C++編譯:對于所有使用了鏈接規(guī)范進行修飾的聲明或定義,應該按照指定語言的方式來處理,比如名字,調用習慣(calling convention)等等。

鏈接規(guī)范的用法有兩種:

1.單個聲明的鏈接規(guī)范,比如:

extern "C" void foo();

2. 一組聲明的鏈接規(guī)范,比如:

extern "C"{ void foo(); int bar();}

對我們之前的例子而言,如果我們把頭文件my_handle.h的內容改成:

然后使用C++編譯器重新編譯my_handle_client.cpp,所生成目標文件my_handle_client.o中的符號表就變?yōu)椋?/span>

從中我們可以看出,此時,用extern "C" 修飾了的聲明,其生成的符號和C語言編譯器生成的符號保持了一致。這樣,當你再次把my_handle.o和my_handle_client.o放在一起鏈接的時候,就不會再有之前的“符號未定義”錯誤了。

但此時,如果你重新編譯my_handle.c,C語言編譯器將會報告“語法錯誤”,因為extern"C"是C++的語法,C語言編譯器不認識它。此時,可以按照我們之前已經討論的,使用宏__cplusplus來識別C和C++編譯器。修改后的my_handle.h的代碼如下:

小心門后的未知世界

在我們清楚了 extern "C" 的來歷和用途之后,回到我們本來的話題上,為什么不能把#include 指令放置在 extern "C" { ... } 里面?

我們先來看一個例子,現(xiàn)有a.h,b.h,c.h以及foo.cpp,其中foo.cpp包含c.h,c.h包含b.h,b.h包含a.h,如下:

現(xiàn)使用C++編譯器的預處理選項來編譯foo.cpp,得到下面的結果:

正如你看到的,當你把#include指令放置在extern "C" { }里的時候,則會造成extern "C" { } 的嵌套。這種嵌套是被C++規(guī)范允許的。當嵌套發(fā)生時,以最內層的嵌套為準。比如在下面代碼中,函數(shù)foo會使用C++的鏈接規(guī)范,而函數(shù)bar則會使用C的鏈接規(guī)范。

如果能夠保證一個C語言頭文件直接或間接依賴的所有頭文件也都是C語言的,那么按照C++語言規(guī)范,這種嵌套應該不會有什么問題。但具體到某些編譯器的實現(xiàn),比如MSVC2005,卻可能由于 extern "C" { } 的嵌套過深而報告錯誤。不要因此而責備微軟,因為就這個問題而言,這種嵌套是毫無意義的。你完全可以通過把#include指令放置在extern "C" { }的外面來避免嵌套。拿之前的例子來說,如果我們把各個頭文件的 #include 指令都移到extern "C" { } 之外,然后使用C++編譯器的預處理選項來編譯foo.cpp,就會得到下面的結果:

這樣的結果肯定不會引起編譯問題的結果——即便是使用MSVC。

把 #include 指令放置在extern "C" { }里面的另外一個重大風險是,你可能會無意中改變一個函數(shù)聲明的鏈接規(guī)范。比如:有兩個頭文件a.h,b.h,其中b.h包含a.h,如下:

按照a.h作者的本意,函數(shù)foo是一個C++自由函數(shù),其鏈接規(guī)范為"C++"。但在b.h中,由于#include "a.h"被放到了extern "C" { }的內部,函數(shù)foo的鏈接規(guī)范被不正確地更改了。

由于每一條 #include 指令后面都隱藏這一個未知的世界,除非你刻意去探索,否則你永遠都不知道,當你把一條條#include指令放置于extern "C" { }里面的時候,到底會產生怎樣的結果,會帶來何種的風險?;蛟S你會說,“我可以去查看這些被包含的頭文件,我可以保證它們不會帶來麻煩”。但,何必呢?畢竟,我們完全可以不必為不必要的事情買單,不是嗎?

Q & A

Q: 難道任何# i n c l u d e指令都不能放在e x t e r n "C"里面嗎?

A: 正像這個世界的大多數(shù)規(guī)則一樣,總會存在特殊情況。

有時候,你可能利用頭文件機制“巧妙”的解決一些問題。比如,#pragma pack的問題。這些頭文件和常規(guī)的頭文件作用是不一樣的,它們里面不會放置C的函數(shù)聲明或者變量定義,鏈接規(guī)范不會對它們的內容產生影響。這種情況下,你可以不必遵守這些規(guī)則。

更加一般的原則是,在你明白了這所有的原理之后,只要你明白自己在干什么,那就去做吧。

Q: 你只說了不應該放入e x t e r n "C"的,但什么可以放入呢?

A: 鏈接規(guī)范僅僅用于修飾函數(shù)和變量,以及函數(shù)類型。所以,嚴格的講,你只應該把這三種對象放置于extern "C"的內部。

但,你把C語言的其它元素,比如非函數(shù)類型定義(結構體,枚舉等)放入extern "C"內部,也不會帶來任何影響。更不用說宏定義預處理指令了。

所以,如果你更加看重良好組織和管理的習慣,你應該只在必須使用extern "C"聲明的地方使用它。即使你比較懶惰,絕大多數(shù)情況下,把一個頭件自身的所有定義和聲明都放置在extern"C"里面也不會有太大的問題。

Q: 如果一個帶有函數(shù)/變量聲明的C頭文件里沒有e x t e r n "C"聲明怎么辦?

A: 如果你可以判斷,這個頭文件永遠不可能讓C++代碼來使用,那么就不要管它。

但現(xiàn)實是,大多數(shù)情況下,你無法準確的推測未來。你在現(xiàn)在就加上這個extern "C",這花不了你多少成本,但如果你現(xiàn)在沒有加,等到將來這個頭文件無意中被別人的C++程序包含的時候,別人很可能需要更高的成本來定位錯誤和修復問題。

Q: 如果我的C+ +程序想包含一個C頭文件a . h,它的內容包含了C的函數(shù)/變量聲明,但它們卻沒有使用e x t e r n "C"鏈接規(guī)范,該怎么辦?

A: 在a.h里面加上它。

某些人可能會建議你,如果a.h沒有extern "C",而b.cpp包含了a.h,可以在b.cpp里加上 :

extern "C"{ #include "a.h"}

這是一個邪惡的方案,原因在之前我們已經闡述。但值得探討的是,這種方案這背后卻可能隱含著一個假設,即我們不能修改a.h。不能修改的原因可能來自兩個方面:

1. 頭文件代碼屬于其它團隊或者第三方公司,你沒有修改代碼的權限;

2. 雖然你擁有修改代碼的權限,但由于這個頭文件屬于遺留系統(tǒng),冒然修改可能會帶來不可預知的問題。

對 于第一種情況,不要試圖自己進行workaround,因為這會給你帶來不必要的麻煩。正確的解決方案是,把它當作一個bug,發(fā)送缺陷報告給相應的團隊 或第三方公司。如果是自己公司的團隊或你已經付費的第三方公司,他們有義務為你進行這樣的修改。如果他們不明白這件事情的重要性,告訴他們。如果這些頭文 件屬于一個免費開源軟件,自己進行正確的修改,并發(fā)布patch給其開發(fā)團隊。

在 第二種情況下,你需要拋棄掉這種不必要的安全意識。因為,首先,對于大多數(shù)頭文件而言,這種修改都不是一種復雜的,高風險的修改,一切都在可控的范圍之 內;其次,如果某個頭文件混亂而復雜,雖然對于遺留系統(tǒng)的哲學應該是:“在它還沒有帶來麻煩之前不要動它”,但現(xiàn)在麻煩已經來了,逃避不如正視,所以上策 是,將其視作一個可以整理到干凈合理狀態(tài)的良好機會。

Q: 我們代碼中關于e x t e r n "C"的寫法如下,這正確嗎?

A: 不確定。

按照C++的規(guī)范定義,__cplusplus 的值應該被定義為199711L,這是一個非零的值;盡管某些編譯器并沒有按照規(guī)范來實現(xiàn),但仍然能夠保證__cplusplus的值為非零——至少我到目前為止還沒有看到哪款編譯器將其實現(xiàn)為0。這種情況下,#if __cplusplus ... #endif完全是冗余的。

但,C++編譯器的廠商是如此之多,沒有人可以保證某款編譯器,或某款編譯器的早期版本沒有將__cplusplus的值定義為0。但即便如此,只要能夠保證宏__cplusplus只在C++編譯器中被預先定義 ,那么,僅僅使用#ifdef __cplusplus ? #endif就足以確保意圖的正確性;額外的使用#if __cplusplus ... #endif反而是錯誤的。

只有在這種情況下:即某個廠商的C語言和C++語言編譯器都預先定義了__cplusplus ,但通過其值為0和非零來進行區(qū)分,使用#if __cplusplus ... #endif才是正確且必要的。

既然現(xiàn)實世界是如此復雜,你就需要明確自己的目標,然后根據目標定義相應的策略。比如:如果你的目標是讓你的代碼能夠使用幾款主流的、正確遵守了規(guī)范的編譯器進行編譯,那么你只需要簡單的使用#ifdef __cplusplus ... #endif就足夠了。

但如果你的產品是一個雄心勃勃的,試圖兼容各種編譯器的(包括未知的)跨平臺產品, 我們可能不得不使用下述方法來應對各種情況 ,其中__ALIEN_C_LINKAGE__是為了標識那些在C和C++編譯中都定義了__cplusplus宏的編譯器。

這應該可以工作,但在每個頭文件中都寫這么一大串,不僅有礙觀瞻,還會造成一旦策略進行修改,就會到處修改的狀況。違反了DRY(Don't Repeat Yourself)原則,你總要為之付出額外的代價。解決它的一個簡單方案是,定義一個特定的頭文件——比如clinkage.h,在其中增加這樣的定義:

以下舉例中c的函數(shù)聲明和定義分別在cfun.h 和 cfun.c 中,函數(shù)打印字符串 “this is c fun call”,c++函數(shù)聲明和定義分別在cppfun.h 和 cppfun.cpp中,函數(shù)打印字符串 "this is cpp fun call", 編譯環(huán)境vc2010

c++ 調用 c 的方法(關鍵是要讓c的函數(shù)按照c的方式編譯,而不是c++的方式)

(1) cfun.h如下:
#ifndef _C_FUN_H_#define _C_FUN_H_  void cfun(); #endif

cppfun.cpp 如下:

//#include "cfun.h" 不需要包含cfun.h#include "cppfun.h"#include using namespace std;extern "C" void cfun(); //聲明為 extern void cfun(); 錯誤 void cppfun(){ cout<<"this is cpp fun call"<<endl;} int main(){ cfun(); return 0;}

(2)cfun.h同上
cppfun.cpp 如下:
extern "C"{ #include "cfun.h"http://注意include語句一定要單獨占一行;}#include "cppfun.h"#include using namespace std; void cppfun(){ cout<<"this is cpp fun call"<<endl;} int main(){ cfun(); return 0;} 

(3)cfun.h如下:

#ifndef _C_FUN_H_#define _C_FUN_H_ #ifdef __cplusplusextern "C"{#endif void cfun(); #ifdef __cplusplus}#endif #endif

cppfun.cpp如下:

#include "cfun.h"#include "cppfun.h"#include using namespace std; void cppfun(){ cout<<"this is cpp fun call"<<endl;} int main(){ cfun(); return 0;}

c調用c++(關鍵是C++ 提供一個符合 C 調用慣例的函數(shù))

在vs2010上測試時,沒有聲明什么extern等,只在在cfun.c中包含cppfun.h,然后調用cppfun()也可以編譯運行,在gcc下就編譯出錯,按照c++/c的標準這種做法應該是錯誤的。以下方法兩種編譯器都可以運行

cppfun.h如下:

#ifndef _CPP_FUN_H_#define _CPP_FUN_H_ extern "C" void cppfun(); #endif

cfun.c如下:

//#include "cppfun.h" //不要包含頭文件,否則編譯出錯#include "cfun.h"#include void cfun(){ printf("this is c fun call\n");} extern void cppfun(); int main(){#ifdef __cplusplus cfun();#endif cppfun(); return 0;}


- EOF -



免責聲明:本文內容由21ic獲得授權后發(fā)布,版權歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉