C 和 C++ 字符串字面量(String Literal)既有相同之處,又有一些區(qū)別。了解這些內(nèi)容對(duì)于加深字符串字面量以及相關(guān)一些概念的理解、澄清一些常見的概念誤區(qū)不無助益。本文以普通字符串字面量 "hello" 為例總結(jié)說明如下。
如果你發(fā)現(xiàn)了本文中的錯(cuò)誤,或者對(duì)本文有什么感想或建議,可通過 whyglinux AT gmail DOT com 郵箱和作者聯(lián)系。
相同點(diǎn):
[list][*]字符串字面量是對(duì)象
C/C++ 中的對(duì)象(Object)指的是一塊存儲(chǔ)區(qū)。字符串字面量是不需要?jiǎng)?chuàng)建過程就可使用的對(duì)象,所以它既沒有變量那樣的聲明或者定義(字符串字面量是無名對(duì)象),也不需要象動(dòng)態(tài)分配的對(duì)象那樣進(jìn)行動(dòng)態(tài)分配。由于這個(gè)原因,用來限定變量的類型限定符(如 const、volatile)以及存儲(chǔ)類別指示符(如 extern、static、auto、register)不能用在修飾字符串字面量上。
[*] 數(shù)組類型
字符串字面量是數(shù)組類型的對(duì)象,因而具有數(shù)組的一切特點(diǎn)。關(guān)于這一點(diǎn)在下面還會(huì)進(jìn)一步說明。
[*] 靜態(tài)存儲(chǔ)期
C/C++ 中對(duì)象的生存期按照其存儲(chǔ)性質(zhì)可分為三類:靜態(tài)存儲(chǔ)期(static storage duration)、自動(dòng)存儲(chǔ)期(automatic storage duration)以及動(dòng)態(tài)存儲(chǔ)期(dynamic storage duration)。相應(yīng)地,對(duì)象可根據(jù)存儲(chǔ)期性質(zhì)分為靜態(tài)對(duì)象、自動(dòng)對(duì)象和動(dòng)態(tài)對(duì)象三種。
字符串字面量是靜態(tài)對(duì)象,所以在程序運(yùn)行期間會(huì)一直存在。
[*] 字符串字面量是左值,而且是不可被更改的左值
例如,char s[] = "hello"; 中的 “hello” 是數(shù)組類型的左值(lvalue),用于初始化 s 數(shù)組;sizeof( "hello" ) 以及 &"hello" 中的 "hello" 也都是左值。在這些情況下,"hello" 處于左值語義上下文環(huán)境中,所以不會(huì)產(chǎn)生下面將要提到的數(shù)組轉(zhuǎn)換為指針的現(xiàn)象。
另外,有些運(yùn)算不但要求其操作數(shù)是左值,還要求可變。例如,對(duì)對(duì)象進(jìn)行賦值、自加、自減等運(yùn)算。因?yàn)閿?shù)組是不可被更改的左值,所以不能對(duì)數(shù)組進(jìn)行這些操作,也就是說不存在數(shù)組類型的賦值、自加、自減等運(yùn)算。
[*]字符串字面量可以轉(zhuǎn)換為指向其首第一個(gè)字符的指針
處于右值語義環(huán)境中的字符串字面量將被默認(rèn)轉(zhuǎn)換為指向第一個(gè)字符的指針。例如,char* p = "hello"; 中的 “hello” 在轉(zhuǎn)換為字符指針后用于初始化指針變量 p;表達(dá)式 "hello"[0](相當(dāng)于 *("hello" + 0) 或者 *"hello")中的 “hello” 也是同樣轉(zhuǎn)換為指針后參與下標(biāo)運(yùn)算,等等。
這種性質(zhì)也是數(shù)組類型的特點(diǎn)。在右值語義環(huán)境下,一般類型的對(duì)象表示的值是由其存儲(chǔ)內(nèi)容決定的;而數(shù)組類型的對(duì)象與此不同,它代表的值不是來源于其內(nèi)容,而是來源于數(shù)組對(duì)象首元素所在的地址。這是數(shù)組最為特殊的地方,也是人們?nèi)菀桩a(chǎn)生誤解的地方。
[*] 取址運(yùn)算
字符串字面量是一個(gè)可取址的對(duì)象。例如:&"hello" 是合法的表達(dá)式。
[*] 地址常量
靜態(tài)對(duì)象的地址在編譯期間即可被確定,所以其地址(如 &"hello")是常量;而字符串字面量又可以從數(shù)組類型自動(dòng)轉(zhuǎn)換為指針(如 "hello" 轉(zhuǎn)換為指針后等同于 &"hello"[0]),所以字符串字面量可以直接作為地址常量表達(dá)式來使用。
[*] 修改字符串字面量的行為是無定義的
下面的操作都試圖修改字符串字面量中的第一個(gè)字符從而改變字符串字面量,所以其結(jié)果是無定義(Undefined)的:
”hello”[0] = ‘A’; /* Undefined */
char* p = “hello”; *p = ‘A’; /* Undefined */
使用了無定義行為的程序是錯(cuò)誤的;避免在程序中出現(xiàn)無定義行為是程序員的責(zé)任。
[/list]
區(qū)別點(diǎn):
[list][*]在類型限定上的不同
C 中的字符串字面量 "hello" 是數(shù)組類型 char[6](相應(yīng)地,每個(gè)字符元素是無 const 限定的 char 型);作為右值使用的時(shí)候轉(zhuǎn)換為指針類型 char*。
在 C++ 中 "hello" 是 char const [6] 類型(相應(yīng)地,每個(gè)字符元素的類型是 char const);轉(zhuǎn)換為指針使用的時(shí)候是 char const*、在特殊情況下也可以是 char*。
之所以在 C 中字符串字面量不是 const 數(shù)組(也就是說每個(gè)字符元素的類型不是 char const),是因?yàn)?C 要照顧或者考慮到標(biāo)準(zhǔn)制定之前已經(jīng)存在的大量代碼——那時(shí)的 C 語言還沒有 const 關(guān)鍵字,如果硬性規(guī)定為 const 數(shù)組,則 char* p = "hello"; 這樣的初始化或者 char* q; q = "hello"; 這樣的賦值就是非法的了(因?yàn)橛疫叺念愋?char const* 不能默認(rèn)轉(zhuǎn)換為左邊的類型 char* )。
同樣,為了使上述代碼能順利通過編譯過程,C++ 采取了另外一種策略:它規(guī)定了字符串字面量的類型是 const 數(shù)組,同時(shí)又特別規(guī)定了字符串字面量也可以有限制地轉(zhuǎn)換為指向非常量的指針(對(duì)于 "hello" 來說就是 char*),從而解決了上述代碼中存在的問題。不過,轉(zhuǎn)換到 char* 主要是為了兼容以前的代碼,這種轉(zhuǎn)換被 C++ 標(biāo)準(zhǔn)標(biāo)記為“Deprecated”,所以在寫程序的時(shí)候不應(yīng)該依賴于這種轉(zhuǎn)換。
[*]C++ 中的字符串字面量是常量,而在 C 中不是常量。
正是由于標(biāo)準(zhǔn)在類型上的不同規(guī)定造成了在 C 和 C++ 中字符串字面量常量性質(zhì)上的差別。
在 C 中,除了 string literals 和 compound literals(C99 only)之外,其它的 literals 都是常量;而在 C++ 中,包括 string literals 在內(nèi)的所有 literals 都是常量(注意:C++ 中不存在 compound literals。)
在現(xiàn)實(shí)中,經(jīng)常可以看到用“字符串常量”來指代“字符串字面量”的情況,其實(shí)對(duì)于 C 來說這是不正確的,因?yàn)樵?C 中字符串字面量不屬于常量;而對(duì)于 C++ 來說,“字符串常量”和“字符串字面量”實(shí)際上是一回事,只不過看問題的角度不同罷了。
順便提一下:C++ 中的常量可以有對(duì)象常量(如字符串字面量、const 限定的對(duì)象)和非對(duì)象常量之分,而 C 中的常量不包含對(duì)象,它們最明顯的特征就是不能進(jìn)行取址運(yùn)算,因此常量只能作為非左值(即右值)來使用。
[*]語法及語義上的區(qū)別
C 中的字符串字面量不是常量,它的每個(gè)字符元素也不是常量,所以字符元素的不可變性僅僅表現(xiàn)在語義層面,但在語法和約束條件上沒有要求。而 C++ 中字符串字面量是常量,每個(gè)字符元素也是常量,因此在語義和約束條件兩方面都要求不能改變其中的每個(gè)字符元素;另外,出于兼容性考慮 C++ 還存在著特殊情況下的向非 const 指針的轉(zhuǎn)換。
下面用具體的代碼來對(duì)以上內(nèi)容進(jìn)行說明。
*"hello" = 'A';
表達(dá)式 *"hello" 代表字符串字面量的第一個(gè)字符元素對(duì)象。上述語句試圖通過賦值操作改變第一個(gè)元素,當(dāng)然這樣的行為在 C 和 C++ 中都是無定義的。除了這個(gè)相同點(diǎn)外,還有如下的一些細(xì)微的區(qū)別:
在 C++ 中,*"hello" 是一個(gè) const 對(duì)象(其類型是 const char。注意:這里的 "hello" 不會(huì)轉(zhuǎn)換為 char* 指針、從而 *"hello" 不會(huì)是 char 類型),所以上述賦值違反了賦值號(hào)左操作數(shù)必須是一個(gè)可被改變的左值的約束條件。在此情況下,標(biāo)準(zhǔn)要求給出診斷信息。
在 C 中,*"hello" 是一個(gè)非 const 對(duì)象(其類型是 char),是一個(gè)可被改變的左值,所以不違背賦值的約束條件。在此情況下,盡管這個(gè)賦值操作是未定義的,標(biāo)準(zhǔn)對(duì)診斷信息沒有要求。
char* p = "hello";
char* q; q = "hello";
void foo( char* s ); foo( "hello" );
上面的初始化和賦值語句中 "hello" 都能轉(zhuǎn)換為 char* 指針類型,所以都是合法的。在 C++ 中,盡管 "hello" 作為指針使用時(shí)是 char const * 類型,在此情況下(如果不是 char* 類型則初始化或者賦值不能成立)基于對(duì)字符串字面量的特殊規(guī)定使它可以轉(zhuǎn)換為 char * 使用。
要注意 C++ 中字符串字面量轉(zhuǎn)換為指向非常量的指針是有限制的,僅僅在有明確的目標(biāo)類型要求的情況下才能進(jìn)行這樣的轉(zhuǎn)換,否則是非法的。比如下面的情況:
char* p = "hello" + 1;
char* q; q = "hello" + 1;
void foo( char* s ); foo( "hello" + 1 );
上述是合法的 C 代碼,但是作為 C++ 代碼是非法的。非法的原因在于:"hello" 轉(zhuǎn)換為 char const * 指針類型,而不能轉(zhuǎn)換為 char *,因?yàn)?+ 運(yùn)算符對(duì)其操作數(shù)的類型沒有轉(zhuǎn)換為 char* 這樣直接的要求(因?yàn)闊o論是 char const * 還是 char* 都能進(jìn)行指針加法運(yùn)算),所以指針加法表達(dá)式的結(jié)果仍然是 char const * 類型。這樣,上面指針的初始化或賦值操作就違反了在類型上的約束條件,需要給出診斷信息。
來源:ks990次