詢問過很多使用 C 的開發(fā)者,關(guān)于 C 中最困擾他們的是什么?他們中的許多人可能會回答指針和內(nèi)存泄漏。這些確實是開發(fā)人員消耗大部分調(diào)試時間的項目。指針和內(nèi)存泄漏對某些程序員來說似乎是一種威懾,但是,一旦你了解了指針和相關(guān)內(nèi)存操作的基礎(chǔ)知識,它們將成為你在 C 中擁有的最強(qiáng)大的工具。
本文將與您分享開發(fā)人員在開始使用指針來編程前應(yīng)該知道的秘密。本文內(nèi)容包括:
1. 導(dǎo)致內(nèi)存破壞的指針操作類型
2. 在使用動態(tài)內(nèi)存分配時必須考慮的檢查點
3. 導(dǎo)致內(nèi)存泄漏的場景
如果您預(yù)先知道什么地方可能出錯,那么您就能夠小心避免陷阱,并消除大多數(shù)與指針和內(nèi)存相關(guān)的問題。
啥是內(nèi)存泄漏
內(nèi)存泄露的解釋如下:
在計算機(jī)科學(xué)中,內(nèi)存泄漏指由于疏忽或錯誤造成程序未能釋放已經(jīng)不再使用的內(nèi)存。內(nèi)存泄漏并非指內(nèi)存在物理上的消失,而是應(yīng)用程序分配某段內(nèi)存后,由于設(shè)計錯誤,導(dǎo)致在釋放該段內(nèi)存之前就失去了對該段內(nèi)存的控制,從而造成了內(nèi)存的浪費。
在C++中出現(xiàn)內(nèi)存泄露的主要原因就是程序猿在申請了內(nèi)存后(malloc(), new),沒有及時釋放沒用的內(nèi)存空間,甚至消滅了指針導(dǎo)致該區(qū)域內(nèi)存空間根本無法釋放。
知道了出現(xiàn)內(nèi)存泄露的原因就能知道如何應(yīng)對內(nèi)存泄露,即:不用了的內(nèi)存空間記得釋放,不釋放留著過年哇!
? 內(nèi)存泄漏可能會導(dǎo)致嚴(yán)重的后果:
● 程序運行后,隨著時間占用了更多的內(nèi)存,最后無內(nèi)存可用而崩潰;
● 程序消耗了大量的內(nèi)存,導(dǎo)致其他程序無法正常使用;
● 程序消耗了大量內(nèi)存,導(dǎo)致消費者選用了別人的程序而不是你的;
● 經(jīng)常做出內(nèi)存泄露bug的程序猿被公司開出而貧困潦倒。
? 如何知道自己的程序存在內(nèi)存泄露?
根據(jù)內(nèi)存泄露的原因及其惡劣的后果,我們可以通過其主要表現(xiàn)來發(fā)現(xiàn)程序是否存在內(nèi)存泄漏:程序長時間運行后內(nèi)存占用率一直不斷的緩慢的上升,而實際上在你的邏輯中并沒有這么多的內(nèi)存需求。
? 如何定位到泄露點呢?
根據(jù)原理,我們可以先review自己的代碼,利用"查找"功能,查詢new與delete,看看內(nèi)存的申請與釋放是不是成對釋放的,這使你迅速發(fā)現(xiàn)一些邏輯較為簡單的內(nèi)存泄露情況。
如果依舊發(fā)生內(nèi)存泄露,可以通過記錄申請與釋放的對象數(shù)目是否一致來判斷。在類中追加一個靜態(tài)變量 static int count;在構(gòu)造函數(shù)中執(zhí)行count++;在析構(gòu)函數(shù)中執(zhí)行count--;,通過在程序結(jié)束前將所有類析構(gòu),之后輸出靜態(tài)變量,看count的值是否為0,如果為0,則問題并非出現(xiàn)在該處,如果不為0,則是該類型對象沒有完全釋放。
檢查類中申請的空間是否完全釋放,尤其是存在繼承父類的情況,看看子類中是否調(diào)用了父類的析構(gòu)函數(shù),有可能會因為子類析構(gòu)時沒有是否父類中申請的內(nèi)存空間。
對于函數(shù)中申請的臨時空間,認(rèn)真檢查,是否存在提前跳出函數(shù)的地方?jīng)]有釋放內(nèi)存。
什么地方可能出錯?
有幾種問題場景可能會出現(xiàn),從而可能在完成生成后導(dǎo)致問題。在處理指針時,您可以使用本文中的信息來避免許多問題。
未初始化的內(nèi)存
在本例中,p 已被分配了 10 個字節(jié)。這 10 個字節(jié)可能包含垃圾數(shù)據(jù),如圖所示。
char *p = malloc ( 10 );
垃圾數(shù)據(jù)
如果在對這個 p 賦值前,某個代碼段嘗試訪問它,則可能會獲得垃圾值,您的程序可能具有不可預(yù)測的行為。p 可能具有您的程序從未曾預(yù)料到的值。
良好的習(xí)慣是始終結(jié)合使用 memset 和 malloc分配內(nèi)存,或者使用 calloc。
char *p = malloc (10);
memset(p,’\0’,10);
現(xiàn)在,即使同一個代碼段嘗試在對 p 賦值前訪問它,該代碼段也能正確處理 Null 值(在理想情況下應(yīng)具有的值),然后將具有正確的行為。
內(nèi)存覆蓋
由于 p 已被分配了 10 個字節(jié),如果某個代碼片段嘗試向 p 寫入一個 11 字節(jié)的值,則該操作將在不告訴您的情況下自動從其他某個位置“吃掉”一個字節(jié)。讓我們假設(shè)指針 q 表示該內(nèi)存。
原始 q 內(nèi)容
覆蓋后的 q 內(nèi)容
結(jié)果,指針 q 將具有從未預(yù)料到的內(nèi)容。即使您的模塊編碼得足夠好,也可能由于某個共存模塊執(zhí)行某些內(nèi)存操作而具有不正確的行為。下面的示例代碼片段也可以說明這種場景。
char *name = (char *) malloc(11);
// Assign some value to name
memcpy ( p,name,11); // Problem begins here
在本例中,memcpy 操作嘗試將 11 個字節(jié)寫到 p,而后者僅被分配了 10 個字節(jié)。
作為良好的實踐,每當(dāng)向指針寫入值時,都要確保對可用字節(jié)數(shù)和所寫入的字節(jié)數(shù)進(jìn)行交叉核對。一般情況下,memcpy 函數(shù)將是用于此目的的檢查點。
內(nèi)存讀取越界
內(nèi)存讀取越界 (overread) 是指所讀取的字節(jié)數(shù)多于它們應(yīng)有的字節(jié)數(shù)。這個問題并不太嚴(yán)重,在此就不再詳述了。下面的代碼提供了一個示例。
char*ptr = (char*)malloc(10);charname[20] ;memcpy( name,ptr,20);// Problem begins here
在本例中,memcpy 操作嘗試從 ptr 讀取 20 個字節(jié),但是后者僅被分配了 10 個字節(jié)。這還會導(dǎo)致不希望的輸出。
內(nèi)存泄漏
內(nèi)存泄漏可能真正令人討厭。下面的列表描述了一些導(dǎo)致內(nèi)存泄漏的場景。
重新賦值
我將使用一個示例來說明重新賦值問題。
char *memoryArea = malloc(10);
char *newArea = malloc(10);
這向如下面的圖所示的內(nèi)存位置賦值。
內(nèi)存位置
memoryArea 和 newArea 分別被分配了 10 個字節(jié),它們各自的內(nèi)容如圖 4 所示。如果某人執(zhí)行如下所示的語句(指針重新賦值)……
memoryArea= newArea;
則它肯定會在該模塊開發(fā)的后續(xù)階段給您帶來麻煩。
在上面的代碼語句中,開發(fā)人員將 memoryArea 指針賦值給 newArea 指針。結(jié)果,memoryArea 以前所指向的內(nèi)存位置變成了孤立的;
如下面的圖所示。它無法釋放,因為沒有指向該位置的引用。這會導(dǎo)致 10 個字節(jié)的內(nèi)存泄漏。
內(nèi)存泄漏
在對指針賦值前,請確保內(nèi)存位置不會變?yōu)楣铝⒌摹?
首先釋放父塊
假設(shè)有一個指針 memoryArea,它指向一個 10 字節(jié)的內(nèi)存位置。該內(nèi)存位置的第三個字節(jié)又指向某個動態(tài)分配的 10 字節(jié)的內(nèi)存位置,如圖 6 所示。
動態(tài)分配的內(nèi)存
free(memoryArea)
如果通過調(diào)用 free 來釋放了 memoryArea,則 newArea 指針也會因此而變得無效。newArea 以前所指向的內(nèi)存位置無法釋放,因為已經(jīng)沒有指向該位置的指針。
換句話說,newArea 所指向的內(nèi)存位置變?yōu)榱斯铝⒌?,從而?dǎo)致了內(nèi)存泄漏。
每當(dāng)釋放結(jié)構(gòu)化的元素,而該元素又包含指向動態(tài)分配的內(nèi)存位置的指針時,應(yīng)首先遍歷子內(nèi)存位置(在此例中為 newArea),并從那里開始釋放,然后再遍歷回父節(jié)點。
這里的正確實現(xiàn)應(yīng)該為:
free( memoryArea->newArea);
free(memoryArea);
返回值的不正確處理
有時,某些函數(shù)會返回對動態(tài)分配的內(nèi)存的引用。跟蹤該內(nèi)存位置并正確地處理它就成為了 calling 函數(shù)的職責(zé)。
char *func ( )
{
return malloc(20); // make sure to memset this location to ‘\0’…
}
void callingFunc ( )
{
func ( ); // Problem lies here
}
在上面的示例中,callingFunc() 函數(shù)中對 func() 函數(shù)的調(diào)用未處理該內(nèi)存位置的返回地址。結(jié)果,func() 函數(shù)所分配的 20 個字節(jié)的塊就丟失了,并導(dǎo)致了內(nèi)存泄漏。
歸還您所獲得的
在開發(fā)組件時,可能存在大量的動態(tài)內(nèi)存分配。您可能會忘了跟蹤所有指針(指向這些內(nèi)存位置),并且某些內(nèi)存段沒有釋放,還保持分配給該程序。
始終要跟蹤所有內(nèi)存分配,并在任何適當(dāng)?shù)臅r候釋放它們。事實上,可以開發(fā)某種機(jī)制來跟蹤這些分配,比如在鏈表節(jié)點本身中保留一個計數(shù)器(但您還必須考慮該機(jī)制的額外開銷)。
訪問空指針
訪問空指針是非常危險的,因為它可能使您的程序崩潰。始終要確保您不是 在訪問空指針。
沒有躲過的坑--指針(內(nèi)存泄露)
C++被人罵娘最多的就是指針。
夜深人靜的時候,拿出幾個使用指針容易出現(xiàn)的坑兒??赡芪业恼Z言描述有些讓人費勁,盡量用代碼說話。
通過指向類的NULL指針調(diào)用類的成員函數(shù)
試圖用一個null指針調(diào)用類的成員函數(shù),導(dǎo)致崩潰:
#include
using namespace std;
class A{int value;public:void dumb() const {cout << "dumb()\n";}void set(int x) {cout << "set()\n"; value=x;}int get() const {cout << "get()\n"; return value;}};
int main(){A *pA1 = new A;A *pA2 = NULL;
pA1->dumb();pA1->set(10);pA1->get();pA2->dumb();pA2->set(20);//崩潰pA2->get();
return 0;}
為什么會這樣?
通過非法指針調(diào)用函數(shù),就相當(dāng)于給函數(shù)傳遞了一個指向函數(shù)的非法指針!
但是為什么pA2->dumb()會成功呢?
因為導(dǎo)致崩潰的是訪問了成員變量!!
使用已經(jīng)釋放的指針
struct X{int data;};
int foo(){
struct X *pX;
pX = (struct X *) malloc(sizeof (struct X));
pX->data = 10;
free(pX);
...return pX->data;
}
使用未初始化的指針
如果你這樣寫,編譯器會提示你使用了未初始化的變量p。
void foo A()
{
int *p;*p = 100;
}
那么如果我釋放一個初始化的指針呢?
void foo B()
{
int *p;
free(p);
}
結(jié)果是一樣的!!
釋放已經(jīng)釋放的指針
直接看看代碼:
void foo A()
{
char*p;
p = (char*)malloc(100);
cout<<"free(p)\n";
free(p);
cout<<"free(p)\n";
free(p);
}
這樣的問題也許不會立即使你的程序崩潰,那樣后果更加嚴(yán)重!!
沒有調(diào)用子類的析構(gòu)函數(shù)
之前講過,父類的析構(gòu)函數(shù)最好聲明為虛!!
ParentClass *pObj = new ChildClass;
...delete pObj;
上述代碼會造成崩潰,如果父類的析構(gòu)函數(shù)不聲明為虛,那么不會調(diào)用繼承類的析構(gòu)函數(shù),造成內(nèi)存泄露。
內(nèi)存溢出
當(dāng)我們拷貝字符串的時候,我們常常會用到 memcpy函數(shù)。這里特別需要注意的就是字符串結(jié)尾的null字符:
char *p = (char *)malloc(strlen(str));
strcpy(p, str);
為了躲過這個坑,只需要把 strlen(str) 改為 strlen(str)+1。
總結(jié)
本文討論了在使用動態(tài)內(nèi)存分配時可以避免的幾個陷阱。為了避免與內(nèi)存相關(guān)的問題,好的做法是:
始終memset與 malloc 一起使用,或始終使用calloc.
每當(dāng)向指針寫入值時,請確保交叉檢查可用字節(jié)數(shù)和正在寫入的字節(jié)數(shù)。
在分配指針之前,確保沒有內(nèi)存位置成為孤立的。
每當(dāng)釋放結(jié)構(gòu)化元素(它又包含指向動態(tài)分配的內(nèi)存位置的指針)時,首先遍歷子內(nèi)存位置并從那里開始釋放,再遍歷回父節(jié)點。
始終正確處理返回動態(tài)分配內(nèi)存引用的函數(shù)的返回值。
每一個都有對應(yīng)的free malloc。
確保你沒有訪問空指針。