微軟Debug CRT庫(kù)是如何追蹤C(jī)內(nèi)存泄露的?
那么為什么要寫這篇文章呢?
本人在逛知乎的時(shí)候,看到一個(gè)問(wèn)題<
-
對(duì)內(nèi)存的分配的監(jiān)測(cè): 記錄內(nèi)存申請(qǐng)時(shí)候函數(shù)調(diào)用棧。一種方法是通過(guò)gflag配置讓程序在分配內(nèi)存的時(shí)候,記錄函數(shù)調(diào)用棧;還有一種就是通過(guò)hook的方式去獲取申請(qǐng)內(nèi)存時(shí)候函數(shù)調(diào)用時(shí)候的位置。
-
對(duì)比程序運(yùn)行時(shí)兩個(gè)不同時(shí)間點(diǎn)的內(nèi)存分配狀況,通過(guò)對(duì)比找到較多的內(nèi)存分配點(diǎn)對(duì)應(yīng)的函數(shù)調(diào)用棧
那么回到正題,如果自己去實(shí)現(xiàn)無(wú)非就是要實(shí)現(xiàn)以上兩點(diǎn)。本人正好在上學(xué)的時(shí)候用過(guò)微軟 DEBUG CRT庫(kù)檢測(cè)過(guò)內(nèi)存泄露,那就讓我們一起再來(lái)看看其原理,也正是可以自己去實(shí)現(xiàn)的一種方法,要做到知其然知其所以然。
微軟Debug CRT庫(kù)檢測(cè)C 內(nèi)存泄露原理?
我們先來(lái)解決上述的兩個(gè)問(wèn)題。
問(wèn)題一: 如何獲取函數(shù)調(diào)用棧?
那么你首先要知道什么時(shí)候申請(qǐng)了內(nèi)存?在C 中也就關(guān)鍵字new或者函數(shù)malloc,等等。那如何感知到呢?我們知道hook大致可以理解為就是改變?cè)械暮瘮?shù)調(diào)用地址,改為你自己實(shí)現(xiàn)的函數(shù)。是不是有點(diǎn)類似于python中的裝飾器了,在自定義的函數(shù)內(nèi)部實(shí)現(xiàn)一些邏輯。不過(guò)本文要講的不是hook,而是宏替換。以malloc為例,我們是不是可以通過(guò)宏定義,將malloc更改為my_malloc,然后在my_malloc中記錄這次內(nèi)存申請(qǐng)的信息。然后記錄的信息要包括:
-
申請(qǐng)的內(nèi)存信息,比如申請(qǐng)的內(nèi)存狀態(tài)
-
申請(qǐng)內(nèi)存時(shí)候函數(shù)調(diào)用棧,一般來(lái)說(shuō)可以通過(guò)
StackWalk獲取。不過(guò)本文講解的微軟DBUG的CRT庫(kù)采用的是另外的方式,記錄內(nèi)存申請(qǐng)時(shí)候文件名和行號(hào)等信息。這樣雖然沒有函數(shù)調(diào)用棧精確,但是也基本可以用于定位問(wèn)題了。
在Visual Studio (本文示例采用Visual Studio 2017)中,選擇工程的默認(rèn)的Debug模式,并且工程配置宏定義_CRTDBG_MAP_ALLOC, 此時(shí)將宏定義替換malloc為_malloc_dbg。注意看新的函數(shù)會(huì)傳入文件名字__FILE__和所在行__LINE__
#define malloc(s) _malloc_dbg(s, _NORMAL_BLOCK, __FILE__, __LINE__)
那么malloc做的事情和_malloc_dbg有什么區(qū)別呢? 在Release版本中malloc底層其實(shí)就直接調(diào)用HeapAlloc申請(qǐng)內(nèi)存(VS2017中)。而_malloc_dbg會(huì)申請(qǐng)額外的空間用來(lái)做調(diào)試用。如下圖所示: 在_malloc_dbg中在實(shí)際要用的內(nèi)存UserPtr前面還加了一段_CrtMemBlockHeader用于記錄內(nèi)存申請(qǐng)的相關(guān)信息,而No Main's Land部分為一個(gè)4個(gè)字節(jié)填充了0xFDFDFDFD,主要用來(lái)校驗(yàn)內(nèi)存是否溢出或者破壞,這個(gè)不是本文的重點(diǎn)。
接下來(lái)看看_CrtMemBlockHeader是如何記錄調(diào)用相關(guān)的信息的呢? 我們看下它的結(jié)構(gòu)便一目了然。其是一個(gè)雙向鏈表的節(jié)點(diǎn),有前后指針,還有文件名,行號(hào)等。
struct _CrtMemBlockHeader
{
_CrtMemBlockHeader* _block_header_next;
_CrtMemBlockHeader* _block_header_prev;
char const* _file_name;
int _line_number;
int _block_use;
size_t _data_size;
long _request_number;
unsigned char _gap[no_mans_land_size];
// Followed by:
// unsigned char _data[_data_size];
// unsigned char _another_gap[no_mans_land_size];
};
那么當(dāng)申請(qǐng)了內(nèi)存后,這些內(nèi)存的關(guān)系是如何的呢,如下圖:
那通過(guò)以上方法我們便可以對(duì)每一個(gè)內(nèi)存申請(qǐng)做記錄了,而這個(gè)記錄則存儲(chǔ)在全局的鏈表中__acrt_first_block。
那么內(nèi)存釋放的時(shí)候,是如何進(jìn)行釋放的呢?同樣的free也會(huì)通過(guò)宏替換為_free_dbg,這里在進(jìn)行內(nèi)存釋放的時(shí)候,會(huì)根據(jù)UserPtr尋找到對(duì)應(yīng)的_CrtMemBlockHeader, 也就知道了鏈表節(jié)點(diǎn)的位置,雙向鏈表,也便于我們刪除節(jié)點(diǎn)。
看到這里可能有同學(xué)會(huì)發(fā)現(xiàn)了,那還有C 的關(guān)鍵字new和delete呢。首先我們要知道new是C 的關(guān)鍵字,對(duì)于有構(gòu)造函數(shù)的類一般做了以下兩個(gè)事情:
-
申請(qǐng)對(duì)象所需的內(nèi)存空間。而這個(gè)時(shí)候內(nèi)部其實(shí)調(diào)用的是函數(shù)operator new或者operator new[]
-
調(diào)用對(duì)象的構(gòu)造函數(shù)
而在微軟crt中也有對(duì)new記錄文件名和行號(hào)的實(shí)現(xiàn)。
void* __CRTDECL operator new(
size_t const size,
int const block_use,
char const* file_name,
int const line_number
)
本人沒有找到哪個(gè)頭文件直接定義了宏替換,那么我們可以自己寫一個(gè)宏進(jìn)行替換如下:
#define new new(_NORMAL_BLOCK, __FILE__, __LINE__)
那么不難理解其他的內(nèi)存操作函數(shù)如何去做替換了吧。
問(wèn)題二: 對(duì)比不同時(shí)間點(diǎn)的內(nèi)存分配情況
那么我們?nèi)绾稳?duì)比呢?我先寫了一個(gè)樣例程序:
#define _CRTDBG_MAP_ALLOC
#include
#include
#define new new(_NORMAL_BLOCK, __FILE__, __LINE__)
int main()
{
//_CRTDBG_REPORT_FLAG:表示獲取當(dāng)前的標(biāo)示位
//_CRTDBG_LEAK_CHECK_DF:表示檢測(cè)內(nèi)存泄露
_CrtSetDbgFlag(_CrtSetDbgFlag(_CRTDBG_REPORT_FLAG) | _CRTDBG_LEAK_CHECK_DF);
int iSize = 100;
char * pStr = new char [iSize];
pStr = (char*)malloc(iSize);
strcpy_s(pStr, iSize, "Memory Leak!");
_CrtDumpMemoryLeaks();
return 0;
}
因?yàn)檫@個(gè)是一個(gè)簡(jiǎn)單的樣例程序,但是足以說(shuō)明是如何檢測(cè)的。
-
一種方式是自己在程序中主動(dòng)打印出來(lái)可能泄露的內(nèi)存。這個(gè)時(shí)候其實(shí)就是遍歷上述的雙向鏈表,查看正在使用的內(nèi)存,并將其打印到Visual Studio的output窗口中。
-
另一種方式就是設(shè)置
_CRTDBG_LEAK_CHECK_DF這個(gè)標(biāo)記位,則在main函數(shù)退出后,在Debug的CRT庫(kù)中主動(dòng)調(diào)用了_CrtDumpMemoryLeaks。其實(shí)和方法1原理一樣,只是時(shí)間點(diǎn)不同。
檢測(cè)到的結(jié)果打印在Visual Studio的Output窗口中,如下圖所示。
總結(jié)
簡(jiǎn)單總結(jié)下,微軟Debug CRT庫(kù)的實(shí)現(xiàn),完全可以在項(xiàng)目中自己實(shí)現(xiàn)。就是通過(guò)在申請(qǐng)的內(nèi)存頭部記錄當(dāng)前分配內(nèi)存的相關(guān)信息,比如文件名和行號(hào),并且通過(guò)雙向鏈表將所有申請(qǐng)的節(jié)點(diǎn)串起來(lái)。然后在合適的時(shí)間點(diǎn)(比如感知到內(nèi)存泄露的情況下)打印出可能的內(nèi)存泄露的內(nèi)存關(guān)聯(lián)的信息。這種做法簡(jiǎn)單,但只針對(duì)小型的項(xiàng)目,適合采用這種方法,而且對(duì)于第三方庫(kù)的內(nèi)存泄露無(wú)法進(jìn)行檢測(cè)。本文旨在通過(guò)分析微軟Debug CRT庫(kù)的實(shí)現(xiàn)的檢測(cè)內(nèi)存泄露的方式,從而闡述自我實(shí)現(xiàn)簡(jiǎn)易C 內(nèi)存泄露檢測(cè)的思想。若平時(shí)分析內(nèi)存泄露問(wèn)題,建議還是采用本文開頭提到的幾篇文章的方法。
參考
-
Walking the callstack:https://www.codeproject.com/Articles/11132/Walking-the-callstack-2
-
C 不用工具,如何檢測(cè)內(nèi)存泄漏?:https://www.zhihu.com/question/29859828
-
new vs operator new in C :*https://www.geeksforgeeks.org/new-vs-operator-new-in-cpp/
- EOF -