在之前的文章
中,分析了glibc內(nèi)存管理相關(guān)的內(nèi)容,里面的是不是邏輯復(fù)雜,畢竟咱們用幾十行代碼完成的功能,glibc要用上百乃至上千行代碼來(lái)實(shí)現(xiàn),畢竟它的受眾太多了,需要考慮跨平臺(tái),各種邊界條件等。其實(shí),glibc的內(nèi)存分配庫(kù)ptmalloc也可以看做是一個(gè)內(nèi)存池,出于性能考慮,每次內(nèi)存申請(qǐng)都是先從ptmalloc中進(jìn)行分配,如果沒(méi)有合適的則通過(guò)系統(tǒng)分配函數(shù)進(jìn)行申請(qǐng);在釋放的時(shí)候,也是將被釋放內(nèi)存先方式內(nèi)存池中,內(nèi)存池根據(jù)一定的策略,來(lái)決定是否進(jìn)行shrink以歸還OS。那么,現(xiàn)一個(gè)內(nèi)存池?我們?cè)撛趺磳?shí)現(xiàn)呢?今天,借助這篇文章,我們一起來(lái)設(shè)計(jì)和實(shí)現(xiàn)一個(gè)內(nèi)存池(文末附有g(shù)ithub地址)。
背景
首先需要說(shuō)明的是,該內(nèi)存池是筆者在10年前完成的,下面先說(shuō)下當(dāng)時(shí)此項(xiàng)目的背景。09年,在某所的時(shí)候,參與了某個(gè)國(guó)家級(jí)項(xiàng)目,該項(xiàng)目是防DDOS攻擊相關(guān),因此更多的是跟IP相關(guān),所以每次分配和釋放內(nèi)存都是固定大小,經(jīng)過(guò)測(cè)試,性能不是很滿意,所以,經(jīng)過(guò)代碼分析以及性能攻擊分析,發(fā)現(xiàn)里面有大量的malloc/free,所以,當(dāng)時(shí)就決定是否從malloc/free入手,能否優(yōu)化整個(gè)項(xiàng)目的性能。所以,決定實(shí)現(xiàn)一個(gè)Memory Pool,在做了調(diào)研以及研究了相關(guān)論文后,決定實(shí)現(xiàn)一個(gè)內(nèi)存池,先試試水,所幸運(yùn)的是,性能確實(shí)比glibc自帶的malloc/free要高,所以也就應(yīng)用于項(xiàng)目上了。
?本文所講的Memory Pool為C語(yǔ)言實(shí)現(xiàn),旨在讓大家都能看懂,看明白(至少能夠完全理解本文所講的Memory Pool的實(shí)現(xiàn)原理)。?
概念
首先,我們介紹下什么是內(nèi)存池?
?預(yù)先在內(nèi)存中申請(qǐng)一定數(shù)量的內(nèi)存塊留作備用,當(dāng)有新的內(nèi)存需求時(shí),就先從內(nèi)存池中分配內(nèi)存返回,在釋放的時(shí)候,將內(nèi)存返回給內(nèi)存池而不是OS,在下次申請(qǐng)的時(shí)候,重新進(jìn)行分配?
那么為什么要有內(nèi)存池呢?這就需要從傳統(tǒng)內(nèi)存分配的特點(diǎn)來(lái)進(jìn)行分析,傳統(tǒng)內(nèi)存分配釋放的優(yōu)點(diǎn)無(wú)非就是
通用性強(qiáng),應(yīng)用廣泛,但是傳統(tǒng)的內(nèi)存分配、釋放在某些特定的項(xiàng)目中,其不一定是最優(yōu)、效率最高的方案。傳統(tǒng)內(nèi)存分配、釋放的缺點(diǎn)總結(jié)如下:1、調(diào)用malloc/new,系統(tǒng)需要根據(jù)“最先匹配”、“最優(yōu)匹配”或其他算法在內(nèi)存空閑塊表中查找一塊空閑內(nèi)存,調(diào)用free/delete,系統(tǒng)可能需要合并空閑內(nèi)存塊,這些會(huì)產(chǎn)生額外開(kāi)銷2、頻繁的在堆上申請(qǐng)和釋放內(nèi)存必然需要大量時(shí)間,降低了程序的運(yùn)行效率。對(duì)于一個(gè)需要頻繁申請(qǐng)和釋放內(nèi)存的程序來(lái)說(shuō),頻繁調(diào)用new/malloc申請(qǐng)內(nèi)存,delete/free釋放內(nèi)存都需要花費(fèi)系統(tǒng)時(shí)間,頻繁的調(diào)用必然會(huì)降低程序的運(yùn)行效率。3、經(jīng)常申請(qǐng)小塊內(nèi)存,會(huì)將物理內(nèi)存“切”得很碎,導(dǎo)致內(nèi)存碎片。申請(qǐng)內(nèi)存的順序并不是釋放內(nèi)存的順序,因此頻繁申請(qǐng)小塊內(nèi)存必然會(huì)導(dǎo)致內(nèi)存碎片,造成“有內(nèi)存但是申請(qǐng)不到大塊內(nèi)存”的現(xiàn)象。
內(nèi)存分配從上圖中,可以看出,應(yīng)用程序會(huì)調(diào)用glibc運(yùn)行時(shí)庫(kù)的malloc函數(shù)進(jìn)行內(nèi)存申請(qǐng),而malloc函數(shù)則會(huì)根據(jù)具體申請(qǐng)的內(nèi)存塊大小,根據(jù)實(shí)際情況最終從sys_brk或者sys_mmap_pgoff系統(tǒng)調(diào)用申請(qǐng)內(nèi)存,而大家都知道,跟os打交道,_性能損失_是毋庸置疑的。其次,glibc作為通用的運(yùn)行時(shí)庫(kù),malloc/free需要滿足各種場(chǎng)景需求,比如申請(qǐng)的字節(jié)大小不一,多線程訪問(wèn)等。
沒(méi)有比傳統(tǒng)malloc/free性能更優(yōu)的方案呢?答案是:有。在程序啟動(dòng)的時(shí)候,我們預(yù)分配特定數(shù)量的固定大小的塊,這樣每次申請(qǐng)的時(shí)候,就從預(yù)分配的塊中獲取,釋放的時(shí)候,將其放入預(yù)分配塊中以備下次復(fù)用,這就是所謂的_內(nèi)存池技術(shù)_,每個(gè)內(nèi)存池對(duì)應(yīng)特定場(chǎng)景,這樣的話,較傳統(tǒng)的傳統(tǒng)的malloc/free少了很多復(fù)雜邏輯,性能顯然會(huì)提升不少。
結(jié)合傳統(tǒng)malloc/free的缺點(diǎn),我們總結(jié)下使用內(nèi)存池方案的優(yōu)點(diǎn):1、比malloc/free進(jìn)行內(nèi)存申請(qǐng)/釋放的方式快2、不會(huì)產(chǎn)生或很少產(chǎn)生堆碎片3、可避免內(nèi)存泄漏
分類
根據(jù)分配出去的字節(jié)大小是否固定,分為
固定大小內(nèi)存池 和
可變大小內(nèi)存池 兩類。而可變大小內(nèi)存池,可分配任意大小的內(nèi)存池,比如ptmalloc、jemalloc以及google的tcmalloc。
固定大小內(nèi)存池,顧名思義,每次申請(qǐng)和釋放的內(nèi)存大小都是固定的。每次分配出去的內(nèi)存塊大小都是程序預(yù)先定義的值,而在釋放內(nèi)存塊時(shí)候,則簡(jiǎn)單的掛回內(nèi)存池鏈表即可。
?本文主要講的是固定大小的內(nèi)存池。?
原理
內(nèi)存池,重點(diǎn)在”池“字上,之所以稱之為內(nèi)存池,是在真正使用之前,先預(yù)分配一定數(shù)量、大小預(yù)設(shè)的塊,如果有新的內(nèi)存需求時(shí)候,就從內(nèi)存池中根據(jù)申請(qǐng)的內(nèi)存大小,分配一個(gè)內(nèi)存塊,若當(dāng)前內(nèi)存塊已經(jīng)被完全分配出去,則繼續(xù)申請(qǐng)一大塊,然后進(jìn)行分配。當(dāng)進(jìn)行內(nèi)存塊釋放的時(shí)候,則將其歸還內(nèi)存池,后面如果再有申請(qǐng)的話,則將其重新分配出去。
內(nèi)存池結(jié)構(gòu)圖上圖是本文所要設(shè)計(jì)的結(jié)構(gòu)圖,下面在具體的設(shè)計(jì)之前,我們先講下本內(nèi)存池的原理:
- 創(chuàng)建并初始化頭結(jié)點(diǎn)MemoryPool
- 通過(guò)MemoryPool進(jìn)行內(nèi)存分配,如果發(fā)現(xiàn)MemoryPool所指向的第一塊MemoryBlock或者現(xiàn)有MemoryPool沒(méi)有空閑內(nèi)存塊,則創(chuàng)建一個(gè)新的MemoryBlock初始化之后將其插入MemoryPool的頭
- 在內(nèi)存分配的時(shí)候,遍歷MemoryPool中的單鏈表MemoryBlock,根據(jù)地址判斷所要釋放的內(nèi)存屬于哪個(gè)MemoryBlock,然后根據(jù)偏移設(shè)置MemoryBlock的第一塊空閑塊索引,同時(shí)將空閑塊個(gè)數(shù) 1
上述只是一個(gè)簡(jiǎn)單的邏輯講解,比較宏觀,下面我們將通過(guò)圖解和代碼的方式來(lái)進(jìn)行講解。
設(shè)計(jì)
在上圖中,我們畫(huà)出了內(nèi)存池的結(jié)構(gòu)圖,從圖中,可以看出,有兩個(gè)結(jié)構(gòu)變量,分別為MemoryPool和MemoryBlock。下面我們將從數(shù)據(jù)結(jié)構(gòu)和接口兩個(gè)部分出發(fā),詳細(xì)講解內(nèi)存池的設(shè)計(jì)。
數(shù)據(jù)結(jié)構(gòu)
MemoryBlock
本文中所講述的內(nèi)存塊的分配和釋放都是通過(guò)該結(jié)構(gòu)進(jìn)行操作,下面是MemoryBlock的示例圖:
MemoryBlock在上圖中,Header存儲(chǔ)該MemoryBlock的內(nèi)存塊情況,比如可用的內(nèi)存塊索引、當(dāng)前MemoryBlock中可用內(nèi)存塊的個(gè)數(shù)等等。
定義如下所示:
struct?MemoryBlock?{
?unsigned?int?size;
?unsigned?int?free_size;
?unsigned?int?first_free;
?struct?MemoryBlock?*next;
?char?a_data[0];?
};
其中:
- size為MemoryBlock下內(nèi)存塊的個(gè)數(shù)
- free_size為MemoryBlock下空閑內(nèi)存塊的個(gè)數(shù)
- first_free為MemoryBlock中第一個(gè)空閑塊的索引
- next指向下一個(gè)MemoryBlock
- a_data是一個(gè)柔性數(shù)組
?柔性數(shù)組即數(shù)組大小待定的數(shù)組, C語(yǔ)言中結(jié)構(gòu)體的最后一個(gè)元素可以是大小未知的數(shù)組,也就是所謂的0長(zhǎng)度,所以我們可以用結(jié)構(gòu)體來(lái)創(chuàng)建柔性數(shù)組。它的主要用途是為了滿足需要變長(zhǎng)度的結(jié)構(gòu)體,為了解決使用數(shù)組時(shí)內(nèi)存的冗余和數(shù)組的越界問(wèn)題。?
MemoryPool
MemoryPool為內(nèi)存池的頭,里面定義了該內(nèi)存池的信息,比如本內(nèi)存池分配的固定對(duì)象的大小,第一個(gè)MemoryBlock等
struct?MemoryPool?{
?unsigned?int?obj_size;
?unsigned?int?init_size;
?unsigned?int?grow_size;
?MemoryBlock?*first_block;
};
其中:
- obj_size為內(nèi)存池分配的固定內(nèi)存塊的大小
- init_size初始化內(nèi)存池時(shí)候創(chuàng)建的內(nèi)存塊的個(gè)數(shù)
- grow_size當(dāng)初始化內(nèi)存塊使用完后,再次申請(qǐng)內(nèi)存塊時(shí)候的個(gè)數(shù)
- first_block指向第一個(gè)MemoryBlock
接口
memory_pool_create
MemoryPool?*memory_pool_create(unsigned?int?init_size,?
???????????????????????????????unsigned?int?grow_size,?
???????????????????????????????unsigned?int?size);
本函數(shù)用來(lái)創(chuàng)建一個(gè)MemoryPool,并對(duì)其進(jìn)行初始化,下面是參數(shù)說(shuō)明:
- init_size 表示第一個(gè)MemoryBlock中創(chuàng)建塊的個(gè)數(shù)
- grow_size 表示當(dāng)MemoryPool中沒(méi)有空閑塊可用,則創(chuàng)建一個(gè)新的MemoryBlock時(shí)其塊的個(gè)數(shù)
- size 為塊的大小(即每次分配相同大小的固定size)
memory_alloc
void?*memory_alloc(MemoryPool?*mp);
本函數(shù)用了從mp中申請(qǐng)一塊內(nèi)存返回
- mp 為MemoryPool類型指針,即內(nèi)存池的頭
- 如果內(nèi)存分配失敗,則返回NULL
memory_free
?void*?memory_free(MemoryPool?*mp,?void?*pfree);
本函數(shù)用來(lái)釋放內(nèi)存
- mp 為MemoryPool類型指針,即內(nèi)存池的頭
- pfree 為要釋放的內(nèi)存
free_memory_pool
void?free_memory_pool(MemoryPool?*mp);
本函數(shù)用來(lái)釋放內(nèi)存池
實(shí)現(xiàn)
在講解整個(gè)實(shí)現(xiàn)之前,我們先看先內(nèi)存池的詳細(xì)結(jié)構(gòu)圖。
初始化內(nèi)存池
MemoryPool是整個(gè)
內(nèi)存池的入口結(jié)構(gòu),該函數(shù)主要是用來(lái)創(chuàng)建MemoryPool對(duì)象,并使用參數(shù)對(duì)其內(nèi)部的成員變量進(jìn)行初始化。函數(shù)定義如下:
MemoryPool?*memory_pool_create(unsigned?int?init_size,?unsigned?int?grow_size,?unsigned?int?size)
{
?MemoryPool?*mp;
?mp?=?(MemoryPool*)malloc(sizeof(MemoryPool));
?mp->first_block?=?NULL;
?mp->init_size?=?init_size;
?mp->grow_size?=?grow_size;
?if(size?sizeof(unsigned?int))
??mp->obj_size?=?sizeof(unsigned?int);
?mp->obj_size?=?(size? ?(MEMPOOL_ALIGNMENT-1))?