一個(gè)產(chǎn)品級(jí)MCU內(nèi)存管理方案
前面已經(jīng)將所有的硬件驅(qū)動(dòng)實(shí)現(xiàn),驗(yàn)證了硬件功能。但是每一個(gè)硬件都是單獨(dú)測(cè)試的,而且并不完善。下一步,我們需要對(duì)各個(gè)驅(qū)動(dòng)進(jìn)行整合完善。在整合之前,需要做一些基礎(chǔ)工作。其中之一就是實(shí)現(xiàn)內(nèi)存管理。什么叫內(nèi)存管理呢?為什么要做內(nèi)存管理?前面我們已經(jīng)大概了解了程序中的變量現(xiàn)在我們復(fù)習(xí)一下:局部變量、全局變量。
局部變量在進(jìn)入函數(shù)時(shí)從??臻g分配,退出函數(shù)前釋放。全局變量則在整個(gè)程序運(yùn)行其中一直使用。在程序編譯時(shí)就已經(jīng)分配了RAM空間。
那還有沒有第三種變量呢?可以說沒有。但是如果從生存周期上看,是有的:一個(gè)變量,在多個(gè)函數(shù)內(nèi)使用,但是又不是整個(gè)程序運(yùn)行期間都使用。或:一個(gè)變量,在一段時(shí)間內(nèi)使用,不是整個(gè)程序運(yùn)行生命周期都要用,但是用這個(gè)變量的函數(shù)會(huì)退出,然后重復(fù)進(jìn)入(用static定義的局部變量相當(dāng)于全局變量)
如果不使用動(dòng)態(tài)內(nèi)存管理,這樣的變量就只能定義為全局變量。如果將這些變量定義為指針,當(dāng)要使用時(shí),通過內(nèi)存管理分配,使用完后就釋放,這就叫做動(dòng)態(tài)分配。舉個(gè)實(shí)際的例子:
一個(gè)設(shè)備,有三種通信方式:串口,USB,網(wǎng)絡(luò),在通信過程每個(gè)通信方式需要1K RAM。經(jīng)過分析,3種通信方式不會(huì)同時(shí)使用。那么,如果不使用動(dòng)態(tài)內(nèi)存,則需要3K變量。如果使用內(nèi)存管理動(dòng)態(tài)分配,則只需要1K內(nèi)存就可以了。(這個(gè)只是舉例,如果簡單的系統(tǒng),確定三種方式不同時(shí)使用,可以直接復(fù)用內(nèi)存)
通信方式只是舉例,其實(shí)一個(gè)系統(tǒng)中,并不是所有設(shè)備都一直使用,如果使用動(dòng)態(tài)內(nèi)存管理,RAM的峰值用量將會(huì)大大減少。
內(nèi)存管理方案
不發(fā)明車輪,只優(yōu)化輪胎。
內(nèi)存管理是編程界的一個(gè)大話題,有很多經(jīng)典的方案。很多人也在嘗試寫新的方案。內(nèi)存分配模塊我們使用K&R C examples作為基礎(chǔ),然后進(jìn)行優(yōu)化。K&R是誰?就是寫《C程序設(shè)計(jì)語言》的兩個(gè)家伙。如果你沒有這本書,真遺憾。這本書的8.7章節(jié),<實(shí)例--存儲(chǔ)分配程序>,介紹了一種基本的存儲(chǔ)分配方法。代碼見alloc.c,整個(gè)代碼只有120行,而且結(jié)構(gòu)很美。
K&R 內(nèi)存管理方案分析
下面我們結(jié)合代碼分析這種內(nèi)存分配方案。代碼在wujique\Utilities\alloc文件夾。
內(nèi)存分析
-
初始化
在malloc函數(shù)中,如果是第一次調(diào)用就會(huì)初始化內(nèi)存鏈表。代碼原來是通過獲取堆地址,在堆上建立內(nèi)存池。我們把他改為更直觀的數(shù)組定義方式。內(nèi)存建立后的內(nèi)存視圖如下:
內(nèi)存分配的最小單元是:
typedef struct ALLOC_HDR
{
struct
{
struct ALLOC_HDR *ptr;
unsigned int size;/*本塊內(nèi)存容量*/
} s;
unsigned int align;
unsigned int pad;
} ALLOC_HDR;
這也就是內(nèi)存管理結(jié)構(gòu)體。在32位ARM系統(tǒng)上,這個(gè)結(jié)構(gòu)體是16字節(jié)。
-
第一次分配
每次分配,就是在一塊可以分配的空間尾部切割一塊出來,切割的大小是16字節(jié)的倍數(shù),而且會(huì)比需要的內(nèi)存多一塊頭。這塊頭在內(nèi)存釋放時(shí)需要使用。這一塊,也就是內(nèi)存管理的開銷。
-
分配釋放后
經(jīng)過多次分配釋放后,內(nèi)存可能如下圖,綠色是兩塊不連續(xù)的空閑塊,黃色是分配出去的塊。分配出去的塊,已經(jīng)不在內(nèi)存鏈表里面。
缺點(diǎn)
一般情況上面的代碼已經(jīng)能滿足需求。但是,有以下缺陷:
-
缺點(diǎn)1:容易碎片化
分配使用首次適應(yīng)法,也即是找到一塊大于等于要分配內(nèi)存的空閑塊,立刻進(jìn)行分配。這種方法的優(yōu)點(diǎn)是速度較快,缺點(diǎn)是容易內(nèi)存碎片化,分配時(shí)將很多大塊內(nèi)存切割成小內(nèi)存了。經(jīng)過多次分配后,很可能出現(xiàn)以下情況:
空閑內(nèi)存總量還有10K,但是卻被分散在10個(gè)塊內(nèi),而且沒有大容量的內(nèi)存塊,再申請(qǐng)2K內(nèi)存就出現(xiàn)失敗。如果對(duì)時(shí)間并不是那么敏感,我們可以使用最適合法,也即是遍歷空閑鏈表,查找一個(gè)最合適的內(nèi)存(大于要分配內(nèi)存且容量最小的空閑塊),減少大內(nèi)存被切碎的概率。需要注意的是,最適合法,除了會(huì)增加分配時(shí)間,不會(huì)減少內(nèi)存碎片數(shù)量,只是增加了空閑內(nèi)存的集中度。假設(shè)經(jīng)過多次分配后,空閑總量還是10K,也是分散在10個(gè)空閑塊,但是在這10個(gè)空閑塊中,會(huì)有5K的大塊,再申請(qǐng)2K的時(shí)候,就可以申請(qǐng)到2K內(nèi)存了。
-
缺點(diǎn)2:內(nèi)存消耗
內(nèi)存分配方案使用了一個(gè)結(jié)構(gòu)體,每次分配的最小單位就是這個(gè)結(jié)構(gòu)體的大小16字節(jié)。
typedef struct ALLOC_HDR
{
struct
{
struct ALLOC_HDR *ptr;
unsigned int size;/*本塊內(nèi)存容量*/
} s;
unsigned int align;
unsigned int pad;
} ALLOC_HDR;
一次分配,最少就是2個(gè)結(jié)構(gòu)體(一個(gè)結(jié)構(gòu)體用于管理分配出去的內(nèi)存,其余結(jié)構(gòu)體做為申請(qǐng)內(nèi)存),也就是32字節(jié)。如果代碼有大量小內(nèi)存申請(qǐng),例如申請(qǐng)100次8個(gè)字節(jié)
需求內(nèi)存:100X8=800字節(jié)實(shí)際消耗內(nèi)存100X32 = 3200字節(jié)利用率只有800/3200 =25%
如果內(nèi)存分配只有25%的使用率,對(duì)于小內(nèi)存嵌入式設(shè)備來說,是致命的方案缺陷。
如何解決呢?我們可以參考LINUX內(nèi)存分配方案SLAB。在LINUX中,有很多模塊需要申請(qǐng)固定大小的內(nèi)存(例如node結(jié)構(gòu)體),為了加快分配速度,系統(tǒng)會(huì)使用malloc先從大內(nèi)存池中申請(qǐng)一批node結(jié)構(gòu)體大小的內(nèi)存,作為一個(gè)slab內(nèi)存池。當(dāng)需要分配node結(jié)構(gòu)體時(shí),就直接從slab內(nèi)存池申請(qǐng)。同理,可以將內(nèi)存分配優(yōu)化為:需要小內(nèi)存時(shí),從大塊內(nèi)存池分配一塊大內(nèi)存,例如512,使用新算法管理,用于小內(nèi)存分配。當(dāng)512消耗盡,再從大內(nèi)存池申請(qǐng)第二塊512字節(jié)大內(nèi)存。當(dāng)小內(nèi)存釋放時(shí),判斷小塊內(nèi)存池是否為空,如為空,將小塊內(nèi)存池釋放回大內(nèi)存池。那如何管理這個(gè)小內(nèi)存池呢?
-
缺點(diǎn)3:沒有管理已分配內(nèi)存
內(nèi)存分配沒有將已分配內(nèi)存管理起來。我們可以對(duì)已分配內(nèi)存進(jìn)行統(tǒng)一管理:
1 已分配內(nèi)存在頭部有原來的結(jié)構(gòu)體,通過ptr指針,將所有已分配內(nèi)存連接在已分配鏈表上。2 利用不使用的align跟pad成員,記錄分配時(shí)間跟分配對(duì)象(記錄哪個(gè)驅(qū)動(dòng)申請(qǐng)的內(nèi)存)
通過上面優(yōu)化后,就可以統(tǒng)計(jì)已經(jīng)分配了多少內(nèi)存,還有多少空閑內(nèi)存,哪個(gè)模塊申請(qǐng)了最多內(nèi)存等數(shù)據(jù)。
使用
1 將代碼中的所有free改為為wjq_free,malloc改為wjq_malloc。
串口緩沖用了free跟malloc.fatfs的syscall.c 用了lwip的mem.h用了。
2 修改啟動(dòng)代碼, 棧跟堆改小。不用庫的malloc,堆可以完全不要。棧,還是要保留,但是不需要那么大,如果函數(shù)內(nèi)用到比較大的局部變量,改為動(dòng)態(tài)申請(qǐng)。
Stack_Size EQU 0x00002000
AREA STACK, NOINIT, READWRITE, ALIGN=3
Stack_Mem SPACE Stack_Size
__initial_sp
;Heap Configuration
;Heap Size (in Bytes);Heap_Size EQU 0x00000010
AREA HEAP, NOINIT, READWRITE, ALIGN=3
__heap_base
Heap_Mem SPACE Heap_Size
__heap_limit
3 內(nèi)存池開了80K,編譯不過
linking...
.\Objects\wujique.axf: Error: L6406E: No space in execution regions with .ANY selector matching dev_touchscreen.o(.bss).
.\Objects\wujique.axf: Error: L6406E: No space in execution regions with .ANY selector matching mcu_uart.o(.bss).
.\Objects\wujique.axf: Error: L6406E: No space in execution regions with .ANY selector matching etharp.o(.bss).
.\Objects\wujique.axf: Error: L6406E: No space in execution regions with .ANY selector matching mcu_can.o(.bss).
.\Objects\wujique.axf: Error: L6406E: No space in execution regions with .ANY selector matching netconf.o(.bss).
先把內(nèi)存池改小,編譯通過之后,分析 map文件,用了較多全局變量的統(tǒng)統(tǒng)改小或者改為動(dòng)態(tài)申請(qǐng)。分析map文件,還可以檢查還有沒有使用庫里面的malloc。
Code (inc. data) RO Data RW Data ZI Data Debug Object Name
124 32 0 4 40976 1658 alloc.o
16 0 0 0 0 2474 def.o
96 34 8640 4 0 1377 dev_dacsound.o
300 36 0 0 0 2751 dev_esp8266.o
204 38 0 1 0 1446 dev_key.o
436 98 0 10 16 3648 dev_touchkey.o
310 18 0 14 3000 3444 dev_touchscreen.o
932 18 0 4 0 15981 dhcp.o
0 0 0 0 3964 5933 dual_func_demo.o
280 14 12 0 200 5963 etharp.o
0 0 0 0 0 35864 ethernetif.o
0 0 0 0 0 3820 inet.o
98 0 0 0 0 2022 inet_chksum.o
0 0 0 0 0 4163 init.o
168 4 0 20 0 4763 ip.o
0 0 4 0 0 6463 ip_addr.o
386 4 0 0 0 4118 ip_frag.o
264 38 0 8 16 383399 main.o
84 8 0 0 0 1410 mcu_adc.o
60 32 0 1 68 1511 mcu_can.o
12 0 0 0 0 521 mcu_dac.o
128 14 0 0 0 2352 mcu_i2c.o
28 8 0 1 0 630 mcu_i2s.o
336 92 0 0 0 2689 mcu_rtc.o
430 86 0 1 0 4396 mcu_timer.o
1564 82 0 0 328 9072 mcu_uart.o
504 20 0 12 0 4510 mem.o
56 10 0 0 9463 3250 memp.o
120 14 0 0 0 1651 misc.o
0 0 0 0 56 1066 netconf.o
118 0 0 0 0 4267 netif.o
684 0 0 0 0 6971 pbuf.o
36 8 392 0 8192 824 startup_stm32f40_41xxx.o
alloc.o 內(nèi)存池dev_touchscreen.o 觸摸屏緩沖dual_func_demo.o USB,應(yīng)該能優(yōu)化memp.o 什么鬼?又一個(gè)內(nèi)存池?應(yīng)該是要優(yōu)化掉startup_stm32f40_41xxx.o 啟動(dòng)代碼,是棧跟堆用的RAM.
由于編譯器的優(yōu)化,項(xiàng)目沒用到的代碼沒有編譯進(jìn)來,上面的map數(shù)據(jù)并不完整。等后面我們做完全部測(cè)試程序,所有用到的代碼都會(huì)參與連接,到時(shí)還需要優(yōu)化一次。
總結(jié)
內(nèi)存管理暫時(shí)到此,等后面所有功能都完成后,再進(jìn)行一次優(yōu)化。如果對(duì)內(nèi)存分配時(shí)間有更高要求,可使用伙伴內(nèi)存分配法。大家可以參考《都江堰操作系統(tǒng)與嵌入式系統(tǒng)設(shè)計(jì)》,這個(gè)文檔里面的一些軟件設(shè)計(jì)策略非常好。http://www.djyos.com/?page_id=50
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!