軟件Overlay:程序編寫(xiě)與調(diào)試
近幾年來(lái),SOC為了支持更大的硬件資源,及更精確的算法,很多應(yīng)用中的軟件程序代碼越來(lái)越大,但是售價(jià)卻要越來(lái)越便宜。各家廠商無(wú)不絞盡腦汁尋找降低成本的方法。
SRAM在SOC上,是一個(gè)快速但單位面積較大的組件,而單位面積較大代表成本較高。有一個(gè)降低成本的方法,是將程序代碼放在較慢但單位面積較小的flash或ROM上,當(dāng)系統(tǒng)需要執(zhí)行里面的某些程序代碼時(shí),才加載到內(nèi)存里執(zhí)行。
如果用商店來(lái)比喻的話,有一個(gè)小店租在都市里的黃金店面里,小店的展示柜很小,當(dāng)客人想要看架上沒(méi)有的商品時(shí),店員才從后面較大的倉(cāng)庫(kù)里,把商品拿出來(lái)放到展示柜上。這里的展示柜就像SRAM,昂貴但是有效率,倉(cāng)庫(kù)就像flash,便宜容積大但是存取較麻煩。
本文介紹的是軟件overlay的技術(shù)。除此之外,晶心科技也發(fā)展了硬件overlay的技術(shù),使得overlay執(zhí)行更快,操作更為簡(jiǎn)單。期望本文章能對(duì)使用者有所幫助,也希望讀者不吝指教提供您寶貴的意見(jiàn)。
1. 軟件Overlay技術(shù)介紹及操作
我們舉一個(gè)實(shí)際例子作為說(shuō)明,比方說(shuō)程序代碼的大小為210KB,RAM只有64KB,我們把RAM規(guī)劃成一格一格的大小,比方說(shuō)每4KB切成一塊。每4KB的大小可以在不同時(shí)間,更換成不同的程序代碼,可以重復(fù)利用RAM的空間。程序代碼儲(chǔ)存在ROM或flash里,只有在執(zhí)行之前會(huì)將函數(shù)從ROM或flash里動(dòng)態(tài)加載SRAM里。當(dāng)這個(gè)函數(shù)執(zhí)行完成,下一個(gè)函數(shù)要執(zhí)行前,再加載下一個(gè)函數(shù)。
值得注意的是,每一格SRAM里可加載的程序代碼是互斥的,比方說(shuō)有些不會(huì)同時(shí)使用的功能可以放在同一格里,比方說(shuō)mp3播放器,錄音和播放不會(huì)同時(shí)使用,就可以規(guī)劃重復(fù)利用同一格SRAM。
1.1 系統(tǒng)架構(gòu)
請(qǐng)參考圖表1,右邊長(zhǎng)方形是flash的內(nèi)容。0x0起1MB的空間,flash里存放了程序代碼和.data,及各個(gè)即將要被overlay的sections。
圖表1的左邊長(zhǎng)方形是SRAM規(guī)劃,地址從0x10000000開(kāi)始,我們切出三格提供overlay的SRAM,分別是0x10800000, 0x10804000及0x10808000。Overlay要規(guī)劃成幾格,或者每一格要切成多大塊,都是由使用者規(guī)劃。這里的SRAM與flash的地址是以通用型Andes FPGA開(kāi)發(fā)板作例子。讀者設(shè)計(jì)SOC時(shí),可以根據(jù)實(shí)際需求定義合理的地址。
程序執(zhí)行時(shí),0x10800000可以加載.ovly0或是.ovly1。0x10804000可以加載.ovly3或是.ovly2。0x10808000可以加載.ovly4或是.ovly5。
1.2 overlay的sag文件編寫(xiě)
圖表2是范例sag文件。Sag文件是Andes linker script generator所需要的輸入文件,執(zhí)行l(wèi)inker script generator后,輸出會(huì)產(chǎn)生GNU linker需要的linker script。詳細(xì)語(yǔ)法說(shuō)明可以參考Andes BSP v3.2.0 User manual第12章。
我們簡(jiǎn)單介紹圖表2的語(yǔ)法。第1行關(guān)鍵詞USER_SECTIONS表示后面接的這幾個(gè)sections都是由使用者自定義的sections。在后面的章節(jié),筆者會(huì)介紹如何把函數(shù)指定為這些自定義sections。
1.3 sag文件轉(zhuǎn)成linker script
如圖表3,在cygwin下執(zhí)行nds_ldsag軟件,將sw-ovly.sag轉(zhuǎn)成sw-nds32.ld文件。參數(shù)-o sw-nds32.ld為指定輸出文件名。nds_ldsag軟件可以在AndeSight 2.0.1 MCU或是BSP v3.2.0里取得。
1.4 程序里指定函數(shù)或變量放在自定義的sections
GNU ld (linker)可連結(jié)目標(biāo)文件為可執(zhí)行文件,排列上的最小單位是section,基本的sections為.text,.data及.bss這3個(gè)sections。為了達(dá)成分區(qū)overlay的功能,必須指定函數(shù)或是變量在自定義的sections上。在前一節(jié)里我們介紹了我們切出3個(gè)區(qū)域可以做overlay,分別是OVLY0(從0x10800000起),OVLY1(從0x10804000起)及OVLY2(從0x10808000起)三個(gè)區(qū)域。指定函數(shù)overlay0放在自定義section .overlay0里,要使用__attribute__((section(".overlay0")))語(yǔ)法,完整寫(xiě)法請(qǐng)參考圖表4a。圖表4b.是另外一種寫(xiě)法。
1.5 各sections的LMA與VMA
圖表6,是各個(gè)section的LMA和VMA。在這個(gè)表上,可以看.andes32_init到.sdata_w的LMA從0x0~0x29dc,這些section的LMA是連續(xù)的。.overlay0與.overlay1做overlay,所以有共同的VMA 0x10800000。同樣的,.overlay2和.overlay3,具有共同的VMA 0x10804000。.Overlay4和.overlay5,也有同樣的VMA 0x18008000。
1.6 overlay程序的加載
前面已經(jīng)介紹overlay section的sag文件寫(xiě)法。那么如何加載用戶想要用的overlay程序呢?
請(qǐng)看圖表7,這是overlay的執(zhí)行程序代碼。第5行OverlayLoad(0)表示載入section .overlay0。第6行OverlayLoad(4)表示載入section .overlay4。第7行在.overlay0被加載后,執(zhí)行overlay0(),可以正常工作。
再來(lái)我們介紹一下Overlay manager的程序運(yùn)作,Overlay manager即為圖表7中的函數(shù)OverlayLoad。圖表8列出Overlay manager代碼段,主要做了兩件事。一,修改mapped table _ovly_table,標(biāo)示overlay section是mapped或是unmapped。_ovly_table的用途是讓gdb知道目前加載的是哪一個(gè)section,使得gdb在debug時(shí),能自動(dòng)切換為正確的調(diào)試信息。
二,在程序執(zhí)行時(shí)期將函數(shù)加載,函數(shù)ovly_copy是一個(gè)memcpy函數(shù),將函數(shù)從LMA復(fù)制到VMA上。當(dāng)OverlayLoad(0)執(zhí)行完后,overlay0函數(shù)主體便存在于VMA上,可正確的執(zhí)行。
圖表9為_(kāi)ovly_table的內(nèi)容,要標(biāo)示每一個(gè)overlay section的vma, size, lma,和是否mapped。必須要注意的一點(diǎn),_ovly_table要位在一個(gè)lma等于vma的區(qū)域里。
2. 調(diào)試Overlay的程序
開(kāi)啟自動(dòng)overlay調(diào)試功能的gdb命令是overlay auto。當(dāng)overlay auto開(kāi)啟后,對(duì)于使用者來(lái)說(shuō),與一般程序的調(diào)試方法相同。
圖表8的最后一行_ovly_debug_event()的用途是讓gdb能把斷點(diǎn)加在正確的地址上,這一行要寫(xiě)在OverlayLoad的后面。必須要有這一行,gdb的自動(dòng)overlay調(diào)試才能正常。
當(dāng)用戶加一個(gè)斷點(diǎn)在被overlay的區(qū)域,gdb會(huì)在函數(shù)被加載之后(即為執(zhí)行完OverlayLoad),遇到_ovly_debug_event時(shí),自動(dòng)的把斷點(diǎn)加到overlay的地址上。
3. 參考數(shù)據(jù)
Overlay Commands https://sourceware.org/gdb/onlinedocs/gdb/Overlay-Commands.html
Automatic Overlay Debugging https://sourceware.org/gdb/onlinedocs/gdb/Automatic-Overlay-Debugging.html#Automatic-Overlay-Debugging
Debugging Programs That Use Overlays
http://davis.lbl.gov/Manuals/GDB/gdb_11.html
Andes BSP v3.2.0 User Manual
Chapter 12 “Linker Script Generation”