分享一種你可能不知道的bug定位方法
嵌入式Linux開發(fā)中,使用gdb對(duì)core文件進(jìn)行調(diào)試是一種有效的定位程序崩潰的方法。這種方法我們?cè)谥暗奈恼轮幸灿泻?jiǎn)單提過:嵌入式段錯(cuò)誤的3種調(diào)試方法匯總!
有些知識(shí),在沒用到之前,可以簡(jiǎn)單地進(jìn)行了解。實(shí)際用的時(shí)候,再去詳細(xì)地學(xué)習(xí)。最近我在實(shí)際工作中使用了gdb對(duì)core文件進(jìn)行調(diào)試,遇到了一些問題,總結(jié)出來分享給大家。
本文我們來分享幾點(diǎn):
-
什么是core文件?
-
前臺(tái)進(jìn)程如何生成core文件?
-
后臺(tái)進(jìn)程如何生成core文件?
-
如何調(diào)試core文件?
-
崩潰棧有用信息有限的可能原因?
什么是core文件?
在Linux下,一個(gè)程序崩潰時(shí),它一般會(huì)在指定目錄下生成一個(gè)core文件。core文件僅僅是一個(gè)內(nèi)存映象(同時(shí)加上調(diào)試信息),主要是用來調(diào)試的。
前臺(tái)進(jìn)程如何生成core文件?
實(shí)際中,我們的程序可以運(yùn)行于前臺(tái),也可以運(yùn)行于后臺(tái)。前、后臺(tái)運(yùn)行程序,生成core文件的方法有些不同。
前臺(tái)進(jìn)程:一般而言,用戶在shell中使用./執(zhí)行的程序都是前臺(tái)程序,前臺(tái)程序可由用戶自己控制,程序運(yùn)行過程中可與用戶進(jìn)行交互,其運(yùn)行優(yōu)先級(jí)相比后臺(tái)程序稍高,前臺(tái)程序運(yùn)行過程中用戶可使用ctrl+c來終止。
core文件配置基本命令:
ulimit -c # 查看core文件是否打開 ulimit -a # 也可以查看core文件是否打開 ulimit -c 0 # 禁止產(chǎn)生core文件 ulimit -c unlimited #設(shè)置core文件大小為不限制大小 ulimit -c 1024 #限制產(chǎn)生的core文件的大小不能超過1024KB
core文件的轉(zhuǎn)儲(chǔ)文件目錄和命名規(guī)則是可以設(shè)置的。
通過配置/proc/sys/kernel/core_uses_pid可以控制產(chǎn)生的core文件的文件名中是否添加pid作為擴(kuò)展;
通過配置/proc/sys/kernel/core_pattern可以設(shè)置格式化的core文件保存位置或文件名。
比如:
-
設(shè)置core文件的文件名中是否添加pid作為擴(kuò)展
echo "1" > /proc/sys/kernel/core_uses_pid
-
設(shè)置格式化的core文件保存位置或文件名
echo "/var/core-%e-%p-%t" > /proc/sys/kernel/core_pattern
參數(shù)%e、%p、%t表示的意思如:
%p - insert pid into filename 添加pid
%u - insert current uid into filename 添加當(dāng)前uid
%g - insert current gid into filename 添加當(dāng)前gid
%s - insert signal that caused the coredump into the filename 添加導(dǎo)致產(chǎn)生core的信號(hào)
%t - insert UNIX time that the coredump occurred into filename 添加core文件生成時(shí)的unix時(shí)間
%h - insert hostname where the coredump happened into filename 添加主機(jī)名
%e - insert coredumping executable name into filename 添加可執(zhí)行程序名
下面開始進(jìn)行實(shí)操:
查看core文件是否有打開,并設(shè)置core文件大小為不限制大?。?
設(shè)置格式化的core文件保存位置或文件名:
測(cè)試代碼:
#include int main(int argc, char **argv) { printf("==================segmentation fault test==================\n"); int *p = NULL;
*p = 1234; return 0;
}
運(yùn)行測(cè)試程序生成core文件:
后臺(tái)進(jìn)程如何生成core文件?
后臺(tái)程序生成core文件的方式與前臺(tái)程序不一樣。這我也是前幾天才知道的,我們?cè)O(shè)備上的程序設(shè)置為開機(jī)自啟動(dòng)運(yùn)行于后臺(tái),程序崩潰時(shí),竟然沒有生成core文件。后來查了些資料才知道后臺(tái)程序打開core文件的方式不同。
后臺(tái)進(jìn)程:后臺(tái)進(jìn)程又叫守護(hù)進(jìn)程,是運(yùn)行在系統(tǒng)后臺(tái)的一種特殊進(jìn)程,它獨(dú)立于控制終端并且周期性地執(zhí)行某種任務(wù)或等待處理某些發(fā)生的事件,后臺(tái)進(jìn)程最大的特點(diǎn)就是不受終端控制。一般用作系統(tǒng)服務(wù),比如日志管理進(jìn)程rsyslogd,數(shù)據(jù)庫服務(wù)myspld等,當(dāng)然也有一些用戶程序因需要被放在后臺(tái)運(yùn)行,一般被放在/etc/ini.d/文件夾中設(shè)置開機(jī)自啟動(dòng)。
ulimit命令是有作用范圍的,ulimit限制的是當(dāng)前shell進(jìn)程以及其派生的子進(jìn)程,所以通過ulimit修改coresize只是針對(duì)在當(dāng)前shell下啟動(dòng)的子進(jìn)程,而不能影響其他shell下啟動(dòng)的進(jìn)程。
所以當(dāng)我們配置完成生成core dump的參數(shù)后,在當(dāng)前shell直接執(zhí)行的進(jìn)程發(fā)生崩潰時(shí)可以正常生成core,而后臺(tái)開機(jī)自啟動(dòng)的程序則無法生成,而實(shí)際總,嵌入式應(yīng)用程序一般都是開機(jī)自啟動(dòng)的,并且發(fā)送崩潰的時(shí)機(jī)也是不可預(yù)測(cè)的,那么使用這種方式就不能正確的去捕捉coredump文件了。
后臺(tái)進(jìn)程要生成core dump文件需在進(jìn)程代碼中開啟core dump功能,如:
左右滑動(dòng)查看全部代碼>>>
// 公眾號(hào):嵌入式大雜燴 #include #include #include #include #define SHELL_CMD_CONF_CORE_FILE "echo /var/core-%e-%p-%t > /proc/sys/kernel/core_pattern" #define SHELL_CMD_DEL_CORE_FILE "rm -f /var/core*" static int enable_core_dump(void) { int ret = -1; int resource = RLIMIT_CORE; struct rlimit rlim; rlim.rlim_cur = 1 ? RLIM_INFINITY : 0;
rlim.rlim_max = 1 ? RLIM_INFINITY : 0;
system(SHELL_CMD_DEL_CORE_FILE); if (0 != setrlimit(resource, &rlim))
{ printf("setrlimit error!\n"); return -1;
} else {
system(SHELL_CMD_CONF_CORE_FILE); printf("SHELL_CMD_CONF_CORE_FILE\n"); return 0;
} return ret;
} int main(int argc, char **argv) {
enable_core_dump(); printf("==================segmentation fault test==================\n"); int *p = NULL;
*p = 1234; return 0;
}
讓程序開機(jī)運(yùn)行于后臺(tái):
在開發(fā)板/etc/init.d/目錄下新建文件S100Test:
#!/bin/sh cd /home
./test
設(shè)置程序開機(jī)自啟動(dòng)可參考我們