分享一下管理進(jìn)程的 8 個(gè) Linux 命令
一般來(lái)說(shuō),應(yīng)用程序進(jìn)程的生命周期有三種主要狀態(tài):?jiǎn)?dòng)、運(yùn)行和停止。如果我們想成為稱職的管理員,每個(gè)狀態(tài)都可以而且應(yīng)該得到認(rèn)真的管理。這八個(gè)命令可用于管理進(jìn)程的整個(gè)生命周期。
啟動(dòng)進(jìn)程
啟動(dòng)進(jìn)程的最簡(jiǎn)單方法是在命令行中鍵入其名稱,然后按回車鍵。如果要啟動(dòng) Nginx web 服務(wù)器,請(qǐng)鍵入?nginx?。也許您只是想看看其版本。
1 2 3 4 | alan@workstation:~$ nginx ? alan@workstation:~$ nginx -v nginx version: nginx/1.14.0 |
查看您的可執(zhí)行路徑
以上啟動(dòng)進(jìn)程的演示是假設(shè)可執(zhí)行文件位于您的可執(zhí)行路徑中。理解這個(gè)路徑是可靠地啟動(dòng)和管理進(jìn)程的關(guān)鍵。管理員通常會(huì)為他們想要的目的定制這條路徑。您可以使用?echo $PATH?查看您的可執(zhí)行路徑。
1 2 | alan@workstation:~$ echo $PATH /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin |
WHICH
使用?which?命令查看可執(zhí)行文件的完整路徑。
1 2 | alan@workstation:~$ which nginx /opt/nginx/bin/nginx |
我將使用流行的 web 服務(wù)器軟件 Nginx 作為我的例子。假設(shè)安裝了 Nginx。如果執(zhí)行?which nginx?的命令什么也不返回,那么是找不到 Nginx 了,因?yàn)樗凰阉髂付ǖ目蓤?zhí)行路徑。有三種方法可以補(bǔ)救一個(gè)進(jìn)程不能簡(jiǎn)單地通過(guò)名字啟動(dòng)的情況。首先是鍵入完整路徑 —— 雖然,我不情愿輸入全部路徑,您會(huì)嗎?
1 2 | alan@workstation:~$ /home/alan/web/prod/nginx/sbin/nginx -v nginx version: nginx/1.14.0 |
第二個(gè)解決方案是將應(yīng)用程序安裝在可執(zhí)行文件路徑中的目錄中。然而,這有時(shí)可能是辦不到的,特別是如果您沒(méi)有 root 權(quán)限。
第三個(gè)解決方案是更新您的可執(zhí)行路徑環(huán)境變量,包括要使用的特定應(yīng)用程序的安裝目錄。這個(gè)解決方案是與 shell 相關(guān)的。例如,Bash 用戶需要在他們的?.bashrc?文件中編輯?PATH=?行。
1 | PATH="$HOME/web/prod/nginx/sbin:$PATH" |
現(xiàn)在,重復(fù)您的?echo?和?which?命令或者嘗試檢查版本。容易多了!
1 2 3 4 5 6 7 8 | alan@workstation:~$ echo $PATH /home/alan/web/prod/nginx/sbin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin ? alan@workstation:~$ which nginx /home/alan/web/prod/nginx/sbin/nginx ? alan@workstation:~$ nginx -v ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? nginx version: nginx/1.14.0 |
保持進(jìn)程運(yùn)行
NOHUP
注銷或關(guān)閉終端時(shí),進(jìn)程可能不會(huì)繼續(xù)運(yùn)行。這種特殊情況可以通過(guò)在要使用?nohup?命令放在要運(yùn)行的命令前面讓進(jìn)程持續(xù)運(yùn)行。此外,附加一個(gè)&?符號(hào)將會(huì)把進(jìn)程發(fā)送到后臺(tái),并允許您繼續(xù)使用終端。例如,假設(shè)您想運(yùn)行?myprogram.sh?。
1 | nohup myprogram.sh & |
nohup?會(huì)返回運(yùn)行進(jìn)程的 PID。接下來(lái)我會(huì)更多地談?wù)?PID。
管理正在運(yùn)行的進(jìn)程
每個(gè)進(jìn)程都有一個(gè)唯一的進(jìn)程標(biāo)識(shí)號(hào) (PID) 。這個(gè)數(shù)字是我們用來(lái)管理每個(gè)進(jìn)程的。我們還可以使用進(jìn)程名稱,我將在下面演示。有幾個(gè)命令可以檢查正在運(yùn)行的進(jìn)程的狀態(tài)。讓我們快速看看這些命令。
PS
最常見的是?ps?命令。ps?的默認(rèn)輸出是當(dāng)前終端中運(yùn)行的進(jìn)程的簡(jiǎn)單列表。如下所示,第一列包含 PID。
1 2 3 4 | alan@workstation:~$ ps PID TTY ? ? ? ? ?TIME CMD 23989 pts/0 ? ?00:00:00 bash 24148 pts/0 ? ?00:00:00 ps |
我想看看我之前啟動(dòng)的 Nginx 進(jìn)程。為此,我告訴?ps?給我展示每一個(gè)正在運(yùn)行的進(jìn)程(-e)和完整的列表(-f)。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | alan@workstation:~$ ps -ef UID ? ? ? ?PID ?PPID ?C STIME TTY ? ? ? ? ?TIME CMD root ? ? ? ? 1 ? ? 0 ?0 Aug18 ? ? ? ? ?00:00:10 /sbin/init splash root ? ? ? ? 2 ? ? 0 ?0 Aug18 ? ? ? ? ?00:00:00 [kthreadd] root ? ? ? ? 4 ? ? 2 ?0 Aug18 ? ? ? ? ?00:00:00 [kworker/0:0H] root ? ? ? ? 6 ? ? 2 ?0 Aug18 ? ? ? ? ?00:00:00 [mm_percpu_wq] root ? ? ? ? 7 ? ? 2 ?0 Aug18 ? ? ? ? ?00:00:00 [ksoftirqd/0] root ? ? ? ? 8 ? ? 2 ?0 Aug18 ? ? ? ? ?00:00:20 [rcu_sched] root ? ? ? ? 9 ? ? 2 ?0 Aug18 ? ? ? ? ?00:00:00 [rcu_bh] root ? ? ? ?10 ? ? 2 ?0 Aug18 ? ? ? ? ?00:00:00 [migration/0] root ? ? ? ?11 ? ? 2 ?0 Aug18 ? ? ? ? ?00:00:00 [watchdog/0] root ? ? ? ?12 ? ? 2 ?0 Aug18 ? ? ? ? ?00:00:00 [cpuhp/0] root ? ? ? ?13 ? ? 2 ?0 Aug18 ? ? ? ? ?00:00:00 [cpuhp/1] root ? ? ? ?14 ? ? 2 ?0 Aug18 ? ? ? ? ?00:00:00 [watchdog/1] root ? ? ? ?15 ? ? 2 ?0 Aug18 ? ? ? ? ?00:00:00 [migration/1] root ? ? ? ?16 ? ? 2 ?0 Aug18 ? ? ? ? ?00:00:00 [ksoftirqd/1] alan ? ? 20506 20496 ?0 10:39 pts/0 ? ?00:00:00 bash alan ? ? 20520 ?1454 ?0 10:39 ? ? ? ? ?00:00:00 nginx: master process nginx alan ? ? 20521 20520 ?0 10:39 ? ? ? ? ?00:00:00 nginx: worker process alan ? ? 20526 20506 ?0 10:39 pts/0 ? ?00:00:00 man ps alan ? ? 20536 20526 ?0 10:39 pts/0 ? ?00:00:00 pager alan ? ? 20564 20496 ?0 10:40 pts/1 ? ?00:00:00 bash |
您可以在上面?ps?命令的輸出中看到 Nginx 進(jìn)程。這個(gè)命令顯示了將近 300 行,但是我在這個(gè)例子中縮短了它。可以想象,試圖處理 300 行過(guò)程信息有點(diǎn)混亂。我們可以將這個(gè)輸出輸送到?grep,過(guò)濾一下僅顯示 nginx。
1 2 3 | alan@workstation:~$ ps -ef |grep nginx alan ? ? 20520 ?1454 ?0 10:39 ? ? ? ? ?00:00:00 nginx: master process nginx alan ? ? 20521 20520 ?0 10:39 ? ? ? ? ?00:00:00 nginx: worker process |
確實(shí)更好了。我們可以很快看到,Nginx 有 20520 和 20521 的 PID。
PGREP
pgrep?命令更加簡(jiǎn)化單獨(dú)調(diào)用?grep?遇到的問(wèn)題。
1 2 3 | alan@workstation:~$ pgrep nginx 20520 20521 |
假設(shè)您在一個(gè)托管環(huán)境中,多個(gè)用戶正在運(yùn)行幾個(gè)不同的 Nginx 實(shí)例。您可以使用?-u?選項(xiàng)將其他人排除在輸出之外。
1 2 3 | alan@workstation:~$ pgrep -u alan nginx 20520 20521 |
PIDOF
另一個(gè)好用的是?pidof。此命令將檢查特定二進(jìn)制文件的 PID,即使另一個(gè)同名進(jìn)程正在運(yùn)行。為了建立一個(gè)例子,我將我的 Nginx 復(fù)制到第二個(gè)目錄,并以相應(yīng)的路徑前綴啟動(dòng)。在現(xiàn)實(shí)生活中,這個(gè)實(shí)例可能位于不同的位置,例如由不同用戶擁有的目錄。如果我運(yùn)行兩個(gè) Nginx 實(shí)例,則pidof?輸出顯示它們的所有進(jìn)程。
1 2 3 4 5 | alan@workstation:~$ ps -ef |grep nginx alan ? ? 20881 ?1454 ?0 11:18 ? ? ? ? ?00:00:00 nginx: master process ./nginx -p /home/alan/web/prod/nginxsec alan ? ? 20882 20881 ?0 11:18 ? ? ? ? ?00:00:00 nginx: worker process alan ? ? 20895 ?1454 ?0 11:19 ? ? ? ? ?00:00:00 nginx: master process nginx alan ? ? 20896 20895 ?0 11:19 ? ? ? ? ?00:00:00 nginx: worker process |
使用?grep?或?pgrep?將顯示 PID 數(shù)字,但我們可能無(wú)法辨別哪個(gè)實(shí)例是哪個(gè)。
1 2 3 4 5 | alan@workstation:~$ pgrep nginx 20881 20882 20895 20896 |
pidof?命令可用于確定每個(gè)特定 Nginx 實(shí)例的 PID。
1 2 3 4 5 | alan@workstation:~$ pidof /home/alan/web/prod/nginxsec/sbin/nginx 20882 20881 ? alan@workstation:~$ pidof /home/alan/web/prod/nginx/sbin/nginx 20896 20895 |
TOP
top?命令已經(jīng)有很久的歷史了,對(duì)于查看運(yùn)行進(jìn)程的細(xì)節(jié)和快速識(shí)別內(nèi)存消耗等問(wèn)題是非常有用的。其默認(rèn)視圖如下所示。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | top - 11:56:28 up 1 day, 13:37, ?1 user, ?load average: 0.09, 0.04, 0.03 Tasks: 292 total, ? 3 running, 225 sleeping, ? 0 stopped, ? 0 zombie %Cpu(s): ?0.1 us, ?0.2 sy, ?0.0 ni, 99.7 id, ?0.0 wa, ?0.0 hi, ?0.0 si, ?0.0 st ? KiB Mem : 16387132 total, 10854648 free, ?1859036 used, ?3673448 buff/cache KiB Swap: ? ? ? ?0 total, ? ? ? ?0 free, ? ? ? ?0 used. 14176540 avail Mem ? ? PID USER ? ? ?PR ?NI ? ?VIRT ? ?RES ? ?SHR S ?%CPU %MEM ? ? TIME+ COMMAND 17270 alan ? ? ?20 ? 0 3930764 247288 ?98992 R ? 0.7 ?1.5 ? 5:58.22 gnome-shell 20496 alan ? ? ?20 ? 0 ?816144 ?45416 ?29844 S ? 0.5 ?0.3 ? 0:22.16 gnome-terminal- 21110 alan ? ? ?20 ? 0 ? 41940 ? 3988 ? 3188 R ? 0.1 ?0.0 ? 0:00.17 top ? ? 1 root ? ? ?20 ? 0 ?225564 ? 9416 ? 6768 S ? 0.0 ?0.1 ? 0:10.72 systemd ? ? 2 root ? ? ?20 ? 0 ? ? ? 0 ? ? ?0 ? ? ?0 S ? 0.0 ?0.0 ? 0:00.01 kthreadd ? ? 4 root ? ? ? 0 -20 ? ? ? 0 ? ? ?0 ? ? ?0 I ? 0.0 ?0.0 ? 0:00.00 kworker/0:0H ? ? 6 root ? ? ? 0 -20 ? ? ? 0 ? ? ?0 ? ? ?0 I ? 0.0 ?0.0 ? 0:00.00 mm_percpu_wq ? ? 7 root ? ? ?20 ? 0 ? ? ? 0 ? ? ?0 ? ? ?0 S ? 0.0 ?0.0 ? 0:00.08 ksoftirqd/0 |
可以通過(guò)鍵入字母?s?和您喜歡的更新秒數(shù)來(lái)更改更新間隔。為了更容易監(jiān)控我們的示例 Nginx 進(jìn)程,我們可以使用?-p?選項(xiàng)并傳遞 PID 來(lái)調(diào)用?top。這個(gè)輸出要干凈得多。
1 2 3 4 5 6 7 8 9 10 11 12 13 | alan@workstation:~$ top -p20881 -p20882 -p20895 -p20896 ? Tasks: ? 4 total, ? 0 running, ? 4 sleeping, ? 0 stopped, ? 0 zombie %Cpu(s): ?2.8 us, ?1.3 sy, ?0.0 ni, 95.9 id, ?0.0 wa, ?0.0 hi, ?0.0 si, ?0.0 st ? KiB Mem : 16387132 total, 10856008 free, ?1857648 used, ?3673476 buff/cache KiB Swap: ? ? ? ?0 total, ? ? ? ?0 free, ? ? ? ?0 used. 14177928 avail Mem ? ? PID USER ? ? ?PR ?NI ? ?VIRT ? ?RES ? ?SHR S ?%CPU %MEM ? ? TIME+ COMMAND 20881 alan ? ? ?20 ? 0 ? 12016 ? ?348 ? ? ?0 S ? 0.0 ?0.0 ? 0:00.00 nginx 20882 alan ? ? ?20 ? 0 ? 12460 ? 1644 ? ?932 S ? 0.0 ?0.0 ? 0:00.00 nginx 20895 alan ? ? ?20 ? 0 ? 12016 ? ?352 ? ? ?0 S ? 0.0 ?0.0 ? 0:00.00 nginx 20896 alan ? ? ?20 ? 0 ? 12460 ? 1628 ? ?912 S ? 0.0 ?0.0 ? 0:00.00 nginx |
在管理進(jìn)程,特別是終止進(jìn)程時(shí),正確確定 PID 是非常重要。此外,如果以這種方式使用?top,每當(dāng)這些進(jìn)程中的一個(gè)停止或一個(gè)新進(jìn)程開始時(shí),top?都需要被告知有新的進(jìn)程。
終止進(jìn)程
KILL
有趣的是,沒(méi)有?stop?命令。在 Linux 中,有?kill?命令。kill?用于向進(jìn)程發(fā)送信號(hào)。最常用的信號(hào)是“終止”(SIGTERM)或“殺死”(SIGKILL)。然而,還有更多。下面是一些例子。完整的列表可以用?kill -L?顯示。
1 2 3 4 | ?1) SIGHUP? ? ? ?2) SIGINT? ? ? ?3) SIGQUIT ? ? ?4) SIGILL? ? ? ?5) SIGTRAP ?6) SIGABRT ? ? ?7) SIGBUS? ? ? ?8) SIGFPE? ? ? ?9) SIGKILL ? ? 10) SIGUSR1 11) SIGSEGV ? ? 12) SIGUSR2 ? ? 13) SIGPIPE ? ? 14) SIGALRM ? ? 15) SIGTERM ? |
注意第 9 號(hào)信號(hào)是?SIGKILL,通常,我們會(huì)發(fā)出比如?kill -9 20896?這樣的命令。默認(rèn)信號(hào)是 15,這是?SIGTERM。請(qǐng)記住,許多應(yīng)用程序都有自己的停止方法。Nginx 使用?-s?選項(xiàng)傳遞信號(hào),如?stop?或?reload。通常,我更喜歡使用應(yīng)用程序的特定方法來(lái)停止操作。然而,我將演示用?kill?命令來(lái)停止 Nginx 進(jìn)程 20896,然后用?pgrep?確認(rèn)它已經(jīng)停止。PID 20896 就不再出現(xiàn)。
1 2 3 4 5 6 7 | alan@workstation:~$ kill -9 20896 ? alan@workstation:~$ pgrep nginx 20881 20882 20895 22123 |
PKILL
命令?pkill?類似于?pgrep,因?yàn)樗梢园疵Q搜索。這意味著在使用?pkill?時(shí)必須非常小心。在我的 Nginx 示例中,如果我只想殺死一個(gè) Nginx 實(shí)例,我可能不會(huì)選擇使用它。我可以將 Nginx 選項(xiàng)?-s stop?傳遞給特定的實(shí)例來(lái)消除它,或者我需要使用?grep?來(lái)過(guò)濾整個(gè)?ps?輸出。
1 2 | /home/alan/web/prod/nginx/sbin/nginx -s?stop /home/alan/web/prod/nginxsec/sbin/nginx -s stop |
如果我想使用?pkill,我可以包括?-f?選項(xiàng),讓?pkill?過(guò)濾整個(gè)命令行參數(shù)。這當(dāng)然也適用于?pgrep。所以,在執(zhí)行?pkill -f?之前,首先我可以用?pgrep -a?確認(rèn)一下。
1 2 3 4 5 | alan@workstation:~$ pgrep -a nginx 20881 nginx: master process ./nginx -p /home/alan/web/prod/nginxsec 20882 nginx: worker process 20895 nginx: master process nginx 20896 nginx: worker process |
我也可以用?pgrep -f?縮小我的結(jié)果。pkill?使用相同參數(shù)會(huì)停止該進(jìn)程。
1 2 3 4 | alan@workstation:~$ pgrep -f nginxsec 20881 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? alan@workstation:~$ pkill -f nginxsec |
pgrep(尤其是?pkill)要記住的關(guān)鍵點(diǎn)是,您必須始終確保搜索結(jié)果準(zhǔn)確性,這樣您就不會(huì)無(wú)意中影響到錯(cuò)誤的進(jìn)程。
大多數(shù)這些命令都有許多命令行選項(xiàng),所以我總是建議閱讀每一個(gè)命令的?man 手冊(cè)頁(yè)。雖然大多數(shù)這些命令都存在于 Linux、Solaris 和 BSD 等平臺(tái)上,但也有一些不同之處。在命令行工作或編寫腳本時(shí),始終測(cè)試并隨時(shí)準(zhǔn)備根據(jù)需要進(jìn)行更正。