Linux下的多進(jìn)程編程

時(shí)間：2018-07-11 12:00:01

關(guān)鍵字： Linux 進(jìn)程

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

(一) 理解Linux下進(jìn)程的結(jié)構(gòu)

Linux下一個(gè)進(jìn)程在內(nèi)存里有三部份的數(shù)據(jù)，就是“數(shù)據(jù)段”，“堆棧段”和“代碼段”，其實(shí)學(xué)過匯編語言的人一定知道，一般的CPU象I386，都有上述三種段寄存器，以方便操作系統(tǒng)的運(yùn)行?！按a段”，顧名思義，就是存放了程序代碼的數(shù)據(jù)，假如機(jī)器中有數(shù)個(gè)進(jìn)程運(yùn)行相同的一個(gè)程序，那么它們就可以使用同一

個(gè)代碼段。

堆棧段存放的就是子程序的返回地址、子程序的參數(shù)以及程序的局部變量。而數(shù)據(jù)段則存放程序的全局變量，常數(shù)以及動(dòng)態(tài)數(shù)據(jù)分配的數(shù)據(jù)空間(比如用malloc之類的函數(shù)取得的空間)。這其中有許多細(xì)節(jié)問題，這里限于篇幅就不多介紹了。系統(tǒng)如果同時(shí)運(yùn)行數(shù)個(gè)相同的程序，它們之間就不能使用同一個(gè)堆棧段和數(shù)據(jù) 段。

(二) 如何使用fork

在Linux下產(chǎn)生新的進(jìn)程的系統(tǒng)調(diào)用就是fork函數(shù)，這個(gè)函數(shù)名是英文中“分叉”的意思。為什么取這個(gè)名字呢？因?yàn)橐粋€(gè)進(jìn)程在運(yùn)行中，如果使用了fork，就產(chǎn)生了另一個(gè)進(jìn)程，于是進(jìn)程就“分叉”了，所以這個(gè)名字取得很形象。下面就看看如何具體使用fork，這段程序演示了使用fork的基本框架：

void main(){

int i;

if ( fork() == 0 ) {

/* 子進(jìn)程程序 */

for ( i = 1; i < 1000; i )

printf("This is child process\n");

}

else {

/* 父進(jìn)程程序*/

for ( i = 1; i < 1000; i )

printf("This is process process\n");

}

程序運(yùn)行后，你就能看到屏幕上交替出現(xiàn)子進(jìn)程與父進(jìn)程各打印出的一千條信息了。如果程序還在運(yùn)行中，你用ps命令就能看到系統(tǒng)中有兩個(gè)它在運(yùn)行了。

那么調(diào)用這個(gè)fork函數(shù)時(shí)發(fā)生了什么呢？一個(gè)程序一調(diào)用fork函數(shù)，系統(tǒng)就為一個(gè)新的進(jìn)程準(zhǔn)備了前述三個(gè)段，首先，系統(tǒng)讓新的進(jìn)程與舊的進(jìn)程使用同一個(gè)代碼段，因?yàn)樗鼈兊某绦蜻€是相同的，對(duì)于數(shù)據(jù)段和堆棧段，系統(tǒng)則復(fù)制一份給新的進(jìn)程，這樣，父進(jìn)程的所有數(shù)據(jù)都可以留給子進(jìn)程，但是，子進(jìn)程一旦開始運(yùn)行，雖然它繼承了父進(jìn)程的一切數(shù)據(jù)，但實(shí)際上數(shù)據(jù)卻已經(jīng)分開，相互之間不再有影響了，也就是說，它們之間不再共享任何數(shù)據(jù)了。而如果兩個(gè)進(jìn)程要共享什么數(shù)據(jù)的話，就要使用另一套函數(shù)(shmget，shmat，shmdt等)來操作?，F(xiàn)在，已經(jīng)是兩個(gè)進(jìn)程了，對(duì)于父進(jìn)程，fork函數(shù)返回了子程序的進(jìn)程號(hào)，而對(duì)于子程序，fork函數(shù)則返回零，這樣，對(duì)于程序，只要判斷fork函數(shù)的返回值，就知道自己是處于父進(jìn)程還是子進(jìn)程中。

讀者也許會(huì)問，如果一個(gè)大程序在運(yùn)行中，它的數(shù)據(jù)段和堆棧都很大，一次fork就要復(fù)制一次，那么fork 的系統(tǒng)開銷不是很大嗎？其實(shí)UNIX自有其解決的辦法，大家知道，一般CPU都是以“頁(yè)”為單位分配空間的，象INteL的CPU，其一頁(yè)在通常情況下是4K字節(jié)大小，而無論是數(shù)據(jù)段還是堆棧段都是由許多“頁(yè)”構(gòu)成的， fork函數(shù)復(fù)制這兩個(gè)段，只是“邏輯”上的，并非“物理”上的，也就是說，實(shí)際執(zhí)行fork時(shí)，物理空間上兩個(gè)進(jìn)程的數(shù)據(jù)段和堆棧段都還是共享著的，當(dāng)有一個(gè)進(jìn)程寫了某個(gè)數(shù)據(jù)時(shí)，這時(shí)兩個(gè)進(jìn)程之間的數(shù)據(jù)才有了區(qū)別，系統(tǒng)就將有區(qū)別的“頁(yè)”從物理上也分開。系統(tǒng)在空間上的開銷就可以達(dá)到最小。

一個(gè)小幽默：下面演示一個(gè)足以"搞死"Linux的小程序，其源代碼非常簡(jiǎn)單：

void main()

{

for(;;) fork();

}

這個(gè)程序什么也不做，就是死循環(huán)地fork，其結(jié)果是程序不斷產(chǎn)生進(jìn)程，而這些進(jìn)程又不斷產(chǎn)生新的進(jìn)程，很快，系統(tǒng)的進(jìn)程就滿了，系統(tǒng)就被這么多不斷產(chǎn)生的進(jìn)程"撐死了"。用不著是root，任何人運(yùn)行上述程序都足以讓系統(tǒng)死掉。哈哈，但這不是Linux不安全的理由，因?yàn)橹灰到y(tǒng)管理員足夠聰明，他(或她)就可以預(yù)先給每個(gè)用戶設(shè)置可運(yùn)行的最大進(jìn)程數(shù)，這樣，只要不是root，任何能運(yùn)行的進(jìn)程數(shù)也許不足系統(tǒng)總的能運(yùn)行和進(jìn)程數(shù)的十分之一，這樣，系統(tǒng)管理員就能對(duì)付上述惡意的程序了。

(三) 如何啟動(dòng)另一程序的執(zhí)行

下面我們來看看一個(gè)進(jìn)程如何來啟動(dòng)另一個(gè)程序的執(zhí)行。在Linux中要使用exec類的函數(shù)，exec類的函數(shù)不止一個(gè)，但大致相同，在Linux中，它們分別是：execl，execlp，execle，execv，execve和execvp，下面我只以execlp為例，其它函數(shù)究竟與execlp有何區(qū)別，請(qǐng)通過manexec命令來了解它們的具體情況。

一個(gè)進(jìn)程一旦調(diào)用exec類函數(shù)，它本身就“死亡”了，系統(tǒng)把代碼段替換成新的程序的代碼，廢棄原有的數(shù)據(jù)段和堆棧段，并為新程序分配新的數(shù)據(jù)段與堆棧段，唯一留下的，就是進(jìn)程號(hào)，也就是說，對(duì)系統(tǒng)而言，還是同一個(gè)進(jìn)程，不過已經(jīng)是另一個(gè)程序了。(不過 exec類函數(shù)中有的還允許繼承環(huán)境變量之類的信息。)

那么如果我的程序想啟動(dòng)另一程序的執(zhí)行但自己仍想繼續(xù)運(yùn)行的話，怎么辦呢？那就是結(jié)合fork與exec的使用。下面一段代碼顯示如何啟動(dòng)運(yùn)行其它程序：

char command[256];

void main()

{

int rtn; /*子進(jìn)程的返回?cái)?shù)值*/

while(1) {

/* 從終端讀取要執(zhí)行的命令 */

printf( ">" );

fgets( command, 256, stdin );

command[strlen(command)-1] = 0;

if ( fork() == 0 ) {

/* 子進(jìn)程執(zhí)行此命令 */

execlp( command, command );

/* 如果exec函數(shù)返回，表明沒有正常執(zhí)行命令，打印錯(cuò)誤信息*/

perror( command );

exit( errorno );

}

else {

/* 父進(jìn)程，等待子進(jìn)程結(jié)束，并打印子進(jìn)程的返回值 */

wait ( &rtn );

printf( " child process return %d\n",. rtn );

}

此程序從終端讀入命令并執(zhí)行之，執(zhí)行完成后，父進(jìn)程繼續(xù)等待從終端讀入命令。熟悉DOS和WINDOWS系統(tǒng)調(diào)用的朋友一定知道DOS/WINDOWS也有exec類函數(shù)，其使用方法是類似的，但DOS/WINDOWS還有spawn類函數(shù)，因?yàn)镈OS是單任務(wù)的系統(tǒng)，它只能將“父進(jìn)程”駐留在機(jī)器內(nèi)再執(zhí)行“子進(jìn)程”，這就是spawn類的函數(shù)。 WIN32已經(jīng)是多任務(wù)的系統(tǒng)了，但還保留了spawn類函數(shù)，WIN32中實(shí)現(xiàn)spawn函數(shù)的方法同前述UNIX中的方法差不多，開設(shè)子進(jìn)程后父進(jìn)程等待子進(jìn)程結(jié)束后才繼續(xù)運(yùn)行。UNIX在其一開始就是多任務(wù)的系統(tǒng)，所以從核心角度上講不需要spawn類函數(shù)。

另外，有一個(gè)更簡(jiǎn)單的執(zhí)行其它程序的函數(shù)system，它是一個(gè)較高層的函數(shù)，實(shí)際上相當(dāng)于在SHELL環(huán)境下執(zhí)行一條命令，而exec類函數(shù)則是低層的系統(tǒng)調(diào)用。

(四) Linux的進(jìn)程與Win32的進(jìn)程/線程有何區(qū)別

熟悉WIN32編程的人一定知道，WIN32的進(jìn)程管理方式與UNIX上有著很大區(qū)別，在UNIX里，只有進(jìn)程的概念，但在WIN32里卻還有一個(gè)“線程”的概念，那么UNIX和WIN32在這里究竟有著什么區(qū)別呢？

UNIX里的fork是七十年代UNIX早期的開發(fā)者經(jīng)過長(zhǎng)期在理論和實(shí)踐上的艱苦探索后取得的成果，一方面，它使操作系統(tǒng)在進(jìn)程管理上付出了最小的代價(jià)，另一方面，又為程序員提供了一個(gè)簡(jiǎn)潔明了的多進(jìn)程方法。

WIN32里的進(jìn)程/線程是繼承自O(shè)S/2的。在WIN32里，“進(jìn)程”是指一個(gè)程序，而“線程”是一個(gè)“進(jìn)程” 里的一個(gè)執(zhí)行“線索”。從核心上講，WIN32的多進(jìn)程與UNIX并無多大的區(qū)別，在WIN32里的線程才相當(dāng)于UNIX 的進(jìn)程，是一個(gè)實(shí)際正在執(zhí)行的代碼。但是，WIN32里同一個(gè)進(jìn)程里各個(gè)線程之間是共享數(shù)據(jù)段的。這才是與 UNIX的進(jìn)程最大的不同。

下面這段程序顯示了WIN32下一個(gè)進(jìn)程如何啟動(dòng)一個(gè)線程：(請(qǐng)注意，這是個(gè)終端方式程序，沒有圖形界面 )

int g;

DWORD WINAPI ChildProcess( LPVOID lpParameter ){

int i;

for ( i = 1; i < 1000; i ) {

g ;

printf( "This is Child Thread: %d\n", g );

}

ExitThread( 0 );

};

void main()

{

int threadID;

int i;

g = 0;

CreateThread( NULL, 0, ChildProcess, NULL, 0, &threadID );

for ( i = 1; i < 1000; i ) {

g ;

printf( "This is Parent Thread: %d\n", g );

}

在WIN32下，使用CreateThread函數(shù)創(chuàng)建線程，與UNIX不同，線程不是從創(chuàng)建處開始運(yùn)行的，而是由 CreateThread指定一個(gè)函數(shù)，線程就從那個(gè)函數(shù)處開始運(yùn)行。此程序同前面的UNIX程序一樣，由兩個(gè)線程各打印1000條信息。threadID是子線程的線程號(hào)，另外，全局變量g是子線程與父線程共享的，這就是與UNIX最大的不同之處。大家可以看出，WIN32的進(jìn)程/線程要比UNIX復(fù)雜，在UNIX里要實(shí)現(xiàn)類似WIN32的線程并不難，只要fork以后，讓子進(jìn)程調(diào)用ThreadProc函數(shù)，并且為全局變量開設(shè)共享數(shù)據(jù)區(qū)就行了，但在WIN32下就無法實(shí)現(xiàn)類似fork的功能了。所以現(xiàn)在WIN32下的C語言編譯器所提供的庫(kù)函數(shù)雖然已經(jīng)能兼容大多數(shù)UNIX的庫(kù)函數(shù)，但卻仍無法實(shí)現(xiàn)fork。

對(duì)于多任務(wù)系統(tǒng)，共享數(shù)據(jù)區(qū)是必要的，但也是一個(gè)容易引起混亂的問題，在WIN32下，一個(gè)程序員很容易忘記線程之間的數(shù)據(jù)是共享的這一情況，一個(gè)線程修改過一個(gè)變量后，另一個(gè)線程卻又修改了它，結(jié)果引起程序出問題。但在UNIX下，由于變量本來并不共享，而由程序員來顯式地指定要共享的數(shù)據(jù)，使程序變得更清晰與安全。

Linux還有自己的一個(gè)函數(shù)叫clONe，這個(gè)函數(shù)是其它UNIX所沒有的，而且通常的Linux也并不提供此函數(shù)(要使用此函數(shù)需自己重新編譯內(nèi)核，并設(shè)置CLONE_ACTUALLY_WORKS_OK選項(xiàng))，clone函數(shù)提供了更多的創(chuàng)建新進(jìn)程的功能，包括象完全共享數(shù)據(jù)段這樣的功能。

至于WIN32的“進(jìn)程”概念，其含義則是“應(yīng)用程序”，也就是相當(dāng)于UNIX下的exec了。

維珍