溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Linux后臺(tái)開(kāi)發(fā)中避免僵尸進(jìn)程的方法是什么

發(fā)布時(shí)間:2021-10-26 16:16:34 來(lái)源:億速云 閱讀:130 作者:iii 欄目:web開(kāi)發(fā)

這篇文章主要介紹“Linux后臺(tái)開(kāi)發(fā)中避免僵尸進(jìn)程的方法是什么”,在日常操作中,相信很多人在Linux后臺(tái)開(kāi)發(fā)中避免僵尸進(jìn)程的方法是什么問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”Linux后臺(tái)開(kāi)發(fā)中避免僵尸進(jìn)程的方法是什么”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!

一、什么是僵死進(jìn)程?

一般情況下,程序調(diào)用exit(包括_exit和_Exit,它們的區(qū)別這里不做解釋),它的絕大多數(shù)內(nèi)存和相關(guān)的資源已經(jīng)被內(nèi)核釋放掉,但是在進(jìn)程表中這個(gè)進(jìn)程項(xiàng)(entry)還保留著(進(jìn)程ID,退出狀態(tài),占用的資源等等),你可能會(huì)問(wèn),為什么這么麻煩,直接釋放完資源不就行了嗎?這是因?yàn)橛袝r(shí)它的父進(jìn)程想了解它的退出狀態(tài)。在子進(jìn)程退出但還未被其父進(jìn)程“收尸”之前,該子進(jìn)程就是僵死進(jìn)程,或者僵尸進(jìn)程。如果父進(jìn)程先于子進(jìn)程去世,那么子進(jìn)程將被init進(jìn)程收養(yǎng),這個(gè)時(shí)候init就是這個(gè)子進(jìn)程的父進(jìn)程。

所以一旦出現(xiàn)父進(jìn)程長(zhǎng)期運(yùn)行,而又沒(méi)有顯示調(diào)用wait或者waitpid,同時(shí)也沒(méi)有處理SIGCHLD信號(hào),這個(gè)時(shí)候init進(jìn)程就沒(méi)有辦法來(lái)替子進(jìn)程收尸,這個(gè)時(shí)候,子進(jìn)程就真的成了“僵尸”了。

二、僵死進(jìn)程與孤兒進(jìn)程的區(qū)別?

回答這個(gè)問(wèn)題很簡(jiǎn)單,就是爸爸(父進(jìn)程)和兒子(子進(jìn)程)誰(shuí)先死的問(wèn)題!

如果當(dāng)兒子還在世的時(shí)候,爸爸去世了,那么兒子就成孤兒了,這個(gè)時(shí)候兒子就會(huì)被init收養(yǎng),換句話說(shuō),init進(jìn)程充當(dāng)了兒子的爸爸,所以等到兒子去世的時(shí)候,就由init進(jìn)程來(lái)為其收尸。

如果當(dāng)爸爸還活著的時(shí)候,兒子死了,這個(gè)時(shí)候如果爸爸不給兒子收尸,那么兒子就會(huì)變成僵尸進(jìn)程。

三、僵死進(jìn)程的危害?

  1. 僵死進(jìn)程的PID還占據(jù)著,意味著海量的子進(jìn)程會(huì)占據(jù)滿進(jìn)程表項(xiàng),會(huì)使后來(lái)的進(jìn)程無(wú)法fork.

  2. 僵死進(jìn)程的內(nèi)核棧無(wú)法被釋放掉(1K 或者 2K大?。?,為啥會(huì)留著它的內(nèi)核棧,因?yàn)樵跅5淖畹投?,有著thread_info結(jié)構(gòu),它包含著 struct_task 結(jié)構(gòu),這里面包含著一些退出信息。

四、避免僵死進(jìn)程的方法

網(wǎng)上搜了下,總結(jié)有三種方方法:

① 程序中顯示的調(diào)用signal(SIGCHLD, SIG_IGN)來(lái)忽略SIGCHLD信號(hào),這樣子進(jìn)程結(jié)束后,由內(nèi)核來(lái)wai和釋放資源

② fork兩次,第一次fork的子進(jìn)程在fork完成后直接退出,這樣第二次fork得到的子進(jìn)程就沒(méi)有爸爸了,它會(huì)自動(dòng)被老祖宗init收養(yǎng),init會(huì)負(fù)責(zé)釋放它的資源,這樣就不會(huì)有“僵尸”產(chǎn)生了

③ 對(duì)子進(jìn)程進(jìn)行wait,釋放它們的資源,但是父進(jìn)程一般沒(méi)工夫在那里守著,等著子進(jìn)程的退出,所以,一般使用信號(hào)的方式來(lái)處理,在收到SIGCHLD信號(hào)的時(shí)候,在信號(hào)處理函數(shù)中調(diào)用wait操作來(lái)釋放他們的資源。

五、對(duì)每個(gè)避免僵死進(jìn)程方法的解析與總結(jié)

首先我們讓我們來(lái)看一個(gè)生成僵尸進(jìn)程的程序zombie.c如下:

#include <stdio.h>   #include <stdlib.h>  #include <unistd.h>    int main(int argc, const char *argv[])   {      int i;       pid_t pid;        for (i = 0; i < 10; i++) {           if ((pid = fork()) == 0)    /* child */               _exit(0);       }      sleep(10);         exit(EXIT_SUCCESS);  }

運(yùn)行程序,在10s睡眠期間使用ps查看進(jìn)程,你會(huì)發(fā)現(xiàn)有10個(gè)標(biāo)記為“defunct”的僵尸進(jìn)程:

Linux后臺(tái)開(kāi)發(fā)中避免僵尸進(jìn)程的方法是什么

接下來(lái)看第一種方法,程序avoid_zombie1.c如下:

#include <stdio.h>   #include <stdlib.h>  #include <signal.h>  #include <unistd.h>  #include <errno.h>    int main(int argc, const char *argv[])   {      pid_t pid;        if (SIG_ERR == signal(SIGCHLD, SIG_IGN)) {           perror("signal error");           _exit(EXIT_FAILURE);      }        while (1) {           if ((pid = fork()) == 0)    /* child */               _exit(0);       }        exit(EXIT_SUCCESS);  }

程序運(yùn)行期間通過(guò)ps命令的確沒(méi)有發(fā)現(xiàn)僵尸進(jìn)程的存在。

在man文檔中有這段話:

Note that even though the default disposition of SIGCHLD is "ignore", explicitly setting the disposition to SIG_IGN results in different treatment of zombie process children.

意思是說(shuō)盡管系統(tǒng)對(duì)信號(hào)SIGCHLD的默認(rèn)處理就是“ignore”,但是顯示的設(shè)置成SIG_IGN的處理方式在在這里會(huì)表現(xiàn)不同的處理方式(即子進(jìn)程結(jié)束后,資源由系統(tǒng)自動(dòng)收回,所以不會(huì)產(chǎn)生僵尸進(jìn)程),這是信號(hào)SIGCHLD與其他信號(hào)的不同之處。

在man文檔中同樣有這樣一段話:

The original POSIX standard left the behavior of setting SIGCHLD to SIG_IGN unspecified. 看來(lái)這個(gè)方法不是每個(gè)平臺(tái)都使用,尤其在一些老的系統(tǒng)中,兼容性不是很好,所以如果你在寫(xiě)一個(gè)可移植的程序的話,不推薦使用這個(gè)方法。

第二種方法,即通過(guò)兩次fork來(lái)避免僵尸進(jìn)程,我們來(lái)看一個(gè)例子avoid_zombie2.c:

#include <stdio.h>   #include <stdlib.h>  #include <signal.h>  #include <unistd.h>  #include <errno.h>    int main(int argc, const char *argv[])   {      pid_t pid;        while (1) {           if ((pid = fork()) == 0) {  /* child */               if ((pid = fork()) > 0)                   _exit(0);               sleep(1);               printf("grandchild, parent id = %ld\n",                               (long)getppid());              _exit(0);           }          if (waitpid(-1, NULL, 0) != pid) {               perror("waitpid error");               _exit(EXIT_FAILURE);          }      }        exit(EXIT_SUCCESS);  }

這的確是個(gè)有效的辦法,但是我想這個(gè)方法不適宜網(wǎng)絡(luò)并發(fā)服務(wù)器中,應(yīng)為fork的效率是不高的。

最后來(lái)看第三種方法, 也是最通用的方法

先看我們的測(cè)試程序avoid_zombie3.c

#include <stdio.h>   #include <stdlib.h>  #include <errno.h>  #include <string.h>   #include <libgen.h>  #include <signal.h>  #include <unistd.h>  #include <sys/wait.h>  #include <sys/types.h>      void avoid_zombies_handler(int signo)   {      pid_t pid;      int exit_status;       int saved_errno = errno;         while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0) {           /* do nothing */       }        errno = saved_errno;  }    int main(int argc, char *argv[])   {      pid_t pid;      int status;       struct sigaction child_act;          memset(&child_act, 0, sizeof(struct sigaction));       child_act.sa_handler = avoid_zombies_handler;      child_act.sa_flags = SA_RESTART | SA_NOCLDSTOP;       sigemptyset(&child_act.sa_mask);      if (sigaction(SIGCHLD, &child_act, NULL) == -1) {           perror("sigaction error");           _exit(EXIT_FAILURE);      }        while (1) {           if ((pid = fork()) == 0) {  /* child process */               _exit(0);           } else if (pid > 0) {        /* parent process */           }      }            _exit(EXIT_SUCCESS);  }

首先需要知道三點(diǎn):

1. 當(dāng)某個(gè)信號(hào)的信號(hào)處理函數(shù)被調(diào)用時(shí),該信號(hào)會(huì)被操作系統(tǒng)阻塞(默認(rèn)sa_flags不設(shè)置SA_NODEFER標(biāo)志)。

2.當(dāng)某個(gè)信號(hào)的信號(hào)處理函數(shù)被調(diào)用時(shí),該信號(hào)阻塞時(shí),該信號(hào)又多次發(fā)生,那么操作系統(tǒng)并不將它們排隊(duì),而是只保留第一次的,后續(xù)的被拋棄。

還有一點(diǎn)我們必須清楚的是

3. wait系列函數(shù)與信號(hào)SIGCHLD是沒(méi)有任何關(guān)系的,即wait系列函數(shù)并不是信號(hào)SIGCHLD驅(qū)動(dòng)的。

這個(gè)時(shí)候,肯定有人有疑問(wèn)了,既然會(huì)丟棄信號(hào),那怎么保證可以收回所有的僵尸進(jìn)程呢?

關(guān)于這個(gè)問(wèn)題,我們可以這樣來(lái)理解,當(dāng)子進(jìn)程結(jié)束時(shí),不管有沒(méi)有產(chǎn)生SIGCHLD信號(hào),或者子進(jìn)程產(chǎn)生了SIGCHLD信號(hào),而不管父進(jìn)程有沒(méi)有收到SIGCHLD信號(hào),這都與子進(jìn)程已經(jīng)終止這個(gè)事實(shí)無(wú)關(guān),就是說(shuō),子進(jìn)程終止與信號(hào)其實(shí)沒(méi)有任何關(guān)系,只是操作系統(tǒng)在子進(jìn)程終止時(shí)會(huì)發(fā)送信號(hào)SIGCHLD給父進(jìn)程,告之其子進(jìn)程終止的消息,這樣的話,父進(jìn)程就可以做相應(yīng)的操作了。而wait系列函數(shù)的目的就是收回子進(jìn)程終止時(shí)殘留在進(jìn)程列表中的信息,所以任何時(shí)候調(diào)用while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0)都可以收回所有的僵尸進(jìn)程信息(可以參考下面的程序)。但是這里為什么放在信號(hào)處理函數(shù)中處理了,這樣做的原因是:子進(jìn)程什么時(shí)候結(jié)束是個(gè)異步事件,而信號(hào)機(jī)制就是用來(lái)處理異步事件的,所以當(dāng)子進(jìn)程結(jié)束時(shí),可以迅速的收回其殘余信息,這樣系統(tǒng)中就不會(huì)積累大量的僵尸進(jìn)程了。

也可以這樣來(lái)理解:系統(tǒng)把所有的僵尸進(jìn)程串在一起形成一個(gè)僵尸進(jìn)程鏈表,而while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0)就是來(lái)清空這個(gè)鏈表的,直到waitpid()返回0,表明已經(jīng)沒(méi)有僵尸進(jìn)程了,或者返回-1,表明出錯(cuò)(當(dāng)錯(cuò)誤碼errno為ECHILD的時(shí)候同樣表明已經(jīng)不存在僵尸進(jìn)程了)。

了解了以上知識(shí)點(diǎn),就能理解為什么while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0)能夠回收所有的僵尸進(jìn)程了。

我們可以在上面的信號(hào)處理函數(shù)中加入相應(yīng)的打印信息:

static int num1 = 0   static int num2 = 0;   void avoid_zombies_handler(int signo)   {      pid_t pid;       int exit_status;       int saved_errno = errno;         printf("num1 = %d\n", ++num1);       while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0) {           printf("num2 = %d\n", ++num2);       }        errno = saved_errno;  }

打印的結(jié)果你會(huì)發(fā)現(xiàn),當(dāng)num1遞增1的時(shí)候,即每調(diào)用一次信號(hào)處理函數(shù),num2一般會(huì)遞增很多,即while循環(huán)了很多次,所以盡管有的SIGCHLD信號(hào)被丟棄了,但是我們不用擔(dān)心子進(jìn)程的殘余信息會(huì)收不回來(lái)。退出while循環(huán)時(shí),證明此時(shí)系統(tǒng)中已經(jīng)沒(méi)有僵尸進(jìn)程了,所以退出信號(hào)處理函數(shù)后,阻塞的唯一SIGCHLD信號(hào)會(huì)再次觸發(fā)該信號(hào)處理函數(shù),這樣我們就不用擔(dān)心了。我們不防做個(gè)最壞的打算,即之前的信號(hào)全部被丟棄了,只有最后一次的SIGCHLD信號(hào)被捕獲,從而觸發(fā)了信號(hào)處理函數(shù),這樣我們也不用擔(dān)心,因?yàn)閣hile循環(huán)會(huì)一次性收回全部的僵尸進(jìn)程信息,只是這次循環(huán)的次數(shù)要多得多罷了,當(dāng)然這只是假設(shè),一般系統(tǒng)不會(huì)出現(xiàn)這樣的情況(可以參考本文最后一個(gè)程序事例)。

為了證明wait系統(tǒng)函數(shù)與信號(hào)SIGCHLD沒(méi)有任何關(guān)系,我們可以做個(gè)簡(jiǎn)單的實(shí)驗(yàn),代碼如下:

#include <stdio.h>   #include <stdlib.h>   #include <unistd.h>   #include <sys/wait.h>   #include <sys/types.h>     int main(int argc, char *argv[])  {      int i;      pid_t pid;        for (i = 0; i < 5; i++) {           if ((pid = fork()) == 0)    /* child */               _exit(0);       }       sleep(10);       while (waitpid(-1, NULL, WNOHANG) > 0) {           /* do nothing */      }      sleep(10);        _exit(EXIT_SUCCESS);  }

以下是打印結(jié)果:

Linux后臺(tái)開(kāi)發(fā)中避免僵尸進(jìn)程的方法是什么

可以看到第一次sleep時(shí)系統(tǒng)中積累了5個(gè)僵尸進(jìn)程,第二次sleep時(shí),那5個(gè)僵尸進(jìn)程都被收回了。這個(gè)也明顯的看到了使用信號(hào)處理函數(shù)的優(yōu)勢(shì),即可以保證系統(tǒng)不會(huì)積累大量的僵尸進(jìn)程,它可以迅速的清理掉系統(tǒng)中的僵尸進(jìn)程。

到此,關(guān)于“Linux后臺(tái)開(kāi)發(fā)中避免僵尸進(jìn)程的方法是什么”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI