溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Container內(nèi)部進程監(jiān)控是怎樣的

發(fā)布時間：2021-12-20 09:22:59 來源：億速云閱讀：181 作者：iii 欄目：網(wǎng)絡管理

這篇文章主要介紹“Container內(nèi)部進程監(jiān)控是怎樣的”，在日常操作中，相信很多人在Container內(nèi)部進程監(jiān)控是怎樣的問題上存在疑惑，小編查閱了各式資料，整理出簡單好用的操作方法，希望對大家解答”Container內(nèi)部進程監(jiān)控是怎樣的”的疑惑有所幫助！接下來，請跟著小編一起來學習吧！

目前市場上的虛擬化技術種類很多，例如moby(docker)、LXC、RKT等等。在帶來方便應用部署和資源充分利用的好處的同時，如何監(jiān)控相應Container及其內(nèi)部應用進程成為運維人員不可避免遇到的新情況。UAV.Container從虛擬化技術的基礎原理和Linux操作系統(tǒng)的內(nèi)核特性出發(fā)，得到Container容器和內(nèi)部進程的各維度監(jiān)控數(shù)據(jù)，使無論是虛擬機或物理機運維人員，還是業(yè)務運維人員角度，都能得到合適的監(jiān)控維度。

虛擬化技術從基礎原理上主要是cgroups、namespace和file system的應用，而操作系統(tǒng)作為cgroup和namespace根節(jié)點，無論在container里啟動何種應用，從內(nèi)核角度上來說，肯定在操作系統(tǒng)有其一定的特征和表現(xiàn)形式。我們需要做的就是對這些特征做加工處理，以得到相應的監(jiān)控數(shù)據(jù)。

下面我們以docker技術舉例，其他虛擬化技術類似。

一、Container ID

Container ID是一個Container的唯一標識。從容器監(jiān)控的角度我們需要能得到該進程在哪個Container里運行。在操作系統(tǒng)層面，進程的cgroup的掛載情況就能有所體現(xiàn)。如圖所示，我們在一個ID為3411554ff684的Container內(nèi)部跑一個Tomcat進程。

Container內(nèi)部進程監(jiān)控是怎樣的

由于Container的pid namespace是操作系統(tǒng)的pid namespace的子namespace，那么該進程在操作系統(tǒng)級也應該有相應的pid，用docker top命令驗證一下：

Container內(nèi)部進程監(jiān)控是怎樣的

該容器內(nèi)進程在宿主機上的進程號為1848。接下來進入/proc/1848/cgroup下看看該進程的cgroup掛載情況

Container內(nèi)部進程監(jiān)控是怎樣的

從cgroup文件里清楚的顯示了實現(xiàn)了該容器的虛擬化技術、Container ID和此container的資源掛載路徑，對比一下這里面顯示的Container ID，和創(chuàng)建Container時的ID完全相同。這也驗證了通過掃描宿主機進程的cgroup信息可以獲得Container ID。這樣就將pid和Container ID做了關聯(lián)。

二、CPU

雖然cgroup管控了該cgroup下所有進程的CPU使用情況，但從操作系統(tǒng)的角度上，不論進程是否隸屬于某個子cgroup下，仍然是共用宿主機的CPU。所以監(jiān)控宿主機上該進程的CPU就能得到進程的CPU監(jiān)控指標。

Linux上常用的CPU監(jiān)控命令是top。top對CPU監(jiān)控的原理是在time1時刻獲取CPU從啟動時的累計總時間countAll1和busy總時間countBusy1，再到time2時刻獲取CPU總時間countAll2和busy總時間countBusy2，最后用busy的時間差值減去總時間的差值得到了在time1到time2這個時間段內(nèi)機器CPU的占用情況。也就是：

CPU占用率(%) = (countBusy2 - countBusy1)/(countAll2 - countAll1) * 100

進程同理，在兩個時刻分別得到每個進程的busy總時間countProcBusy1和countProcBusy2，則得到進程CPU占用率：

進程CPU占用率(%) = (countProcBusy2 - countProcBusy1)/(countProcAll2 - countProcAll1)*100

宿主機從啟動開始的CPU總時間片可以從/proc/stat下獲?。?/p>

Container內(nèi)部進程監(jiān)控是怎樣的

第一行是總的CPU使用情況，具體參數(shù)的意思：

所以，選擇當前為time1，3秒后為time2，countAll = user + nice + system + idle + iowait + irq + softirq + stealstolean + guest + guest_nice。countBusy為countAll減去idle的值，這樣上面第一個公式的所有需要的值就齊了，可以直接計算。

第二行、第三行是每個邏輯CPU的使用情況，這里記下有兩個邏輯CPU，CPU的邏輯核數(shù)與CPU顯示模式irix和solaris有關。

接下來是countProcBusy的計算，進程的CPU時間片位于/proc/$pid/stat下，如圖所示：

Container內(nèi)部進程監(jiān)控是怎樣的

這個文件里面體現(xiàn)了很多進程的相關信息。其中第14、15、16、17個參數(shù)與CPU有關。

所以，countProcBusy = utime + stime + cutime + cstime，該值包括其所有線程的cpu時間。而countProcAll2-countProcAll1=3s，通過兩個時刻的countProcBusy和countProcAll，進程CPU的占用率就能得到了。

其中需要注意的問題有兩點：

1) jiffies實際上指的是內(nèi)核時鐘使用的節(jié)拍總數(shù)，所以這里的jiffies需要換算成秒才能應用上面的除法公式。

2) 剛剛我們談到CPU顯示模式irix和solaris，簡單來說irix模式就是機器有N個邏輯CPU，CPU顯示上限就是N*100%，solaris模式就是不管機器有多少邏輯CPU，CPU顯示上限就是100%，而/proc/$pid/stat顯示的是計算了所有邏輯CPU時間的，所以兩種顯示方式意味著計算方法稍有差異，solaris模式的結(jié)果需要在上面進程CPU占用率公式基礎之上除以邏輯核數(shù)。

三、內(nèi)存

進程內(nèi)存的監(jiān)控有兩個維度的數(shù)據(jù)：一是物理占用內(nèi)存大小，二是進程內(nèi)存占用百分比的大小。

進程內(nèi)存占用率(%) = 進程物理內(nèi)存占用大小 / 宿主機總內(nèi)存大小 * 100

與CPU類似，/proc/$pid/status文件記錄了進程物理內(nèi)存使用情況，其中VmRSS即為該進程目前所占實際物理內(nèi)存的大小。

Container內(nèi)部進程監(jiān)控是怎樣的

/proc/meminfo文件下記錄了機器內(nèi)存占用情況，這個文件很長，截取其中的一部分展示一下，MemTotal就是宿主機總內(nèi)存大?。?/p>

Container內(nèi)部進程監(jiān)控是怎樣的

這樣，這個進程的物理內(nèi)存占用和機器總內(nèi)存就都得到了，相應的進程內(nèi)存的占用率也就得到了。

四、磁盤IO

磁盤IO獲取也很簡單，/proc/$pid/io已經(jīng)幫我們把這個進程的io情況記錄下來了，但是與CPU類似，io文件里存的也是該進程從啟動到現(xiàn)在的io總量，那么：

磁盤I/O(bytes/秒) = (time2時刻I/O – time1時刻I/O) / (time2 – time1)

Container內(nèi)部進程監(jiān)控是怎樣的

其中的read_bytes和write_bytes分別為該進程從啟動到目前為止的讀取字節(jié)數(shù)和寫入字節(jié)數(shù)，分別取2個時刻的值，根據(jù)上面的公式，就得到了該進程的磁盤IO。

五、端口號和連接數(shù)

由于Network Namespace對網(wǎng)絡做了隔離，所以如果進程在Container內(nèi)部運行，該進程的端口信息也應該是進程本身監(jiān)聽的端口號，而不是真正實際對外的端口，而Container內(nèi)外端口的映射機制是由應用的虛擬化技術本身控制的，這就避免不了與實現(xiàn)容器的虛擬化技術打交道了，那么問題就轉(zhuǎn)化成獲取容器內(nèi)進程本身監(jiān)聽的端口了。

/proc/$pid/net/tcp(tcp6,udp,udp6)就對端口號和連接數(shù)做了相應的歷史記錄。這些文件格式都類似，以tcp6舉例

Container內(nèi)部進程監(jiān)控是怎樣的

解釋幾個關鍵的key：

因為st = 0A代表listen，所以從其中挑選出st = 0A的數(shù)據(jù)，取出對應的inode號，這里這個inode號是socket號，則問題轉(zhuǎn)換為了這個進程是否還存在這個socket號代表的socket。在/proc/$pid/fd下有該進程所有的fd(file descriptor)，截取一段舉個例子。

Container內(nèi)部進程監(jiān)控是怎樣的

每個文件描述符后面的軟鏈實際上就是打開的文件，以socket開頭的就是這個進程打開的socket，在中括號中間的部分就是socket號。拿著這個socket號和上面tcp6里獲得的inode號做一個匹配，如果對應上，那么tcp6里的st = 0A的端口就是這個進程監(jiān)聽的。至于容器內(nèi)外端口的映射，這就需要根據(jù)應用的虛擬化技術的映射方法來獲取了。連接數(shù)計算與端口掃描是同理的，區(qū)別只在于需要對st = 01(establish)進行掃描計數(shù)累加。

到此，關于“Container內(nèi)部進程監(jiān)控是怎樣的”的學習就結(jié)束了，希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習，快去試試吧！若想繼續(xù)學習更多相關知識，請繼續(xù)關注億速云網(wǎng)站，小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權內(nèi)容。

上一篇新聞：
Apache ShardingSphere&UI遠程代碼執(zhí)行漏洞CVE-2020-1947的示例分析
下一篇新聞：
DBus基于可視化配置的日志結(jié)構化轉(zhuǎn)換方法是什么

猜你喜歡

AI
助
手

產(chǎn)品服務

地區(qū)劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網(wǎng)站二維碼