您好,登錄后才能下訂單哦!
本篇內(nèi)容介紹了“怎么在Linux上用strace來(lái)理解系統(tǒng)調(diào)用”的有關(guān)知識(shí),在實(shí)際案例的操作過(guò)程中,不少人都會(huì)遇到這樣的困境,接下來(lái)就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
使用 strace 跟蹤用戶進(jìn)程和 Linux 內(nèi)核之間的交互。
系統(tǒng)調(diào)用是程序從內(nèi)核請(qǐng)求服務(wù)的一種編程方式,而 strace
是一個(gè)功能強(qiáng)大的工具,可讓你跟蹤用戶進(jìn)程與 Linux 內(nèi)核之間的交互。
要了解操作系統(tǒng)的工作原理,首先需要了解系統(tǒng)調(diào)用的工作原理。操作系統(tǒng)的主要功能之一是為用戶程序提供抽象機(jī)制。
操作系統(tǒng)可以大致分為兩種模式:
內(nèi)核模式:操作系統(tǒng)內(nèi)核使用的一種強(qiáng)大的特權(quán)模式
用戶模式:大多數(shù)用戶應(yīng)用程序運(yùn)行的地方 用戶大多使用命令行實(shí)用程序和圖形用戶界面(GUI)來(lái)執(zhí)行日常任務(wù)。系統(tǒng)調(diào)用在后臺(tái)靜默運(yùn)行,與內(nèi)核交互以完成工作。
系統(tǒng)調(diào)用與函數(shù)調(diào)用非常相似,這意味著它們都接受并處理參數(shù)然后返回值。唯一的區(qū)別是系統(tǒng)調(diào)用進(jìn)入內(nèi)核,而函數(shù)調(diào)用不進(jìn)入。從用戶空間切換到內(nèi)核空間是使用特殊的 trap 機(jī)制完成的。
通過(guò)使用系統(tǒng)庫(kù)(在 Linux 系統(tǒng)上又稱為 glibc),大部分系統(tǒng)調(diào)用對(duì)用戶隱藏了。盡管系統(tǒng)調(diào)用本質(zhì)上是通用的,但是發(fā)出系統(tǒng)調(diào)用的機(jī)制在很大程度上取決于機(jī)器(架構(gòu))。
本文通過(guò)使用一些常規(guī)命令并使用 strace
分析每個(gè)命令進(jìn)行的系統(tǒng)調(diào)用來(lái)探索一些實(shí)際示例。這些示例使用 Red Hat Enterprise Linux,但是這些命令運(yùn)行在其他 Linux 發(fā)行版上應(yīng)該也是相同的:
[root@sandbox ~]# cat /etc/redhat-releaseRed Hat Enterprise Linux Server release 7.7 (Maipo)[root@sandbox ~]#[root@sandbox ~]# uname -r3.10.0-1062.el7.x86_64[root@sandbox ~]#
首先,確保在系統(tǒng)上安裝了必需的工具。你可以使用下面的 rpm
命令來(lái)驗(yàn)證是否安裝了 strace
。如果安裝了,則可以使用 -V
選項(xiàng)檢查 strace
實(shí)用程序的版本號(hào):
[root@sandbox ~]# rpm -qa | grep -i stracestrace-4.12-9.el7.x86_64[root@sandbox ~]#[root@sandbox ~]# strace -Vstrace -- version 4.12[root@sandbox ~]#
如果沒(méi)有安裝,運(yùn)行命令安裝:
yum install strace
出于本示例的目的,在 /tmp
中創(chuàng)建一個(gè)測(cè)試目錄,并使用 touch
命令創(chuàng)建兩個(gè)文件:
[root@sandbox ~]# cd /tmp/[root@sandbox tmp]#[root@sandbox tmp]# mkdir testdir[root@sandbox tmp]#[root@sandbox tmp]# touch testdir/file1[root@sandbox tmp]# touch testdir/file2[root@sandbox tmp]#
(我使用 /tmp
目錄是因?yàn)槊總€(gè)人都可以訪問(wèn)它,但是你可以根據(jù)需要選擇另一個(gè)目錄。)
在 testdir
目錄下使用 ls
命令驗(yàn)證該文件已經(jīng)創(chuàng)建:
[root@sandbox tmp]# ls testdir/file1 file2[root@sandbox tmp]#
你可能每天都在使用 ls
命令,而沒(méi)有意識(shí)到系統(tǒng)調(diào)用在其下面發(fā)揮的作用。抽象地來(lái)說(shuō),該命令的工作方式如下:
命令行工具 -> 從系統(tǒng)庫(kù)(glibc)調(diào)用函數(shù) -> 調(diào)用系統(tǒng)調(diào)用
ls
命令內(nèi)部從 Linux 上的系統(tǒng)庫(kù)(即 glibc)調(diào)用函數(shù)。這些庫(kù)去調(diào)用完成大部分工作的系統(tǒng)調(diào)用。
如果你想知道從 glibc 庫(kù)中調(diào)用了哪些函數(shù),請(qǐng)使用 ltrace
命令,然后跟上常規(guī)的 ls testdir/
命令:
ltrace ls testdir/
如果沒(méi)有安裝 ltrace
,鍵入如下命令安裝:
yum install ltrace
大量的輸出會(huì)被堆到屏幕上;不必?fù)?dān)心,只需繼續(xù)就行。ltrace
命令輸出中與該示例有關(guān)的一些重要庫(kù)函數(shù)包括:
opendir("testdir/") = { 3 }readdir({ 3 }) = { 101879119, "." }readdir({ 3 }) = { 134, ".." }readdir({ 3 }) = { 101879120, "file1" }strlen("file1") = 5memcpy(0x1665be0, "file1\0", 6) = 0x1665be0readdir({ 3 }) = { 101879122, "file2" }strlen("file2") = 5memcpy(0x166dcb0, "file2\0", 6) = 0x166dcb0readdir({ 3 }) = nilclosedir({ 3 })
通過(guò)查看上面的輸出,你或許可以了解正在發(fā)生的事情。opendir
庫(kù)函數(shù)打開一個(gè)名為 testdir
的目錄,然后調(diào)用 readdir
函數(shù),該函數(shù)讀取目錄的內(nèi)容。最后,有一個(gè)對(duì) closedir
函數(shù)的調(diào)用,該函數(shù)將關(guān)閉先前打開的目錄。現(xiàn)在請(qǐng)先忽略其他 strlen
和 memcpy
功能。
你可以看到正在調(diào)用哪些庫(kù)函數(shù),但是本文將重點(diǎn)介紹由系統(tǒng)庫(kù)函數(shù)調(diào)用的系統(tǒng)調(diào)用。
與上述類似,要了解調(diào)用了哪些系統(tǒng)調(diào)用,只需將 strace
放在 ls testdir
命令之前,如下所示。 再次,一堆亂碼丟到了你的屏幕上,你可以按照以下步驟進(jìn)行操作:
[root@sandbox tmp]# strace ls testdir/execve("/usr/bin/ls", ["ls", "testdir/"], [/* 40 vars */]) = 0brk(NULL) = 0x1f12000<<< truncated strace output >>>write(1, "file1 file2\n", 13file1 file2) = 13close(1) = 0munmap(0x7fd002c8d000, 4096) = 0close(2) = 0exit_group(0) = ?+++ exited with 0 +++[root@sandbox tmp]#
運(yùn)行 strace
命令后屏幕上的輸出就是運(yùn)行 ls
命令的系統(tǒng)調(diào)用。每個(gè)系統(tǒng)調(diào)用都為操作系統(tǒng)提供了特定的用途,可以將它們大致分為以下幾個(gè)部分:
進(jìn)程管理系統(tǒng)調(diào)用
文件管理系統(tǒng)調(diào)用
目錄和文件系統(tǒng)管理系統(tǒng)調(diào)用
其他系統(tǒng)調(diào)用
分析顯示到屏幕上的信息的一種更簡(jiǎn)單的方法是使用 strace
方便的 -o
標(biāo)志將輸出記錄到文件中。在 -o
標(biāo)志后添加一個(gè)合適的文件名,然后再次運(yùn)行命令:
[root@sandbox tmp]# strace -o trace.log ls testdir/file1 file2[root@sandbox tmp]#
這次,沒(méi)有任何輸出干擾屏幕顯示,ls
命令如預(yù)期般工作,顯示了文件名并將所有輸出記錄到文件 trace.log
中。僅僅是一個(gè)簡(jiǎn)單的 ls
命令,該文件就有近 100 行內(nèi)容:
[root@sandbox tmp]# ls -l trace.log-rw-r--r--. 1 root root 7809 Oct 12 13:52 trace.log[root@sandbox tmp]#[root@sandbox tmp]# wc -l trace.log114 trace.log[root@sandbox tmp]#
讓我們看一下這個(gè)示例的 trace.log
文件的第一行:
execve("/usr/bin/ls", ["ls", "testdir/"], [/* 40 vars */]) = 0
該行的第一個(gè)單詞 execve
是正在執(zhí)行的系統(tǒng)調(diào)用的名稱。
括號(hào)內(nèi)的文本是提供給該系統(tǒng)調(diào)用的參數(shù)。
符號(hào) =
后的數(shù)字(在這種情況下為 0
)是 execve
系統(tǒng)調(diào)用的返回值。
現(xiàn)在的輸出似乎還不太嚇人,對(duì)吧。你可以應(yīng)用相同的邏輯來(lái)理解其他行。
現(xiàn)在,將關(guān)注點(diǎn)集中在你調(diào)用的單個(gè)命令上,即 ls testdir
。你知道命令 ls
使用的目錄名稱,那么為什么不在 trace.log
文件中使用 grep
查找 testdir
并查看得到的結(jié)果呢?讓我們?cè)敿?xì)查看一下結(jié)果的每一行:
[root@sandbox tmp]# grep testdir trace.logexecve("/usr/bin/ls", ["ls", "testdir/"], [/* 40 vars */]) = 0stat("testdir/", {st_mode=S_IFDIR|0755, st_size=32, ...}) = 0openat(AT_FDCWD, "testdir/", O_RDONLY|O_NONBLOCK|O_DIRECTORY|O_CLOEXEC) = 3[root@sandbox tmp]#
回顧一下上面對(duì) execve
的分析,你能說(shuō)一下這個(gè)系統(tǒng)調(diào)用的作用嗎?
execve("/usr/bin/ls", ["ls", "testdir/"], [/* 40 vars */]) = 0
你無(wú)需記住所有系統(tǒng)調(diào)用或它們所做的事情,因?yàn)槟憧梢栽谛枰獣r(shí)參考文檔。手冊(cè)頁(yè)可以解救你!在運(yùn)行 man
命令之前,請(qǐng)確保已安裝以下軟件包:
[root@sandbox tmp]# rpm -qa | grep -i man-pagesman-pages-3.53-5.el7.noarch[root@sandbox tmp]#
請(qǐng)記住,你需要在 man
命令和系統(tǒng)調(diào)用名稱之間添加 2
。如果使用 man man
閱讀 man
命令的手冊(cè)頁(yè),你會(huì)看到第 2 節(jié)是為系統(tǒng)調(diào)用保留的。同樣,如果你需要有關(guān)庫(kù)函數(shù)的信息,則需要在 man
和庫(kù)函數(shù)名稱之間添加一個(gè) 3
。
以下是手冊(cè)的章節(jié)編號(hào)及其包含的頁(yè)面類型:
1
:可執(zhí)行的程序或 shell 命令
2
:系統(tǒng)調(diào)用(由內(nèi)核提供的函數(shù))
3
:庫(kù)調(diào)用(在程序的庫(kù)內(nèi)的函數(shù))
4
:特殊文件(通常出現(xiàn)在 /dev
)
使用系統(tǒng)調(diào)用名稱運(yùn)行以下 man
命令以查看該系統(tǒng)調(diào)用的文檔:
man 2 execve
按照 execve
手冊(cè)頁(yè),這將執(zhí)行在參數(shù)中傳遞的程序(在本例中為 ls
)??梢詾?ls
提供其他參數(shù),例如本例中的 testdir
。因此,此系統(tǒng)調(diào)用僅以 testdir
作為參數(shù)運(yùn)行 ls
:
execve - execute program DESCRIPTION execve() executes the program pointed to by filename
下一個(gè)系統(tǒng)調(diào)用,名為 stat
,它使用 testdir
參數(shù):
stat("testdir/", {st_mode=S_IFDIR|0755, st_size=32, ...}) = 0
使用 man 2 stat
訪問(wèn)該文檔。stat
是獲取文件狀態(tài)的系統(tǒng)調(diào)用,請(qǐng)記住,Linux 中的一切都是文件,包括目錄。
接下來(lái),openat
系統(tǒng)調(diào)用將打開 testdir
。密切注意返回的 3
。這是一個(gè)文件描述符,將在以后的系統(tǒng)調(diào)用中使用:
openat(AT_FDCWD, "testdir/", O_RDONLY|O_NONBLOCK|O_DIRECTORY|O_CLOEXEC) = 3
到現(xiàn)在為止一切都挺好?,F(xiàn)在,打開 trace.log
文件,并轉(zhuǎn)到 openat
系統(tǒng)調(diào)用之后的行。你會(huì)看到 getdents
系統(tǒng)調(diào)用被調(diào)用,該調(diào)用完成了執(zhí)行 ls testdir
命令所需的大部分操作?,F(xiàn)在,從 trace.log
文件中用 grep
獲取 getdents
:
[root@sandbox tmp]# grep getdents trace.loggetdents(3, /* 4 entries */, 32768) = 112getdents(3, /* 0 entries */, 32768) = 0[root@sandbox tmp]#
getdents
的手冊(cè)頁(yè)將其描述為 “獲取目錄項(xiàng)”,這就是你要執(zhí)行的操作。注意,getdents
的參數(shù)是 3
,這是來(lái)自上面 openat
系統(tǒng)調(diào)用的文件描述符。
現(xiàn)在有了目錄列表,你需要一種在終端中顯示它的方法。因此,在日志中用 grep
搜索另一個(gè)用于寫入終端的系統(tǒng)調(diào)用 write
:
[root@sandbox tmp]# grep write trace.logwrite(1, "file1 file2\n", 13) = 13[root@sandbox tmp]#
在這些參數(shù)中,你可以看到將要顯示的文件名:file1
和 file2
。關(guān)于第一個(gè)參數(shù)(1
),請(qǐng)記住在 Linux 中,當(dāng)運(yùn)行任何進(jìn)程時(shí),默認(rèn)情況下會(huì)為其打開三個(gè)文件描述符。以下是默認(rèn)的文件描述符:
0
:標(biāo)準(zhǔn)輸入
1
:標(biāo)準(zhǔn)輸出
2
:標(biāo)準(zhǔn)錯(cuò)誤
因此,write
系統(tǒng)調(diào)用將在標(biāo)準(zhǔn)顯示(就是這個(gè)終端,由 1
所標(biāo)識(shí)的)上顯示 file1
和 file2
。
現(xiàn)在你知道哪個(gè)系統(tǒng)調(diào)用完成了 ls testdir/
命令的大部分工作。但是在 trace.log
文件中其它的 100 多個(gè)系統(tǒng)調(diào)用呢?操作系統(tǒng)必須做很多內(nèi)務(wù)處理才能運(yùn)行一個(gè)進(jìn)程,因此,你在該日志文件中看到的很多內(nèi)容都是進(jìn)程初始化和清理。閱讀整個(gè) trace.log
文件,并嘗試了解 ls
命令是怎么工作起來(lái)的。
既然你知道了如何分析給定命令的系統(tǒng)調(diào)用,那么就可以將該知識(shí)用于其他命令來(lái)了解正在執(zhí)行哪些系統(tǒng)調(diào)用。strace
提供了許多有用的命令行標(biāo)志,使你更容易使用,下面將對(duì)其中一些進(jìn)行描述。
默認(rèn)情況下,strace
并不包含所有系統(tǒng)調(diào)用信息。但是,它有一個(gè)方便的 -v
冗余選項(xiàng),可以在每個(gè)系統(tǒng)調(diào)用中提供附加信息:
strace -v ls testdir
在運(yùn)行 strace
命令時(shí)始終使用 -f
選項(xiàng)是一種好的作法。它允許 strace
對(duì)當(dāng)前正在跟蹤的進(jìn)程創(chuàng)建的任何子進(jìn)程進(jìn)行跟蹤:
strace -f ls testdir
假設(shè)你只需要系統(tǒng)調(diào)用的名稱、運(yùn)行的次數(shù)以及每個(gè)系統(tǒng)調(diào)用花費(fèi)的時(shí)間百分比。你可以使用 -c
標(biāo)志來(lái)獲取這些統(tǒng)計(jì)信息:
strace -c ls testdir/
假設(shè)你想專注于特定的系統(tǒng)調(diào)用,例如專注于 open
系統(tǒng)調(diào)用,而忽略其余部分。你可以使用-e
標(biāo)志跟上系統(tǒng)調(diào)用的名稱:
[root@sandbox tmp]# strace -e open ls testdiropen("/etc/ld.so.cache", O_RDONLY|O_CLOEXEC) = 3open("/lib64/libselinux.so.1", O_RDONLY|O_CLOEXEC) = 3open("/lib64/libcap.so.2", O_RDONLY|O_CLOEXEC) = 3open("/lib64/libacl.so.1", O_RDONLY|O_CLOEXEC) = 3open("/lib64/libc.so.6", O_RDONLY|O_CLOEXEC) = 3open("/lib64/libpcre.so.1", O_RDONLY|O_CLOEXEC) = 3open("/lib64/libdl.so.2", O_RDONLY|O_CLOEXEC) = 3open("/lib64/libattr.so.1", O_RDONLY|O_CLOEXEC) = 3open("/lib64/libpthread.so.0", O_RDONLY|O_CLOEXEC) = 3open("/usr/lib/locale/locale-archive", O_RDONLY|O_CLOEXEC) = 3file1 file2+++ exited with 0 +++[root@sandbox tmp]#
如果你想關(guān)注多個(gè)系統(tǒng)調(diào)用怎么辦?不用擔(dān)心,你同樣可以使用 -e
命令行標(biāo)志,并用逗號(hào)分隔開兩個(gè)系統(tǒng)調(diào)用的名稱。例如,要查看 write
和 getdents
系統(tǒng)調(diào)用:
[root@sandbox tmp]# strace -e write,getdents ls testdirgetdents(3, /* 4 entries */, 32768) = 112getdents(3, /* 0 entries */, 32768) = 0write(1, "file1 file2\n", 13file1 file2) = 13+++ exited with 0 +++[root@sandbox tmp]#
到目前為止,這些示例是明確地運(yùn)行的命令進(jìn)行了跟蹤。但是,要跟蹤已經(jīng)運(yùn)行并正在執(zhí)行的命令又怎么辦呢?例如,如果要跟蹤用來(lái)長(zhǎng)時(shí)間運(yùn)行進(jìn)程的守護(hù)程序,該怎么辦?為此,strace
提供了一個(gè)特殊的 -p
標(biāo)志,你可以向其提供進(jìn)程 ID。
我們的示例不在守護(hù)程序上運(yùn)行 strace
,而是以 cat
命令為例,如果你將文件名作為參數(shù),通常 cat
會(huì)顯示文件的內(nèi)容。如果沒(méi)有給出參數(shù),cat
命令會(huì)在終端上等待用戶輸入文本。輸入文本后,它將重復(fù)給定的文本,直到用戶按下 Ctrl + C
退出為止。
從一個(gè)終端運(yùn)行 cat
命令;它會(huì)向你顯示一個(gè)提示,并等待在那里(記住 cat
仍在運(yùn)行且尚未退出):
[root@sandbox tmp]# cat
在另一個(gè)終端上,使用 ps
命令找到進(jìn)程標(biāo)識(shí)符(PID):
[root@sandbox ~]# ps -ef | grep catroot 22443 20164 0 14:19 pts/0 00:00:00 catroot 22482 20300 0 14:20 pts/1 00:00:00 grep --color=auto cat[root@sandbox ~]#
現(xiàn)在,使用 -p
標(biāo)志和 PID(在上面使用 ps
找到)對(duì)運(yùn)行中的進(jìn)程運(yùn)行 strace
。運(yùn)行 strace
之后,其輸出說(shuō)明了所接駁的進(jìn)程的內(nèi)容及其 PID。現(xiàn)在,strace
正在跟蹤 cat
命令進(jìn)行的系統(tǒng)調(diào)用??吹降牡谝粋€(gè)系統(tǒng)調(diào)用是 read
,它正在等待文件描述符 0
(標(biāo)準(zhǔn)輸入,這是運(yùn)行 cat
命令的終端)的輸入:
[root@sandbox ~]# strace -p 22443strace: Process 22443 attachedread(0,
現(xiàn)在,返回到你運(yùn)行 cat
命令的終端,并輸入一些文本。我出于演示目的輸入了 x0x0
。注意 cat
是如何簡(jiǎn)單地重復(fù)我輸入的內(nèi)容的。因此,x0x0
出現(xiàn)了兩次。我輸入了第一個(gè),第二個(gè)是 cat
命令重復(fù)的輸出:
[root@sandbox tmp]# catx0x0x0x0
返回到將 strace
接駁到 cat
進(jìn)程的終端。現(xiàn)在你會(huì)看到兩個(gè)額外的系統(tǒng)調(diào)用:較早的 read
系統(tǒng)調(diào)用,現(xiàn)在在終端中讀取 x0x0
,另一個(gè)為 write
,它將 x0x0
寫回到終端,然后是再一個(gè)新的 read
,正在等待從終端讀取。請(qǐng)注意,標(biāo)準(zhǔn)輸入(0
)和標(biāo)準(zhǔn)輸出(1
)都在同一終端中:
[root@sandbox ~]# strace -p 22443strace: Process 22443 attachedread(0, "x0x0\n", 65536) = 5write(1, "x0x0\n", 5) = 5read(0,
想象一下,對(duì)守護(hù)進(jìn)程運(yùn)行 strace
以查看其在后臺(tái)執(zhí)行的所有操作時(shí)這有多大幫助。按下 Ctrl + C
殺死 cat
命令;由于該進(jìn)程不再運(yùn)行,因此這也會(huì)終止你的 strace
會(huì)話。
如果要查看所有的系統(tǒng)調(diào)用的時(shí)間戳,只需將 -t
選項(xiàng)與 strace
一起使用:
[root@sandbox ~]#strace -t ls testdir/ 14:24:47 execve("/usr/bin/ls", ["ls", "testdir/"], [/* 40 vars */]) = 014:24:47 brk(NULL) = 0x1f0700014:24:47 mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f2530bc800014:24:47 access("/etc/ld.so.preload", R_OK) = -1 ENOENT (No such file or directory)14:24:47 open("/etc/ld.so.cache", O_RDONLY|O_CLOEXEC) = 3
如果你想知道兩次系統(tǒng)調(diào)用之間所花費(fèi)的時(shí)間怎么辦?strace
有一個(gè)方便的 -r
命令,該命令顯示執(zhí)行每個(gè)系統(tǒng)調(diào)用所花費(fèi)的時(shí)間。非常有用,不是嗎?
[root@sandbox ~]#strace -r ls testdir/ 0.000000 execve("/usr/bin/ls", ["ls", "testdir/"], [/* 40 vars */]) = 00.000368 brk(NULL) = 0x19660000.000073 mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7fb6b11550000.000047 access("/etc/ld.so.preload", R_OK) = -1 ENOENT (No such file or directory)0.000119 open("/etc/ld.so.cache", O_RDONLY|O_CLOEXEC) = 3
“怎么在Linux上用strace來(lái)理解系統(tǒng)調(diào)用”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。