您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“l(fā)inux中perf有什么用”,內(nèi)容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“l(fā)inux中perf有什么用”這篇文章吧。
perf是linux系統(tǒng)中提供的性能分析工具,它基于一個叫“Performance counters”的內(nèi)核子系統(tǒng)實現(xiàn),同時支持硬件(CPU、PMU(Performance Monitoring Unit))和軟件(軟件計數(shù)器、tracepoint)層面的性能分析。
perf中的事件
perf與其他性能調(diào)優(yōu)工具一樣,都是通過對監(jiān)測對象進行采樣,根據(jù)采樣點的分布來推斷整個程序的行為。通過perf list命令我們可以看到perf支持很多的采樣事件,比如branch-misses、cpu-clock等等。perf中預定義的事件屬于不同的類型,比如硬件產(chǎn)生的事件(cache 命中/分支miss)和軟件產(chǎn)生的事件(context switch/page fault)等等。
tracepoint
tracepoint是linux內(nèi)核中定義的一些hook,如果被開啟,它們就會在執(zhí)行到特定邏輯時被觸發(fā),方便其他工具獲取系統(tǒng)內(nèi)部的運行狀態(tài)等信息,perf就是利用了tracepoint,它會記錄和統(tǒng)計tracepoint的各個事件,生成分析報告。
使用方式
perf 工具的具體使用方式如下:
perf [--version] [--help] COMMAND [ARGS]
其中的COMMAND列表可以通過執(zhí)行perf --help查看,下面列舉幾個常用的command。
perf stat
perf stat的作用是執(zhí)行一個命令并收集其運行過程中的各個數(shù)據(jù),它可以提供一個程序運行情況的總體概覽。比如:
user@localhost:~$ perf stat hostname localhost Performance counter stats for 'hostname': 0.313464 task-clock (msec) # 0.481 CPUs utilized 2 context-switches # 0.006 M/sec 0 cpu-migrations # 0.000 K/sec 153 page-faults # 0.488 M/sec 896,723 cycles # 2.861 GHz 620,709 instructions # 0.69 insn per cycle 121,143 branches # 386.465 M/sec 6,247 branch-misses # 5.16% of all branches 0.000651441 seconds time elapsed
上面這個例子,通過perf stat運行了hostname命令,并將其運行過程中的一些指標匯總顯示了出來,比如task-clock、context-switches等待。默認情況下,perf stat 會輸出幾個常用的事件的統(tǒng)計,比如:
task-clock-msecs:cpu 使用率 context-switches:進程切換次數(shù) page-faults:發(fā)生缺頁的次數(shù) cpu-migrations:表示進程運行過程中發(fā)生了多少次CPU遷移,即被調(diào)度器從一個CPU轉移到另外一個CPU上運行 cycles:處理器時鐘,一條機器指令可能需要多個cycles instructions: 機器指令數(shù)目 branches:遇到的分支指令數(shù) branch-misses是預測錯誤的分支指令數(shù)
除此之外,我們可以使用-e參數(shù)來指定我們感興趣的事件,比如:
user@localhost:~$ perf stat -e cache-misses hostname localhost Performance counter stats for 'hostname': 682 cache-misses 0.000646676 seconds time elapsed
perf top
perf top的作用是實時地顯示系統(tǒng)當前的性能統(tǒng)計信息。前面的perf stat用于對一個特定的程序進行分析,而某些時候我們可能并不知道是哪個程序影響了系統(tǒng)性能,這時候就可以用perf top來查找可疑的程序。比如:
Samples: 775 of event 'cpu-clock', Event count (approx.): 92931021 Overhead Shared Object Symbol 8.93% [kernel] [k] vsnprintf 7.73% perf [.] rb_next 5.92% [kernel] [k] kallsyms_expand_symbol.clone.0 5.07% [kernel] [k] format_decode 4.59% [kernel] [k] number 3.40% perf [.] symbols__insert 3.03% libslang.so.2.2.1 [.] SLtt_smart_puts
上面的例子顯示perf統(tǒng)計了cpu-clock事件的數(shù)據(jù),根據(jù)比例進行了排序。和perf stat一樣,我們可以通過-e參數(shù)指定統(tǒng)計其他的事件,比如perf top -e context-switches可以查看進程切換最多的top N個進程。
perf record & perf report
perf record的作用和perf stat類似,它可以運行一個命令并生成統(tǒng)計信息,不過perf record不會將結果顯示出來,而是將結果輸出到文件中。perf record生成的文件可以用perf report來進行解析。
perf record還可以通過-g參數(shù),在分析時生成calling graph,幫助定位更上層的邏輯分布。
其他
通過例子我們可以發(fā)現(xiàn),perf的分析結果中的Symbol一列顯示的都是c語言函數(shù)的名字。對于java來說,jit編譯產(chǎn)生的函數(shù)就會直接顯示在symbol里,而不是java的函數(shù)名,這時要定位問題就不是那么容易了,我們需要通過額外的手段將symbol和java程序的符號表對應起來,具體后續(xù)再討論了。
以上是“l(fā)inux中perf有什么用”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業(yè)資訊頻道!
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。