linux中perf有什么用

發(fā)布時間：2021-11-07 08:34:11 來源：億速云閱讀：368 作者：小新欄目：建站服務器

這篇文章主要為大家展示了“l(fā)inux中perf有什么用”，內(nèi)容簡而易懂，條理清晰，希望能夠幫助大家解決疑惑，下面讓小編帶領大家一起研究并學習一下“l(fā)inux中perf有什么用”這篇文章吧。

perf是linux系統(tǒng)中提供的性能分析工具，它基于一個叫“Performance counters”的內(nèi)核子系統(tǒng)實現(xiàn)，同時支持硬件（CPU、PMU(Performance Monitoring Unit)）和軟件(軟件計數(shù)器、tracepoint)層面的性能分析。

perf中的事件

perf與其他性能調(diào)優(yōu)工具一樣，都是通過對監(jiān)測對象進行采樣，根據(jù)采樣點的分布來推斷整個程序的行為。通過perf list命令我們可以看到perf支持很多的采樣事件，比如branch-misses、cpu-clock等等。perf中預定義的事件屬于不同的類型，比如硬件產(chǎn)生的事件（cache 命中/分支miss）和軟件產(chǎn)生的事件（context switch/page fault)等等。

tracepoint

tracepoint是linux內(nèi)核中定義的一些hook，如果被開啟，它們就會在執(zhí)行到特定邏輯時被觸發(fā)，方便其他工具獲取系統(tǒng)內(nèi)部的運行狀態(tài)等信息，perf就是利用了tracepoint，它會記錄和統(tǒng)計tracepoint的各個事件，生成分析報告。

使用方式

perf 工具的具體使用方式如下：

perf [--version] [--help] COMMAND [ARGS]

其中的COMMAND列表可以通過執(zhí)行perf --help查看，下面列舉幾個常用的command。

perf stat

perf stat的作用是執(zhí)行一個命令并收集其運行過程中的各個數(shù)據(jù)，它可以提供一個程序運行情況的總體概覽。比如：

user@localhost:~$ perf stat hostname
localhost
 Performance counter stats for 'hostname':
          0.313464      task-clock (msec)         #    0.481 CPUs utilized          
                 2      context-switches          #    0.006 M/sec                  
                 0      cpu-migrations            #    0.000 K/sec                  
               153      page-faults               #    0.488 M/sec                  
           896,723      cycles                    #    2.861 GHz                    
           620,709      instructions              #    0.69  insn per cycle         
           121,143      branches                  #  386.465 M/sec                  
             6,247      branch-misses             #    5.16% of all branches        
       0.000651441 seconds time elapsed

上面這個例子，通過perf stat運行了hostname命令，并將其運行過程中的一些指標匯總顯示了出來，比如task-clock、context-switches等待。默認情況下，perf stat 會輸出幾個常用的事件的統(tǒng)計，比如：

task-clock-msecs：cpu 使用率
context-switches：進程切換次數(shù)
page-faults：發(fā)生缺頁的次數(shù)
cpu-migrations：表示進程運行過程中發(fā)生了多少次CPU遷移，即被調(diào)度器從一個CPU轉移到另外一個CPU上運行
cycles：處理器時鐘，一條機器指令可能需要多個cycles
instructions: 機器指令數(shù)目
branches：遇到的分支指令數(shù)
branch-misses是預測錯誤的分支指令數(shù)

除此之外，我們可以使用-e參數(shù)來指定我們感興趣的事件，比如：

user@localhost:~$ perf stat -e cache-misses hostname
localhost
 Performance counter stats for 'hostname':
          682      cache-misses                                                
       0.000646676 seconds time elapsed

perf top

perf top的作用是實時地顯示系統(tǒng)當前的性能統(tǒng)計信息。前面的perf stat用于對一個特定的程序進行分析，而某些時候我們可能并不知道是哪個程序影響了系統(tǒng)性能，這時候就可以用perf top來查找可疑的程序。比如：

Samples: 775  of event 'cpu-clock', Event count (approx.): 92931021
Overhead  Shared Object       Symbol
   8.93%  [kernel]            [k] vsnprintf
   7.73%  perf                [.] rb_next
   5.92%  [kernel]            [k] kallsyms_expand_symbol.clone.0
   5.07%  [kernel]            [k] format_decode
   4.59%  [kernel]            [k] number
   3.40%  perf                [.] symbols__insert
   3.03%  libslang.so.2.2.1   [.] SLtt_smart_puts

上面的例子顯示perf統(tǒng)計了cpu-clock事件的數(shù)據(jù)，根據(jù)比例進行了排序。和perf stat一樣，我們可以通過-e參數(shù)指定統(tǒng)計其他的事件，比如perf top -e context-switches可以查看進程切換最多的top N個進程。

perf record & perf report

perf record的作用和perf stat類似，它可以運行一個命令并生成統(tǒng)計信息，不過perf record不會將結果顯示出來，而是將結果輸出到文件中。perf record生成的文件可以用perf report來進行解析。

perf record還可以通過-g參數(shù)，在分析時生成calling graph，幫助定位更上層的邏輯分布。

其他

通過例子我們可以發(fā)現(xiàn)，perf的分析結果中的Symbol一列顯示的都是c語言函數(shù)的名字。對于java來說，jit編譯產(chǎn)生的函數(shù)就會直接顯示在symbol里，而不是java的函數(shù)名，這時要定位問題就不是那么容易了，我們需要通過額外的手段將symbol和java程序的符號表對應起來，具體后續(xù)再討論了。

以上是“l(fā)inux中perf有什么用”這篇文章的所有內(nèi)容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內(nèi)容對大家有所幫助，如果還想學習更多知識，歡迎關注億速云行業(yè)資訊頻道！

向AI問一下細節(jié)

linux中perf有什么用

猜你喜歡

最新資訊

相關推薦

相關標簽