:information_source: 本文基于Go1.13和gops 0.3.7
gops致力于幫助開發者診斷Go進程并與之交互。它提供跟蹤運行中程序數秒,通過pprof獲取CPU分析數據,甚至可以直接和GC交互的能力。
發現
gops提供了一種發現服務,該服務可以羅列出計算機上運行的Go進程。不帶參數的運行gops僅顯示Go進程。為了舉例說明,我啟動了一個計算高達一百萬素數的程序。這是輸出結果:
295 1 gops go1.13 /go/src/github.com/google/gops/gops
168 1 prime-number* go1.13 /go/prime-number/prime-numbe
gops發現了上面啟動的程序和自己本身的進程。讓我們先來了解下gops如何過濾Go進程。
首先,gops列出所有的進程。然后對于每個進程,它打開二進制文件讀取符號表:
如果符號表包含 runtime.main (主goroutine入口)或者 main.main (我們程序的入口),它會被標記成Go程序。
如果想了解更多主goroutine,建議閱讀之前的文章 Go: g0, 特殊的goroutine
gops還可以通過閱讀符號表里 runtime.buildVersion 來獲取使用的Go版本。但是,由于可以從二進制中刪除符號表,所以gops需要另一種方式來檢測Go二進制文件。讓我們用刪除符號表后的二進程文件再試一次:
295 1 gops go1.13 /go/src/..../gops
168 1 prime-number-s* unknown Go version /go/.../prime-number-
程序能夠被正確的標識為Go二進制文件,但是因為缺少符號表而不能檢測出Go版本。根據ELF,MZ等可執行文件格式,gops會讀取各段來查找嵌在二進制文件中的構建ID。一旦發現流程結束,它就可以開始與程序交互。
交互
與其他Go程序進行交互的唯一條件是確保它們啟動gops代理。該代理是一個簡單的監聽器,將為gops請求提供服務。只需添加以下行即可:
if err := agent.Listen(agent.Options{}); err != nil {
log.Fatal(err)}
然后,任何啟動了代理的程序都可以和gops交互。這里是執行stats命令的例子:
# gops stats 168
goroutines: 6210
OS threads: 9
GOMAXPROCS: 2
num CPU: 2
更多命令,你可以查閱官方手冊。如果代理缺失,你將會在交互時收到一個報錯:
Couldn't resolve addr or pid 168 to TCPAddress: couldn't get port for PID 168
該錯誤表明gops通過TCP尋找暴露的端口以便與程序進行交互。讓我們畫出這個包的工作流來了解它。
工作流
gops與要讀取的程序之間的通信是通過TCP和程序暴露的端口來完成的:
分配給每個程序的端口都寫在一個配置文件中,例如 path/to/config/{processID} ,這使得 gops 很容易知道暴露的端口。然后, gops 可以將命令標識發送給程序,代理 將會收集數據并響應:
編譯自:
https://medium.com/a-journey-with-go/go-how-does-gops-interact-with-the-runtime-778d7f9d7c18