簡便快速地完成對分布式系統(tǒng)的監(jiān)控;一、業(yè)務(wù)背景
微服務(wù)作為當(dāng)前系統(tǒng)架構(gòu)的主流選型,雖然可以應(yīng)對復(fù)雜的業(yè)務(wù)場景,但是隨著業(yè)務(wù)擴(kuò)展,微服務(wù)架構(gòu)本身的復(fù)雜度也會(huì)膨脹,對于一些核心的業(yè)務(wù)流程,其請求鏈路會(huì)涉及到多個(gè)業(yè)務(wù)服務(wù),少則三五個(gè),多則十幾個(gè)都很常見:
真實(shí)的業(yè)務(wù)場景遠(yuǎn)比圖解復(fù)雜,在這種模式下當(dāng)請求發(fā)生故障時(shí),或者進(jìn)行優(yōu)化時(shí),需要分析鏈路性能,追蹤調(diào)用鏈路,排查和解決鏈路故障;
要完成上述流程,需要對請求的鏈路有完整監(jiān)控,并且采集和分析各個(gè)環(huán)節(jié)的數(shù)據(jù),這樣才能清晰地理解系統(tǒng)的行為信息,比如耗時(shí)分析,故障原因發(fā)現(xiàn),從而進(jìn)行優(yōu)化和解決;能實(shí)現(xiàn)這種能力的組件很多,這里來看看基于SkyWalking9的實(shí)踐方式;
二、組件原理
Skywalking是APM規(guī)范的國產(chǎn)開源分布式鏈路追蹤系統(tǒng),APM(Application-Performance-Management)即應(yīng)用性能管理,支持對SpringCloud微服務(wù)集成,并且無代碼層面的侵入:
結(jié)構(gòu)體系
業(yè)務(wù)機(jī)制
SpringCloud:分布式系統(tǒng)中的服務(wù),啟動(dòng)時(shí)配置代理即可;
Agent:以探針的方式進(jìn)行請求鏈路的數(shù)據(jù)采集,并向管理服務(wù)上報(bào);
OAP-Service:接收數(shù)據(jù),完成數(shù)據(jù)的存儲和展示;
Storage:數(shù)據(jù)的存儲層,支持ElasticSearch、MySQL、H2多種方式;
UI界面:數(shù)據(jù)的可視化展示界面;
工作流程,服務(wù)通過探針的方式接入數(shù)據(jù)采集的功能,之后請求鏈路的相關(guān)處理行為會(huì)上報(bào)到OAP服務(wù)中,進(jìn)行數(shù)據(jù)的聚合管理和分析,并存儲在持久層,然后可以通過UI界面進(jìn)行可視化呈現(xiàn);
三、安裝部署
1、版本描述
skywalking在之前的舊版本中,apm與agent是在一個(gè)包中的,在9.0的版本中是需要分開下載的;agent包下載解壓之后,也將其放到apm包下面維護(hù):
- skywalking-apm-9.1.0.tar.gz
- skywalking-JAVA-agent-8.10.0.tgz
2、配置存儲方式
Skywalking數(shù)據(jù)存儲的組件有多種選型方式,這里方便本地調(diào)試,就選擇MySQL數(shù)據(jù)庫,在生產(chǎn)環(huán)境中通常選擇ElasticSearch組件;
配置文件:config/application.yml
storage: selector: ${SW_STORAGE:mysql} mysql: properties: jdbcUrl: ${SW_JDBC_URL:"jdbc:mysql://localhost:3306/swtest?rewriteBatchedStatements=true"} dataSource.user: ${SW_DATA_SOURCE_USER:username} dataSource.password: ${SW_DATA_SOURCE_PASSWORD:password}
需要注意的是,要在本地的MySQL中新建swtest數(shù)據(jù)庫,采用latin1字符編碼,可以避免索引長度的問題,表的創(chuàng)建是自動(dòng)的,然后需要在包中添加MySQL依賴;
3、啟動(dòng)與停止
- 啟動(dòng)oap服務(wù):sh bin/oapService.sh
- 啟動(dòng)UI界面:sh bin/webappService.sh
- 服務(wù)停止命令:jps查看,kill相關(guān)編號;
UI界面服務(wù)默認(rèn)是8080端口,如果存在占用問題,可以修改:webapp/webapp.yml文件,更換端口;啟動(dòng)完成后訪問LocalIP:port即可;
4、服務(wù)集成
在本地存在gateway,facade,account,三個(gè)服務(wù),案例圍繞account服務(wù)中的請求展開,由于涉及網(wǎng)關(guān)服務(wù),還需要添加相關(guān)插件的依賴;
將optional-plugins可選插件目錄中的兩個(gè)網(wǎng)關(guān)的依賴包,復(fù)制到plugins插件目錄下;
在服務(wù)啟動(dòng)類中添加agent配置,如果在生產(chǎn)環(huán)境中,通常會(huì)統(tǒng)一在腳本中設(shè)置,由于在本地環(huán)境演示,基于IDEA工具進(jìn)行管理;
-javaagent:本地路徑/agent/skywalking-agent.jar -Dskywalking.agent.service_name=gateway -javaagent:本地路徑/agent/skywalking-agent.jar -Dskywalking.agent.service_name=facade -javaagent:本地路徑/agent/skywalking-agent.jar -Dskywalking.agent.service_name=account
這樣全部的配置就完成了,依次啟動(dòng)skywalking相關(guān)服務(wù),與這里配置的三個(gè)微服務(wù),下面再來看看功能細(xì)節(jié);
四、功能細(xì)節(jié)
1、服務(wù)監(jiān)控
相關(guān)服務(wù)啟動(dòng)完成后,訪問skywalking界面,主頁加載的即上述配置的三個(gè)微服務(wù),這樣說明整個(gè)流程是正常的,點(diǎn)擊服務(wù)名稱可以查看服務(wù)相關(guān)的細(xì)節(jié)指標(biāo);
2、拓補(bǔ)結(jié)構(gòu)圖
請求通過gateway網(wǎng)關(guān)服務(wù),經(jīng)過facade門面服務(wù),到達(dá)account業(yè)務(wù)服務(wù),完成一次調(diào)用后,查看請求的拓補(bǔ)結(jié)構(gòu)圖(即Topology一欄);
可以清晰地看到請求的路由鏈路,以及相關(guān)服務(wù)訪問的數(shù)據(jù)庫地址,對于微服務(wù)架構(gòu)中的復(fù)雜接口來說,借助該拓補(bǔ)模型,既可以快速理解業(yè)務(wù)邏輯,同時(shí)在出具文檔時(shí)可以節(jié)省很多畫圖時(shí)間;
3、鏈路跟蹤
上面只是請求的拓補(bǔ)結(jié)構(gòu)圖,在實(shí)際應(yīng)用中還是更側(cè)重鏈路跟蹤,查看account服務(wù)請求鏈路(即Trace一欄);
skywalking組件對于開發(fā)來說,最常用的就是該功能,這里采集了請求鏈路上的各個(gè)節(jié)點(diǎn),以及執(zhí)行的耗時(shí)分析,點(diǎn)擊相關(guān)節(jié)點(diǎn)可以查看詳細(xì)信息,針對異常請求同樣可以采集到異常信息的描述;
這樣可以極大地提升問題排查的效率,尤其對于那種路由十多個(gè)服務(wù)的業(yè)務(wù)邏輯;
4、數(shù)據(jù)庫監(jiān)控
雖然在整個(gè)配置中沒有顯式的添加對MySQL的監(jiān)控,但是skywalking依舊可以實(shí)現(xiàn)對服務(wù)中的數(shù)據(jù)庫監(jiān)控,對于這些指標(biāo)細(xì)節(jié)不過多描述,可以自行查閱文檔;
本篇文章只是站在開發(fā)的角度,總結(jié)skywalking的應(yīng)用方式,并未涉及過多的細(xì)節(jié)原理,其它強(qiáng)大的功能設(shè)計(jì),對于開發(fā)來說同樣值得參考。