在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)-魔扣目錄

kube-prometheus是一個完整的監(jiān)控解決方案，可以輕松地將其部署到 Kubernetes 集群中，它包括以下內(nèi)容

Prometheus 用于度量收集
Alertmanager 用于指標(biāo)警報和通知
Grafana 用于圖形用戶界面
一組特定于K8s的exporters，用作指標(biāo)收集代理
使用 Prometheus Operator 來簡化和自動化該堆棧的設(shè)置

快速安裝

在將 kube-prometheus部署到 k8s 集群之前，先確認(rèn)與你的 k8s匹配的是版本，然后在下載
在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)

下載

執(zhí)行kubectl version 查看k8s 版本，下載對應(yīng)版本

在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)

由于本人的 k8s 版本為 v1.25.13，所以下載kube-prometheus-0.12.0

wget https://github.com/prometheus-operator/kube-prometheus/archive/refs/tags/v0.12.0.zip

解壓

tar -zxvf kube-prometheus-0.12.0.zip & cd kube-prometheus-0.12.0

修改鏡像地址

由于網(wǎng)絡(luò)原因，kube-state-metrics和prometheus-adapter鏡像地址，在國內(nèi)無法下載，因此需要修改以下地址

vi manifests/kubeStateMetrics-deployment.yaml

image: bitnami/kube-state-metrics:2.7.0

vi manifests/prometheusAdapter-deployment.yaml

image: cloveropen/prometheus-adapter:v0.10.0

訪問配置

為了可以從外部訪問 Prometheus、Grafana、Alertmanager，需要修改 service 類型為 NodePort 類型。

修改 Prometheus 的 service

vi manifests/prometheus-service.yaml

# 設(shè)置對外訪問端口，增加如下兩行
type: NodePort
nodePort: 31922

在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)

修改 Grafana 的 service

vi manifests/grafana-service.yaml

# 設(shè)置對外訪問端口，增加如下兩行
type: NodePort
nodePort: 30300

在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)

修改 Alertmanager 的 service

vi manifests/alertmanager-service.yaml

# 設(shè)置對外訪問端口，增加如下兩行
type: NodePort
nodePort: 30200

在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)

安裝

在kube-prometheus-0.12.0目錄下執(zhí)行以下命令進(jìn)行安裝

kubectl apply --server-side -f manifests/setup
kubectl apply -f manifests/

執(zhí)行完成以后，訪問monitoring 空間，查看部署狀態(tài)，可以看到啟動成功，并且都是高可用部署

kubectl get pods -n monitoring

在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)

驗(yàn)證

Prometheus驗(yàn)證

選一臺 node 節(jié)點(diǎn)ip+31922，即可訪問prometheus的 Web UI

在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)

Alertmanager驗(yàn)證

選一臺 node 節(jié)點(diǎn)ip+30200，即可訪問alertmanager的 Web UI，可以看到有一些報警，由于alertmanager的報警配置比較復(fù)雜同時對國內(nèi)的通訊工具支持有限，因此可以使用PrometheusAlert進(jìn)行告警配置

在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)

Grafana驗(yàn)證

選一臺 node 節(jié)點(diǎn)ip+30300，即可訪問grafana的 Web UI，默認(rèn)用戶名密碼：admin/admin，登錄會提示更改密碼，登錄以后，可以看到已經(jīng)內(nèi)置了不少監(jiān)控大盤

在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)

集群資源監(jiān)控

在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)

節(jié)點(diǎn)資源監(jiān)控，可以看到當(dāng)前節(jié)點(diǎn)部署了哪些 pod，以及對應(yīng)的負(fù)載是多少

在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)

卸載

執(zhí)行以下命令即可卸載相關(guān)組件

kubectl delete --ignore-not-found=true -f manifests/ -f manifests/setup

存在的問題

持久存儲

以上我們安裝未使用持久化存儲，所以如果Prometheus或者Grafana重啟，那么采集的數(shù)據(jù)和自定義的儀表盤等數(shù)據(jù)會丟失，因此如果考慮在生產(chǎn)環(huán)境使用，需要把數(shù)據(jù)使用存儲卷掛載至文件系統(tǒng)。

Grafana顯示時間問題

由于grafana默認(rèn)時區(qū)是UTC，比中國時間慢了8小時，很不便于日常監(jiān)控查看，需要進(jìn)行修改，如下圖

在k8s中快速搭建基于Prometheus監(jiān)控系統(tǒng)

因此需要調(diào)整成中國時間，utc+8，替換grafana-dashboardDefinitions.yaml

sed -i '' 's/utc/utc+8/g' grafana-dashboardDefinitions.yaml
sed -i '' 's/UTC/UTC+8/g' grafana-dashboardDefinitions.yaml
grep -i timezone grafana-dashboardDefinitions.yaml

總結(jié)

以上我們介紹了什么是kube-prometheus以及如何在k8s中快速部署kube-prometheus，后續(xù)會深入講解相關(guān)使用，同時在操作過程中如果有疑問，也歡迎關(guān)注我的公眾號進(jìn)行技術(shù)交流，如果本篇文章對您有所幫助，麻煩幫忙一鍵三連（點(diǎn)贊、轉(zhuǎn)發(fā)、收藏）~