一、腳本
今天主要分享一個shell腳本,用來獲取linux系統CPU、內存、磁盤IO等信息。
#!/bin/bash
# 獲取要監控的本地服務器IP地址
IP=`ifconfig | grep inet | grep -vE 'inet6|127.0.0.1' | awk '{print $2}'`
echo "IP地址:"$IP
# 獲取cpu總核數
cpu_num=`grep -c "model name" /proc/cpuinfo`
echo "cpu總核數:"$cpu_num
# 1、獲取CPU利用率
# 獲取用戶空間占用CPU百分比
cpu_user=`top -b -n 1 | grep Cpu | awk '{print $2}' | cut -f 1 -d "%"`
echo "用戶空間占用CPU百分比:"$cpu_user
# 獲取內核空間占用CPU百分比
cpu_system=`top -b -n 1 | grep Cpu | awk '{print $4}' | cut -f 1 -d "%"`
echo "內核空間占用CPU百分比:"$cpu_system
# 獲取空閑CPU百分比
cpu_idle=`top -b -n 1 | grep Cpu | awk '{print $8}' | cut -f 1 -d "%"`
echo "空閑CPU百分比:"$cpu_idle
# 獲取等待輸入輸出占CPU百分比
cpu_iowait=`top -b -n 1 | grep Cpu | awk '{print $10}' | cut -f 1 -d "%"`
echo "等待輸入輸出占CPU百分比:"$cpu_iowait
#2、獲取CPU上下文切換和中斷次數
# 獲取CPU中斷次數
cpu_interrupt=`vmstat -n 1 1 | sed -n 3p | awk '{print $11}'`
echo "CPU中斷次數:"$cpu_interrupt
# 獲取CPU上下文切換次數
cpu_context_switch=`vmstat -n 1 1 | sed -n 3p | awk '{print $12}'`
echo "CPU上下文切換次數:"$cpu_context_switch
#3、獲取CPU負載信息
# 獲取CPU15分鐘前到現在的負載平均值
cpu_load_15min=`uptime | awk '{print $11}' | cut -f 1 -d ','`
echo "CPU 15分鐘前到現在的負載平均值:"$cpu_load_15min
# 獲取CPU5分鐘前到現在的負載平均值
cpu_load_5min=`uptime | awk '{print $10}' | cut -f 1 -d ','`
echo "CPU 5分鐘前到現在的負載平均值:"$cpu_load_5min
# 獲取CPU1分鐘前到現在的負載平均值
cpu_load_1min=`uptime | awk '{print $9}' | cut -f 1 -d ','`
echo "CPU 1分鐘前到現在的負載平均值:"$cpu_load_1min
# 獲取任務隊列(就緒狀態等待的進程數)
cpu_task_length=`vmstat -n 1 1 | sed -n 3p | awk '{print $1}'`
echo "CPU任務隊列長度:"$cpu_task_length
#4、獲取內存信息
# 獲取物理內存總量
mem_total=`free | grep Mem | awk '{print $2}'`
echo "物理內存總量:"$mem_total
# 獲取操作系統已使用內存總量
mem_sys_used=`free | grep Mem | awk '{print $3}'`
echo "已使用內存總量(操作系統):"$mem_sys_used
# 獲取操作系統未使用內存總量
mem_sys_free=`free | grep Mem | awk '{print $4}'`
echo "剩余內存總量(操作系統):"$mem_sys_free
# 獲取應用程序已使用的內存總量
mem_user_used=`free | sed -n 3p | awk '{print $3}'`
echo "已使用內存總量(應用程序):"$mem_user_used
# 獲取應用程序未使用內存總量
mem_user_free=`free | sed -n 3p | awk '{print $4}'`
echo "剩余內存總量(應用程序):"$mem_user_free
# 獲取交換分區總大小
mem_swap_total=`free | grep Swap | awk '{print $2}'`
echo "交換分區總大小:"$mem_swap_total
# 獲取已使用交換分區大小
mem_swap_used=`free | grep Swap | awk '{print $3}'`
echo "已使用交換分區大小:"$mem_swap_used
# 獲取剩余交換分區大小
mem_swap_free=`free | grep Swap | awk '{print $4}'`
echo "剩余交換分區大小:"$mem_swap_free
#5、獲取磁盤I/O統計信息
echo "指定設備(/dev/sda)的統計信息"
# 每秒向設備發起的讀請求次數
disk_sda_rs=`IOStat -kx | grep sda| awk '{print $4}'`
echo "每秒向設備發起的讀請求次數:"$disk_sda_rs
# 每秒向設備發起的寫請求次數
disk_sda_ws=`iostat -kx | grep sda| awk '{print $5}'`
echo "每秒向設備發起的寫請求次數:"$disk_sda_ws
# 向設備發起的I/O請求隊列長度平均值
disk_sda_avgqu_sz=`iostat -kx | grep sda| awk '{print $9}'`
echo "向設備發起的I/O請求隊列長度平均值"$disk_sda_avgqu_sz
# 每次向設備發起的I/O請求平均時間
disk_sda_await=`iostat -kx | grep sda| awk '{print $10}'`
echo "每次向設備發起的I/O請求平均時間:"$disk_sda_await
# 向設備發起的I/O服務時間均值
disk_sda_svctm=`iostat -kx | grep sda| awk '{print $11}'`
echo "向設備發起的I/O服務時間均值:"$disk_sda_svctm
# 向設備發起I/O請求的CPU時間百分占比
disk_sda_util=`iostat -kx | grep sda| awk '{print $12}'`
echo "向設備發起I/O請求的CPU時間百分占比:"$disk_sda_util
執行結果:
二、原理講解
知其然還要知其所以然,下面詳細我們講解腳本實現的原理。
1. 獲取要監控的本地服務器IP地址
IP=`ifconfig | grep inet | grep -vE 'inet6|127.0.0.1' | awk '{print $2}'`
echo "IP地址:"$IP
- ifconfig | grep inet過濾出如下結果包含字符串inet的行,如下圖紅色圈起來的兩行 其中| 是管道的意思,將前面命令的結果作為輸入給| 右邊的命令
- grep -vE 'inet6|127.0.0.1'將第一步結果通過命令grep -vE過濾掉包含inet6和127.0.0.1的行
- 將第二步結果通過命令awk 將字符串分割,$n(0~N) 對應相應的參數,如下圖多少$2對應地址:192.168.0.125,**'{print 2}'**打印出2的值
- 將第三步的結果賦值給變量IP
- echo "IP地址:"$IP打印出變量IP的值,【后面腳本中賦值和打印的語句功能相同,不再重復解釋】
2. 獲取cpu總核數
cpu_num=`grep -c "model name" /proc/cpuinfo`
echo "cpu總核數:"$cpu_num
- 在linux的/proc目錄下存放了系統運行的很多系統資源信息,其中**/proc/cpuinfo**存放了系統運行時cpu的很多重要信息。
- 所有的cpu核信息由model name字符串給出,
- 通過命令**grep -c "model name" /proc/cpuinfo** 可以計算出文件 /proc/cpuinfo中出現字符串model name出現的次數,就可以得到cpu總核數。-c 表示統計字符串出現次數。
如下所示:
3. 獲取CPU利用率
top命令經常用來監控linux的系統狀況,是常用的性能分析工具,能夠實時顯示系統中各個進程的資源占用情況。
# 獲取用戶空間占用CPU百分比
cpu_user=`top -b -n 1 | grep Cpu | awk '{print $2}' | cut -f 1 -d "%"`
echo "用戶空間占用CPU百分比:"$cpu_user
# 獲取內核空間占用CPU百分比
cpu_system=`top -b -n 1 | grep Cpu | awk '{print $4}' | cut -f 1 -d "%"`
echo "內核空間占用CPU百分比:"$cpu_system
# 獲取空閑CPU百分比
cpu_idle=`top -b -n 1 | grep Cpu | awk '{print $8}' | cut -f 1 -d "%"`
echo "空閑CPU百分比:"$cpu_idle
# 獲取等待輸入輸出占CPU百分比
cpu_iowait=`top -b -n 1 | grep Cpu | awk '{print $10}' | cut -f 1 -d "%"`
echo "等待輸入輸出占CPU百分比:"$cpu_iowait
top
- top -b -n 1顯示系統的信息并以格式化打印,結果只刷新一次
n 設置退出前屏幕刷新的次數
b 將top輸出編排成適合輸出到文件的格式,可以使用這個選項創建進程日志
- grep Cpu提取出字符串Cpu所在的行
- awk '{print $2}'將第二步得到的字符串分割,并調用方法print 打印出**$2**對應的第二個字符串,0.5%us
- cut -f 1 -d "%" 表示以%為分隔符,將第三步的結果分隔開,并顯示分割后的記過的第一個字符串即0.5
-d "%" 是以%作為分隔符,
-f 1顯示以:分割每一行的第一段內容
- 其他腳本以此類推
其他Cpu利用率參數含義如下:
#us 用戶空間占用CPU百分比
#sy 內核空間占用CPU百分比
#ni 用戶進程空間內改變過優先級的進程占用CPU百分比
#id 空閑CPU百分比
#wa 等待輸入輸出的CPU時間百分比
#hi 硬件中斷
#si 軟件中斷
4.獲取CPU上下文切換和中斷次數
# 獲取CPU中斷次數
cpu_interrupt=`vmstat -n 1 1 | sed -n 3p | awk '{print $11}'`
echo "CPU中斷次數:"$cpu_interrupt
# 獲取CPU上下文切換次數
cpu_context_switch=`vmstat -n 1 1 | sed -n 3p | awk '{print $12}'`
echo "CPU上下文切換次數:"$cpu_context_switch
# 獲取任務隊列(就緒狀態等待的進程數)
cpu_task_length=`vmstat -n 1 1 | sed -n 3p | awk '{print $1}'`
echo "CPU任務隊列長度:"$cpu_task_length
- vmstat是Virtual Meomory Statistics(虛擬內存統計)的縮寫,可對操作系統的虛擬內存、進程、CPU活動進行監控。是對系統的整體情況進行統計,不足之處是無法對某個進程進行深入分析。vmstat -n 1 1只顯示一次各字段名稱。
-n:只在開始時顯示一次各字段名稱。
- sed -n 3p將第一步的結果打印出第3行
參數說明:
-n或--quiet或--silent 取消自動打印模式空間,僅顯示script處理后的結果。
動作說明:
p :打印,亦即將某個選擇的數據印出。通常 p 會與參數 sed -n 一起運行~
- **awk '{print $1}'`**將第2步結果得出的字符串分割,并打印第一個字符串
vmstat
5、獲取CPU負載信息
# 獲取CPU15分鐘前到現在的負載平均值
cpu_load_15min=`uptime | awk '{print $11}' | cut -f 1 -d ','`
echo "CPU 15分鐘前到現在的負載平均值:"$cpu_load_15min
# 獲取CPU5分鐘前到現在的負載平均值
cpu_load_5min=`uptime | awk '{print $10}' | cut -f 1 -d ','`
echo "CPU 5分鐘前到現在的負載平均值:"$cpu_load_5min
# 獲取CPU1分鐘前到現在的負載平均值
cpu_load_1min=`uptime | awk '{print $9}' | cut -f 1 -d ','`
echo "CPU 1分鐘前到現在的負載平均值:"$cpu_load_1min
- uptime 命令可以用來查看服務器已經運行了多久,當前登錄的用戶有多少,以及服務器在過去的1分鐘、5分鐘、15分鐘的系統平均負載值。系統負載是處于可運行runnable或不可中斷uninterruptable狀態的進程的平均數。可運行狀態的進程要么正在使用 CPU 要么在等待使用 CPU。不可中斷狀態的進程則正在等待某些 I/O 訪問,例如等待磁盤 IO。有三個時間間隔的平均值。負載均值的意義根據系統中 CPU 的數量不同而不同,負載為 1 對于一個只有單 CPU 的系統來說意味著負載滿了,而對于一個擁有 4 CPU 的系統來說則意味著 75% 的時間里都是空閑的。
- 參考之前腳本分析,**awk '{print $9}' | cut -f 1 -d ','**將第一步的結果分割開,并得到第9個字符串,然后用‘,’分隔開,并得到分割后的第一個字符串
uptime
6、獲取內存信息
# 獲取物理內存總量
mem_total=`free | grep Mem | awk '{print $2}'`
echo "物理內存總量:"$mem_total
# 獲取操作系統已使用內存總量
mem_sys_used=`free | grep Mem | awk '{print $3}'`
echo "已使用內存總量(操作系統):"$mem_sys_used
# 獲取操作系統未使用內存總量
mem_sys_free=`free | grep Mem | awk '{print $4}'`
echo "剩余內存總量(操作系統):"$mem_sys_free
# 獲取應用程序已使用的內存總量
mem_user_used=`free | sed -n 3p | awk '{print $3}'`
echo "已使用內存總量(應用程序):"$mem_user_used
# 獲取應用程序未使用內存總量
mem_user_free=`free | sed -n 3p | awk '{print $4}'`
echo "剩余內存總量(應用程序):"$mem_user_free
# 獲取交換分區總大小
mem_swap_total=`free | grep Swap | awk '{print $2}'`
echo "交換分區總大小:"$mem_swap_total
# 獲取已使用交換分區大小
mem_swap_used=`free | grep Swap | awk '{print $3}'`
echo "已使用交換分區大小:"$mem_swap_used
# 獲取剩余交換分區大小
mem_swap_free=`free | grep Swap | awk '{print $4}'`
echo "剩余交換分區大小:"$mem_swap_free
- free 命令顯示系統內存的使用情況,包括物理內存、交換內存(swap)和內核緩沖區內存。
- grep Swap將第一步的結果過濾只顯示包含字符串Swap的行
- **awk '{print $4}'**將第二步結果分割,并打印出第四個字符串的值
【其他腳本參考前面的分析】
7. 獲取磁盤I/O統計信息
echo "指定設備(/dev/sda)的統計信息"
# 每秒向設備發起的讀請求次數
disk_sda_rs=`iostat -kx | grep sda| awk '{print $4}'`
echo "每秒向設備發起的讀請求次數:"$disk_sda_rs
# 每秒向設備發起的寫請求次數
disk_sda_ws=`iostat -kx | grep sda| awk '{print $5}'`
echo "每秒向設備發起的寫請求次數:"$disk_sda_ws
# 向設備發起的I/O請求隊列長度平均值
disk_sda_avgqu_sz=`iostat -kx | grep sda| awk '{print $9}'`
echo "向設備發起的I/O請求隊列長度平均值"$disk_sda_avgqu_sz
# 每次向設備發起的I/O請求平均時間
disk_sda_await=`iostat -kx | grep sda| awk '{print $10}'`
echo "每次向設備發起的I/O請求平均時間:"$disk_sda_await
# 向設備發起的I/O服務時間均值
disk_sda_svctm=`iostat -kx | grep sda| awk '{print $11}'`
echo "向設備發起的I/O服務時間均值:"$disk_sda_svctm
# 向設備發起I/O請求的CPU時間百分占比
disk_sda_util=`iostat -kx | grep sda| awk '{print $12}'`
echo "向設備發起I/O請求的CPU時間百分占比:"$disk_sda_util
- iostat命令被用于監視系統輸入輸出設備和CPU的使用情況。它的特點是匯報磁盤活動統計情況,同時也會匯報出CPU使用情況。
-k:顯示狀態以千字節每秒為單位,而不使用塊每秒
-x:顯示擴展狀態
- ** grep sda用于過濾第一步得到的結果,只顯示包含字符串sda**的哪一行
- **awk '{print $4}'**將第二步的結果分割,并只顯示第4個字符串
iostat
iostat 由 Red Hat Enterprise Linux AS 發布。同時 iostat 也是 Sysstat 的一部分。所以我們安裝要安裝sysstat。
安裝 sysstat 包:
sudo apt-get install sysstat