故障分析
首先,判斷訪問慢現(xiàn)象,是個人還是集體???
"個人"現(xiàn)象排查:檢查個人網(wǎng)絡(luò),pc,瀏覽器、中毒等,無需多說自己百度;
"集體"現(xiàn)象排查:檢查核心路由交換,ISP運行商網(wǎng)絡(luò),ARP***,DNS服務(wù),各服務(wù)器狀態(tài);
服務(wù)狀態(tài)排查:zabbix監(jiān)控;創(chuàng)建測試頁面測試: 靜態(tài)頁面=》動態(tài)頁面=》動態(tài)交互頁面
通過上述排查,當測試php與MySQL動態(tài)交互頁面很慢,所以確定為mysql服務(wù)器異常,立刻登錄mysql,通過top命令 查看服務(wù)器負載,發(fā)現(xiàn) mysql竟然百分之兩百的cpu,引起Mysql 負載這么高的原因,估計是有SQL慢查詢語句或磁盤I/O問題;
MySQL負載高排查思路
確定高負載的類型,top命令看負載高是CPU還是磁盤I/O。
mysql 下查看當前的連接數(shù)與執(zhí)行的sql 語句。
檢查慢查詢?nèi)罩荆赡苁锹樵円鹭撦d高。
檢查硬件問題,是否磁盤故障問題造成的。
檢查監(jiān)控平臺,對比此機器不同時間的負載。
確定負載類型(top)
top - 10:14:18 up 23 days, 11:01, 1 user, load average: 124.17, 55.88, 24.70 Tasks: 138 total, 1 running, 137 sleeping, 0 stopped, 0 zombie Cpu(s): 2.4%us, 1.0%sy, 0.0%ni, 95.2%id, 2.0%wa, 0.1%hi, 0.2%si, 0.0%st Mem: 3090528k total, 2965772k used, 124756k free, 93332k buffers Swap: 4192956k total, 2425132k used, 1767824k free, 756524k cached PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 30833 mysql 15 0 6250m 2.5G 4076 S 257.1 49.9 529:34.45 mysqld
查看當前MySQL的連接數(shù)與執(zhí)行的sql語句
無需登陸,非交互查詢,可以grep過濾,更直觀看結(jié)果
mysql -uroot -pqiuyuetao -S /data/3306/mysql.sock -e "show full processlist;" |egrep -vi "sleep"
登陸myslq查看
show full processlist; Id User Host db Command Time State Info 192 slave 8.8.8.142:39820 NULL Binlog Dump 58982 Has sent all binlog to slave; waiting for binlog to be updated NULL 194 slave 8.8.8.120:41075 NULL Binlog Dump 58982 Has sent all binlog to slave; waiting for binlog to be updated NULL 424891 biotherm 8.8.8.46:57861 biotherm Query 493 Sending data SELECT * FROM xxx_list WHERE tid = '1112' AND del = 0 ORDER BY id DESC LIMIT 0, 4 424917 biotherm 8.8.8.49:50984 biotherm Query 488 Sending data SELECT * FROM xxx_list WHERE tid = '1112' AND del = 0 ORDER BY id DESC LIMIT 0, 4 .............................................. 430330 biotherm 8.8.8.42:35982 biotherm Query 487 Sending data SELECT * FROM xxx_list WHERE tid = '1112' AND del = 0
記錄SQL慢查詢
編輯Mysql 配置文件(my.cnf),在[mysqld]字段添加以下幾行:
log_slow_queries = /data/3306/slow_queries.log #慢查詢?nèi)罩韭窂?long_query_time = 2 #記錄SQL查詢超過2s的語句 log-queries-not-using-indexes = 1 #記錄沒有使用索引的sql
查看慢查詢?nèi)罩?/strong>
tail /data/3306/slow_queries.log # Time: 130305 9:48:13 # User@Host: biotherm[biotherm] @ [8.8.8.45] # Query_time: 1294.881407 Lock_time: 0.000179 Rows_sent: 4 Rows_examined: 1318033 SET timestamp=1363916893; SELECT * FROM xxx_list WHERE tid = '11xx' AND del = 0 ORDER BY id DESC LIMIT 0, 4;
日志參數(shù)說明
Query_time: 0 Lock_time: 0 Rows_sent: 1 Rows_examined: 54#查詢時間 鎖定時間 查詢結(jié)果行數(shù) 掃描行數(shù)##主要看掃描行數(shù)多的語句,然后去數(shù)據(jù)庫加上對應(yīng)的索引,再優(yōu)化下變態(tài)的sql 語句。
其它方法
PHP程序中,不使用持久連接,即使用mysql_connetct 而不是pconnect(JAVA調(diào)整連接池)
PHP程序執(zhí)行完,應(yīng)該顯示調(diào)用mysql_colse ##很多開發(fā)只有open 沒有colse
SQL慢查詢語句優(yōu)化
極端情況kill sql進程
找出占用cpu時間過長的sql,在mysql 下執(zhí)行如下命令:
show full processlist;
確定后一條sql處于Query狀態(tài),且Time時間過長,鎖定它的ID,執(zhí)行如下命令:
kill QUERY 269815764;
注意:殺死 sql進程,可能導(dǎo)致數(shù)據(jù)丟失,所以執(zhí)行前要衡量數(shù)據(jù)的重要性。