1. 程式人生 > >十七周一次課

十七周一次課

domain then 默認 文件中 efault pwd discuz 子目錄 分隔符

20.20 告警系統主腳本

定義監控系統的各個目錄,然後再去定義主腳本,因為是分布式的,所以需要每一臺機器都需要定義,事先創建好各個腳本和各個目錄,隨後腳本直接拷貝過去即可,然後再去做一些更改
所有的shell腳本放到 /usr/local/sbin/ 目錄下,方便查找
切換到 /usr/local/sbin/ 目錄下,並創建子目錄

[root@aiker ~]# cd /usr/local/sbin/
[root@aiker sbin]# mkdir mon
[root@aiker sbin]# cd mon
[root@aiker mon]# ls
[root@aiker mon]# mkdir bin conf shares log mail
[root@aiker mon]# ls
bin  conf  log  mail  shares
[root@aiker mon]# 

切換到 bin 目錄下(主腳本放在 bin 目錄下,主腳本作為一個入口,應該去判斷配置文件,查看某監控項目是否需要監控,還需調用各個需要監控的子腳本)

[root@aiker mon]# cd bin
[root@aiker bin]# ls

[root@aiker bin]# vim main.sh //main.sh內容

#!/bin/bash
#Written by Aiker
# 是否發送郵件的開關
export send=1
# 過濾ip地址
export addr=`/sbin/ifconfig |grep -A1 "eth0: "|awk ‘/inet/ {print $2}‘`
dir=`pwd`
# 只需要最後一級目錄名
last_dir=`echo $dir|awk -F‘/‘ ‘{print $NF}‘`
# 下面的判斷目的是,保證執行腳本的時候,我們在bin目錄裏,不然監控腳本、郵件和日誌很有可能找不到
if [ $last_dir == "bin" ] || [ $last_dir == "bin/" ]; then
    conf_file="../conf/mon.conf"
else
    echo "you shoud cd bin dir"
    exit
fi
exec 1>>../log/mon.log 2>>../log/err.log
echo "`date +"%F %T"` load average"
/bin/bash ../shares/load.sh
#先檢查配置文件中是否需要監控502
if grep -q ‘to_mon_502=1‘ $conf_file; then
    export log=`grep ‘logfile=‘ $conf_file |awk -F ‘=‘ ‘{print $2}‘ |sed ‘s/ //g‘`
    /bin/bash  ../shares/502.sh
fi    

20.21 告警系統配置文件

告警系統mon.conf mon.conf內容

## to config the options if to monitor
## 定義mysql的服務器地址、端口以及user、password
to_mon_cdb=0   ##0 or 1, default 0,0 not monitor, 1 monitor
db_ip=10.20.3.13
db_port=3315
db_user=username
db_pass=passwd
## httpd   如果是1則監控,為0不監控
to_mon_httpd=0
## php 如果是1則監控,為0不監控
to_mon_php_socket=0
## http_code_502  需要定義訪問日誌的路徑
to_mon_502=1
logfile=/data/log/xxx.xxx.com/access.log
## request_count   定義日誌路徑以及域名
to_mon_request_count=0
req_log=/data/log/www.discuz.net/access.log
domainname=www.discuz.net

20.22 告警系統監控項目

load.sh內容

#! /bin/bash
##Writen by Aiker##
load=`uptime |awk -F ‘average:‘ ‘{print $2}‘|cut -d‘,‘ -f1|sed ‘s/ //g‘ |cut -d. -f1`
if [ $load -gt 10 ] && [ $send -eq "1" ]
then
    echo "$addr `date +%T` load is $load" >../log/load.tmp
    /bin/bash ../mail/mail.sh [email protected] "$addr\_load:$load" `cat ../log/load.tmp`
fi
echo "`date +%T` load is $load"

load.sh分析:

[root@aiker conf]# uptime |awk -F ‘average:‘ ‘{print $2}‘ |cut -d , -f1 |sed ‘s/ //g‘ |cut -d . -f1
0
##獲取1分鐘的cpu負載;也可以用這個:uptime |awk -F ‘average: ‘ ‘{print $2}‘ |cut -d . -f1
##echo "$addr `date +%T` load is $load" >../log/load.tmp 這個tmp文件是發郵件的內容;
##/bin/bash 就是調用的郵件腳本,發郵件咯;

502.sh內容

#! /bin/bash
d=`date -d "-1 min" +%H:%M`
c_502=`grep :$d:  $log  |grep ‘ 502 ‘|wc -l`
if [ $c_502 -gt 10 ] && [ $send == 1 ]; then
     echo "$addr $d 502 count is $c_502">../log/502.tmp
     /bin/bash ../mail/mail.sh $addr\_502 $c_502  ../log/502.tmp
fi
echo "`date +%T` 502 $c_502"

502.sh解析:

echo "$addr `date +%T` load is $load" >../log/load.tmp
##以上是獲取前一分鐘的時間;(因為我們都是對前一分鐘的日誌進行分析的)
c_502=`grep :$d:  $log  |grep ‘ 502 ‘|wc -l`
##統計502出現的行數;
disk.sh內容
#! /bin/bash
##Writen by Aiker
rm -f ../log/disk.tmp
for r in `df -h |awk -F ‘[ %]+‘ ‘{print $5}‘|grep -v Use`
do
    if [ $r -gt 90 ] && [ $send -eq "1" ]
then
    echo "$addr `date +%T` disk useage is $r" >>../log/disk.tmp
fi
if [ -f ../log/disk.tmp ]
then
    df -h >> ../log/disk.tmp
    /bin/bash ../mail/mail.sh $addr\_disk $r ../log/disk.tmp
    echo "`date +%T` disk useage is nook"
else
    echo "`date +%T` disk useage is ok"
fi

disk.sh內容解析:

[root@aiker conf]# df -h
Filesystem      Size  Used Avail Use% Mounted on
/dev/sda3        19G  7.8G   12G  42% /
devtmpfs        479M     0  479M   0% /dev
tmpfs           489M     0  489M   0% /dev/shm
tmpfs           489M  6.7M  482M   2% /run
[root@aiker conf]# df -h |awk -F ‘[ %]+‘ ‘{print $5}‘
Use
42
0
0
2

##awk -F ‘[ %]+‘ ‘{print $5}‘這裏是以空格和%為分隔符,打印第五行;如果沒有+號,則awk默認將空格和%分開來算,打印第五行就為空了

[root@aiker conf]# df -h |awk -F ‘[ %]+‘ ‘{print $5}‘ |grep -v ‘Use‘
42
0
0
2
[root@aiker conf]# df -h |awk -F ‘[ %]‘ ‘{print $5}‘

十七周一次課