具体要求如下:

1)脚本一分钟执行一次
2)监控502状态可以通过分析网站的访问日志,也可以通过用curl工具发起http请求,获得状态码,建议通过分析访问日志,假如访问日志路径为/data/logs/access.log,日志片段如下:

  1. 54.36.149.38 - [16/Sep/2018:21:38:41 +0800] www.bossding.com.cn "/thread-5360-1-1.html" 301 "GET /thread-5360-1-1.html HTTP/1.1""-" "Mozilla/5.0 (compatible; AhrefsBot/5.2; +http://ahrefs.com/robot/)" 
  2. 42.236.10.91 - [16/Sep/2018:21:38:41 +0800] www.bossding.com.cn "/" 403 "GET / HTTP/1.1""http://www.bossding.com.cn/" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36; 360Spider" "
  3. 111.147.182.161 - [16/Sep/2018:21:38:41 +0800] www.bossding.com.cn "/data/attachment/forum/month_1211/epel-release-6-7.noarch.rpm" 301 "GET /data/attachment/forum/month_1211/epel-release-6-7.noarch.rpm HTTP/1.1""-" "curl/7.29.0"

3)一分钟内出现502的次数超过50次则需要告警
4)告警需要发邮件通知,通知邮箱为master_edaxue@163.com

计划任务cron

 

一分钟执行一次脚本,所以要用到cron。执行命令:

  1. crontab -e

这样就进入到了编辑页面,计划任务的格式是这样的:

  1. # Example of job definition:
  2. # .---------------- 分钟 (范围0 - 59)
  3. # |  .------------- 小时 (范围0 - 23)
  4. # |  |  .---------- 日期 (范围1 - 31)
  5. # |  |  |  .------- 月 (范围1 - 12) 也可以用英文的简写形式: jan,feb,mar,apr ...
  6. # |  |  |  |  .---- 周 (范围0 - 6) (周日可以用0或者7表示) 也可以写成英文简写形式:sun,mon,tue,wed,thu,fri,sat
  7. # |  |  |  |  |
  8. # *  *  *  *  * 用户名(可以省略)  要执行的命令

示例1:

  1. 每周1,3,5凌晨420分执行脚本/usr/local/sbin/123.sh
  2. 20 4 * * 1,3,5 /bin/bash /usr/local/sbin/123.sh

示例2:

  1. 每隔3天清空文件/data/log/tmp.log
  2. 0 0 */3 * * true>/data/log/tmp.log

示例3:

  1. 每天9点到12点,14点到16点执行脚本/usr/local/sbin/xxx.sh
  2. 0 9-12,14-16 * * * /bin/bash /usr/local/sbin/xxx.sh

本案例每分钟执行一次,则写成这样:

  1. * * * * * /bin/bash /usr/local/sbin/mon_502.sh

过滤关键词

 

shell脚本中,过滤某个关键词使用grep命令,比如在本例中需要把日志中包含502的日志过滤出来,命令为:

  1. grep '502' /data/log/access.log

这个是最基本的用法,平时脚本中使用grep的机会很多,且用法也比较复杂,通常会和正则表达式配合在一起使用。下面为几个常见的用法,(以下全部示例文件为1.txt)。

过滤出所有包含数字的行:

  1. grep '[0-9]' 1.txt

过滤出以英文字母开头的行:

  1. grep '^[a-zA-Z]' 1.txt

去除所有空行:

  1. grep -'^$' 1.txt

过滤出包含以abc开头且以123结尾的字符串的行

  1. grep 'abc.*123' 1.txt

过滤出至少有两个连续数字的行

  1. grep -'[0-9][0-9]+' 1.txt

或者

  1. grep -'[0-9]{2,}' 1.txt

过滤出含有bossding的行有几行

  1. grep -En 'bossding' 1.txt

再回过头来看本案例的需求,因为是一分钟检测一次,所以过滤的关键词是上一分钟的时间,通过分析日志,可以发现上一分钟可以用date -d "-1 min" +"%Y:%H:%M:[0-5][0-9]"这个关键词来表示。

shell中的大小比较

 

shell脚本的语法比较特殊,其中数字比较大小并不能直接使用>,<,>=,<=等字符,而是使用如下方式:

结合if语句,写法如下:

  1. if [ $a -gt 10 ]  //当变量a的值大于10的时候
  2. if [ $x -le 100 ]  //当变量x的值小于等于100的时候

如果要比较的对象并不是数字,而是一个字符串的时候,可以这样用:

  1. if [ $str == "zhangsan" ] //当变量str的值是zhangsan的时候

shell中的逻辑判断

 

在所有的编程语言中,逻辑判断和循环遍历可以说是必不可少的组成部分,shell中的逻辑判断以if为主,其格式主要有三种。

1)if ... then ... fi
示例代码:

  1. if [ $a -gt 5 ]
  2. then
  3.     command1
  4.     command2
  5. fi

2)if ... then ... else ... fi
示例代码:

  1. if command 
  2. then
  3.     command1
  4. else
  5.     command2
  6. fi

说明:if后面的条件可以是一条命令,命令执行成功则条件成立,执行command1,否则条件不成立,执行command2

3)if ... then ... elif ... then ... else ... fi
示例代码:

  1. if [ $b -ge 10] || [ $b -lt 6 ]
  2. then
  3.     command1
  4. elif [ $b -eq 8 ]
  5. then
  6.     command2
  7. else
  8.     command3
  9. fi

说明:if后面的判断条件可以有多个,用||表示或者,用&&表示并且

在命令行下发邮件


使用Python进行邮件代码的发送:

  1. #!/usr/bin/python
  2. #coding:utf-8
  3. import smtplib
  4. from email.mime.text import MIMEText
  5. import sys
  6. mail_host = 'smtp.163.com'
  7. mail_user = 'test@163.com'
  8. mail_pass = 'your_mail_password'
  9. mail_postfix = '163.com'
  10. def send_mail(to_list,subject,content):
  11.     me = "zabbix 监控告警平台"+"<"+mail_user+"@"+mail_postfix+">"
  12.     msg = MIMEText(content, 'plain', 'utf-8')
  13.     msg['Subject'] = subject
  14.     msg['From'] = me
  15.     msg['to'] = to_list
  16.     try:
  17.         s = smtplib.SMTP()
  18.         s.connect(mail_host)
  19.         s.login(mail_user,mail_pass)
  20.         s.sendmail(me,to_list,msg.as_string())
  21.         s.close()
  22.         return True
  23.     except Exception,e:
  24.         print str(e)
  25.         return False
  26. if __name__ == "__main__":
  27.     send_mail(sys.argv[1], sys.argv[2], sys.argv[3])

说明:该脚本会调用第三方的邮箱账户,需要你填写正确的mail_host, mail_user以及mail_pass。假如脚本名字为mail.py,则发邮件的命令为:

  1. python  mail.py master_edaxue@163.com "邮件主题" "邮件内容"

参考脚本

有了以上四个储备知识,下面就该写本案例的脚本了,如下是我提供的一个参考脚本:

  1. vim /usr/local/sbin/mon_502.sh //内容如下
  2. #!/bin/bash
  3. ##监控网站的502问题
  4.  
  5. t=`date -d "-1 min" +"%Y:%H:%M:[0-5][0-9]"`
  6. log="/data/logs/access.log"
  7. #假设mail.py已经写好,并放在/usr/local/sbin/下
  8. mail_script="/usr/local/sbin/mail.py"
  9. mail_user=master_edaxue@163.com
  10.  
  11. n=`grep $t $log|grep -c " 502 "`
  12. if [ $n -gt 50 ]
  13. then
  14.     python $mail_script $mail_user "网站有502" "1分钟内出现了$n次"
  15. fi

增加任务计划:

  1. * * * * * /bin/bash /usr/local/sbin/mon_502.sh 2>/tmp/mon_502.err

说明:需要在该cron最后面定义一个错误日志输出,如果脚本执行过程中有报错,我们可以到/tmp/mon_502.err文件中查看错误信息。