6月 18

Zabbix自动添加端口进程监控

添加端口和进程的监控,一种方案是可以通过模板来定义一组机器需要监控的端口和进程,优点是方案简单且监控准确,缺点是需要维护多套模板,比较适合小规模的团队。当监控规模较大时,需要考虑一种支持自助修改监控项的方案。本文记录一种通过自动发现(Low-Level Discovery)功能来实现自动添加端口进程监控以及支持自助修改的方案。 概述 Za … Continue reading

6月 13

Zabbix自动删除下线机器的监控

由于 Zabbix 自动注册没有删除机制(例如以主机名为规则注册,当服务器主机名变更时,会再次注册,并不删除原主机名的监控),导致有重复项。另外机器下线也需要删除服务器的监控。本文记录一种基于 iTop CMDB 和 Zabbix 接口自动审计 Zabbix 监控服务器的方案。 概述 使用 PHP 语言写脚本,并使用以下 SDK。 脚本使 … Continue reading

2月 17

基于http_reqstat和influxdb的Tengine监控方案

在基于http_reqstat模块和zabbix的Tengine监控方法中,使用http_reqstat模块作为数据源,经过脚本计算之后插入zabbix做监控及报警。本文将基于influxdb改进监控,并利用时序数据库丰富的功能发掘http_reqstat数据的各种用途。 数据采集 由于influxdb有求导数的函数,可以直接将http_ … Continue reading

9月 02

Kapacitor行为测试

公司的Url监控需求之前是用zabbix的web scenarios来做的,优点是zabbix的触发器功能很好用,缺点是: 和其他系统的结合有些不够方便灵活 item名称长度有限制,不能显示完整的url 无法记录请求失败时的网页内容(只告诉你匹配失败了) 因此决定尝试使用telegraf,写一个Url监控插件 来做这个事情。因为是向inf … Continue reading

3月 29

基于http_reqstat模块和zabbix的Tengine监控方法

Tengine的http_reqstat_module提供了监控Tengine运行状态的方法,能根据自定义变量(req_status_zone)统计Tengine的运行状况(域名,URI等)。本文记录了一种使用http_reqstat模块作为数据源,zabbix作为数据存储及展示,grafana作为前端展示的Tengine监控方案。 本文 … Continue reading

8月 17

Linux系统监控工具

cpu信息 /proc/cpuinfo 查看cpu基本信息 uptime查看负载 load average这个输出值,它的3个值的大小一般不能大于系统CPU的个数 vmstat proc - r 运行和等待cpu时间片的进程数量,如果长时间大于0(另说大于系统cpu个数), 表示cpu不足 proc - b 等待资源(IO、memory) … Continue reading

4月 06

写写最近的工作

上周过的很糟心,旧槽点没吐完呢新槽点接二连三的来了,心力交瘁裸辞的心都有了。但是想到还得交房租还得吃饭,读书还太少,不能太任性,还是先吐吐槽吧。 周一,安全部门扫到一批有严重安全漏洞的服务器,由于没有完善的监控系统,对服务器的掌控能力很弱,非常原始的依赖手工修改服务器设置。博主对手工做重复的事一直非常抵触,面对这些有着乱七八糟问题批量功能 … Continue reading