组团学

Zabbix分布式监控系统

阅读 (454585)

生产环境中,我们为了实现地域容灾,我们会把服务器放在不同的地域,如果一台zabbix server去监控的话,延迟会高,因为中国的网络由很多运营商在经营,包括联通,移动,电信,教育等等,有玩游戏的同学应该清楚,家里是联通的网络,你去会去电信的服务器么?不会,因为延迟太高。为什么延迟高?因为运营商之间的出口带宽是有限制的,为什么有限制?因为费用不一样,你在便宜的运营商这里办宽带,在贵的运营商这里玩,这种事,换做是谁都不会高兴的。有的同学说我用游戏加速器怎么延迟就低了?使用游戏加速器相当于在大家都从一扇门进出的时候,你发现了一扇窗,而这扇窗就你自己在用,但是当其他人也发现了这扇窗之后呢?所以即便是使用了游戏加速器,在上网高峰时,延迟还是高,只不过没有那么拥挤而已。说完了为什么延迟会高,我们再看一下另外一个问题,这种把服务器放在不同的地域也会造成zabbix server压力也会很大,所以为了避免这种情况,我们的处理方法就是将权利下发,在不同的地域都找一个机器来充当代理,本地的监控工作由代理(proxy)来完成,代理完成收集工作后交给zabbix server,zabbix server在将收到的数据统一整理展示到web。

其实这个例子很简单就是你开了很多分公司,你一个人去管理这些分公司的员工的话,你是管不全面的,所以我们的方法是在每个分公司弄一个负责人,负责人管当地的员工,你管负责人。有问题他们集中向你汇报就好了。这样你就能很顺利的掌控全局了。

架构图

image20200219101305467.png

所以在这个分布式监控的架构中的流程是

1、zabbix server发布指令给代理

2、zabbix-proxy将指令发给被监控主机

3、被监控机将数据汇报给zabbix-proxy

4、zabbix-proxy再交给zabbix-server

5、zabbix-server将数据展示

这样解决了延迟问题,只要保证一条线路畅通就可以了,至于保证一条线路畅通的手段就看你的公司了,有钱可以接专线,没钱可以使用VPN,实在不行可以直接走广域网

实验拓扑图

zabbix_proxy.png

在这个架构中我们至少需要三台机器,他们的角色为

  • zabbix-server: 192.168.98.200

  • zabbix-proxy: 192.168.98.205

  • 被监控主机: 192.168.98.xxx

实验步骤

部署server监控平台 (略)

部署proxy代理平台

被监控机安装zabbix-agent(略)

一、部署zabbix-proxy代理平台

1.1、安装zabbix-proxy平台

#设置yum源 [root@proxy ~]# cat >> /etc/yum.repos.d/zabbix.repo <<EOF [zabbix] name=Zabbix Official Repository - $basearch baseurl=http://repo.zabbix.com/zabbix/4.4/rhel/8/$basearch/ #baseurl=https://mirrors.aliyun.com/zabbix/zabbix/4.4/rhel/8/$basearch/ enabled=1 gpgcheck=0 gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-ZABBIX-A14FE591 [zabbix-non-supported] name=Zabbix Official Repository non-supported - $basearch baseurl=http://repo.zabbix.com/non-supported/rhel/8/$basearch/ enabled=1 gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-ZABBIX gpgcheck=0 #安装软件包 [root@proxy ~]# dnf -y install mariadb-server mariadb zabbix-proxy-mysql zabbix-agent ############################################################ 注意:如果无法连接公网的源,可以用浏览器将软件包下载到本地,然后自己创建本地源 step1 [root@proxy ~]# dnf install createrepo -y step2 [root@proxy ~]# createrepo zabbix/(此路径为存放软件包的路径) step3 [root@proxy ~]# vim /etc/yum.repos.d/server.repo [server-app] name=server-app enable=1 gpgcheck=0 baseurl=file:///mnt/AppStream [server-os] name=server-os enable=1 gpgcheck=0 baseurl=file:///mnt/BaseOS [zabbix] name=zabbix enabled=1 gpgcheck=0 baseurl=file:///root/zabbix step4 [root@proxy ~]# dnf -y install mariadb-server mariadb zabbix-proxy-mysql zabbix-agent ############################################################ #mariadb设置 #启动服务 [root@proxy ~]# systemctl enable mariadb Created symlink from /etc/systemd/system/multi-user.target.wants/mariadb.service to /usr/lib/systemd/system/mariadb.service. [root@proxy ~]# systemctl start mariadb [root@proxy ~]# mysqladmin -u root password '123456' #创建数据库 zabbix_proxy及管理用户 [root@proxy ~]# mysql -u root -p MariaDB [(none)]> create database zabbix_proxy character set utf8 collate utf8_bin; Query OK, 1 row affected (0.00 sec) MariaDB [(none)]> grant all privileges on zabbix_proxy.* to zabbix@localhost identified by '123456'; Query OK, 0 rows affected (0.00 sec) MariaDB [(none)]> flush privileges; Query OK, 0 rows affected (0.00 sec) MariaDB [(none)]> exit Bye #导入数据 [root@proxy ~]# zcat /usr/share/doc/zabbix-proxy-mysql/schema.sql.gz |mysql -u zabbix -p123456 zabbix_proxy

1.2、修改proxy配置文件

[root@proxy ~]# egrep "^(Server|Hostname|DBPass)" /etc/zabbix/zabbix_proxy.conf Server=192.168.98.200 #将数据汇报给谁 Hostname=zabbix_proxy #自己的名字 DBPassword=123456 #数据库密码

1.3、关于proxy的监控问题

由于proxy既是监控也是被监控机,所以本机的agent的服务器地址可以设置本机或者server地址,这里建议设置server地址。因为这样zabbix server能够直接监控到本机的状态

[root@proxy ~]# egrep "^(Server|Hostname)" /etc/zabbix/zabbix_agentd.conf Server=192.168.98.200 ServerActive=192.168.98.200 Hostname=proxy

1.4、启动服务

[root@proxy ~]# systemctl enable zabbix-proxy zabbix-agent Created symlink from /etc/systemd/system/multi-user.target.wants/zabbix-proxy.service to /usr/lib/systemd/system/zabbix-proxy.service. Created symlink from /etc/systemd/system/multi-user.target.wants/zabbix-agent.service to /usr/lib/systemd/system/zabbix-agent.service. [root@proxy ~]# systemctl start zabbix-proxy zabbix-agent

查看一下日志显示的内容,以及确认下端口是否打开

[root@proxy ~]# tail -f /var/log/zabbix/zabbix_proxy.log 34539:20200215:133633.989 proxy #13 started [history syncer #2] 34547:20200215:133633.990 proxy #21 started [poller #4] 34548:20200215:133633.996 proxy #22 started [poller #5] 34546:20200215:133633.998 proxy #20 started [poller #3] 34551:20200215:133634.000 proxy #25 started [preprocessing manager #1] 34550:20200215:133634.003 proxy #24 started [icmp pinger #1] 34549:20200215:133634.003 proxy #23 started [unreachable poller #1] 34552:20200215:133635.011 proxy #26 started [preprocessing worker #1] 34554:20200215:133635.014 proxy #28 started [preprocessing worker #3] 34553:20200215:133635.019 proxy #27 started [preprocessing worker #2] 34534:20200215:133641.038 cannot send proxy data to server at "192.168.98.200": proxy "zabbix_proxy" not found 34534:20200215:133642.041 cannot send proxy data to server at "192.168.98.200": proxy "zabbix_proxy" not found 34534:20200215:133643.044 cannot send proxy data to server at "192.168.98.200": proxy "zabbix_proxy" not found 34534:20200215:133644.046 cannot send proxy data to server at "192.168.98.200": proxy "zabbix_proxy" not found 34534:20200215:133645.049 cannot send proxy data to server at "192.168.98.200": proxy "zabbix_proxy" not found [root@proxy ~]# netstat -ntlp Active Internet connections (only servers) Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name tcp 0 0 0.0.0.0:10050 0.0.0.0:* LISTEN 33953/zabbix_agentd tcp 0 0 0.0.0.0:10051 0.0.0.0:* LISTEN 33960/zabbix_proxy tcp6 0 0 :::10050 :::* LISTEN 33953/zabbix_agentd tcp6 0 0 :::10051 :::* LISTEN 33960/zabbix_proxy tcp6 0 0 :::3306 :::* LISTEN 33219/mysqld

通过查看日志,我们发现日志当中好像有报错,这个我们一会再说,通过查看端口可以发现zabbix_proxy与zabbix_server使用的端口是一样的,所以这两个角色不能配置在一台主机上

1.5、监控平台设置

刚才我们在查看日志的时候发现日志中好像有错误提示,这个提示产生的原因就是服务端不认这个代理,代理给服务端发数据,服务端不要,所以我们要告诉服务端,它的代理是谁

管理—agent代理程序

zabbixproxy1.png

选择 创建代理 进入代理设置模式

zabbixproxy2.png

设置代理名称:一定要和proxy配置文件中的Hostname一致

设置代理模式:主动

1)proxy主动模式

zabbix_proxy主动发数据给zabbix_server(proxy的默认模式)

# vim /etc/zabbix/zabbix_proxy.conf ProxyMode=0 --此参数为0表示proxy主动模式

2)proxy被动模式

zabbix_server找zabbix_proxy为收集数据

# vim /etc/zabbix/zabbix_proxy.conf ProxyMode=1 --此参数为1表示proxy主动模式

警告

为了避免服务端不识别代理或者其它主机的情况,建议在zabbix_server最好给代理名字及其它主机做个解析 [root@zabbix ~]# vim /etc/hosts 192.168.98.205 proxy zabbix_proxy

二、设置被监控机

[root@node4 ~]# egrep "^(Server|Hostname)" /etc/zabbix/zabbix_agentd.conf Server=192.168.98.205 ServerActive=192.168.98.205 Hostname=node4 [root@node4 ~]# systemctl restart zabbix-agent [root@node2 ~]# netstat -ntlp Active Internet connections (only servers) Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name tcp 0 0 0.0.0.0:10050 0.0.0.0:* LISTEN 7836/zabbix_agentd tcp6 0 0 :::10050 :::* LISTEN 7836/zabbix_agentd

三、验证

由于之前配置过自动注册,所以应该在主机列表中能看到就算成功了。

配置—主机

image20200215140100181.png

看到了,node2后面有一个zabbix_proxy 说明该主机走的是代理模式。

如果查看监测–图形时很久不出图,建议分别重启zabbix_proxy和客户端的zabbix-proxy以及zabbix-agent服务

需要 登录 才可以提问哦