查看原文
其他

Zabbix 日常应用中的疑难杂症解答(第一辑)

twt社区 twt企业IT社区 2024-02-18
在过去的几年里,开源产品和商业监控应用程序发生了爆炸式增长,涌现出了一批优秀且应用广泛的监控工具,如Zabbix、Prometheus等。企业在监控工具的可选性上越来越大,多个系统应用多个监控工具的情况越来越多,这就要求系统运维人员要掌握多个工具,以及解决这些工具在日常应用中的各种故障、难题等,给众多系统运维人员带来了的困扰。

为此,社区组织相关答疑,邀请监控工具应用高手,帮助大家解答日常应用问题。以下是Zabbix 日常应用中的一些问答整理。还有更多Zabbix、Prometheus等监控工具使用难点解答,可点击阅读原文浏览,也欢迎大家到社区提问。


1、Zabbix监控服务器连接有效性?

【问题描述】一台服务器发生down机或者ping不通的时候,zabbix有时候会探测不到,这个是什么原因造成的呢?

@Zabbix大叔_乐维 广州九一乐维信息科技有限公司 研发工程师:

应该不是探测不到,有可能是你设置的监控项时间采集比较长。数据没有更新,所以可能出现你说的探测不到的问题。

@youki2008 广东溢达 系统架构师:

要看你的数据采集间隔时间,如果太长的话,可能会晚点才能探测的到。另外,也要看当时zabbix server服务器的数据库是否存在IO堵塞。

@花花世界 系统架构师: 

Zabbix触发器告警有一个周期的,可以根据实际情况调整。


2、Zabbix中建立触发器后,报警信息如何推送至用户手机提醒?

@Zabbix大叔_乐维 广州九一乐维信息科技有限公司 研发工程师:

手机短信告警这种告警通知方式,需要结合用户提供的官网短信接口API文档来操作。通过脚本发送告警消息,告警联系人,告警联系人号码等参数到告警平台。

@youki2008 广东溢达 系统架构师:

Zbbix支持企业微信推送消息啊,可以采用这种方式,免费效率高。不过微信上老是收到zabbix的报警信息也会挺烦的。

@chinesezzqiang 信息技术经理:

我们是通过写python脚本与企业内的短信网关对接实现。主流短信网关都提供相关的接口。

@sz  系统运维工程师:

可以使用脚本调用企业微信的群ID,这样凡是在群里的人员都能收到告警信息

@liujinlong  项目经理:

我理解的是你希望使用报警监控项功能,1、购买购买硬件硬件监控猫(短信猫等)2、通过imap转到139,189,w联通等等邮箱邮箱也可以做到(x此项无硬件额外成本)。

@BoyinaBank 洛阳银行 系统工程师:

帮你梳理下大致的流程:

触发器触发 → 生成事件 → 动作 → 用户 → 报警媒介 → 短信、微信接口 → 手机

逻辑不严谨,大致是这个意思


3、Zabbix 有什么方法能监控到SAN交换机的端口性能参数和事件信息?

@Zabbix大叔_乐维 广州九一乐维信息科技有限公司 研发工程师:

网络设备基本都是通过snmp来监控的。一般的网络设备,用snmp监控SAN交换机,一般可以查看端口的速率,端口的mac,端口的状态等等,然后通过设置触发器来进行端口开启,关闭的这种端口状态事件通知。具体性能参数和事件信息要看对应SAN的mib文件有没有提供

@chinesezzqiang 信息技术经理:

通过snmp去获取,zabbix官方提供现成的模板。


4、对于多数据中心,怎么在Zabbix部署方面进行合理的搭建和配置呢?

@chinesezzqiang  信息技术经理:

我们集团有近20个分公司,也就意味着有20个数据中心。我们的做法是:

1.每个数据中心部署一个proxy,进行最近的监控;

2.所有proxy将最终结果汇总到总部master上;

3.通过master提供统一的报表(结合grafana)。

@Zabbix大叔_乐维 广州九一乐维信息科技有限公司 研发工程师:

不同的数据中心通过zabbix-proxy 去收集数据,上报到zabbix-server 端,减少zabbix-server的负载。难点在于要对数据库的维护。因为如果数据库不维护好,很容易出现数据丢失,或者高并发的读写数据库,可能会导致数据库服务中断,也会影响到zabbix_server或者zabbix_proxy服务无法采集数据。


5、刚接触Zabbix,请问一下规模70台服务器50台交换机,网关类设备有10台一般需要什么硬件配置?

@youki2008 广东溢达 系统架构师:

你的监控设备数量(80台)算少的了,配置可以不用太高,采用单点部署就可以了。建议:

CPU:4核;

内存 :8G;

硬盘:200G

@Zabbix大叔_乐维 广州九一乐维信息科技有限公司 研发工程师:

考虑到你是刚接触Zabbix,所以一开始的部署应该采用比较简单的部署方式:单机部署,即部署一个zabbix_server即可。然后所有的数据都由zabbix_server来采集。硬件配置只需要 ,8核,运行内存8G,硬盘空间500G 。如果条件允许的话, 建议使用ssd固态盘。同时建议用户端zabbix_agent采用主动监控的方式,减去zabbix_server服务端的压力。

@hufeng719 某钢铁企业 系统工程师:

zabbix只是一个监控软件工具。安装部署的server需要什么硬件配置满足你的要求,没有个严格的规定,跟你监控的设备台数规模一般没太大关系,主要是考虑监控项的数据量。根据你自身定义的脚本收集哪些需要关注的参数。这个取决于你自身实际情况。当然是配置越高越好,CPU、内存高点(32G),硬盘倒是不用太大。这点数据量还是可以承载的。

@花花世界  系统架构师:

1、4vcpu、8g,磁盘ssd可以根据实际情况分,数据库做分区分表。

2、服务器agent采用主动模式减少Servser端负载,后续Server端负载扛不住了,可以部署Proxy,用Proxy去收集数据上报给Server端,减少Server端负载。

@chinesezzqiang 信息技术经理:

CPU:8核;

内存16G;

硬盘空间500G(SSD)

以上配置即可。


6、Zabbix可以和安全设备联动么?

【问题描述】Zabbix可以和安全设备联动么?例如日志审计、入侵检测网关、动环监测设备采集的数据能集成到zabbix页面了么?

@聂奎甲 长春长信华天 项目经理:

Zabbix可以和支持SNMP 、IPMI 、JMX 、TELNET 、SSH的安全设备联动。

@youki2008 广东溢达 系统架构师:

可以的,一般的安全设备都支持snmp协议。zabbix可以通过snmp协议来进行监控。

@某金融企业 技术经理:

联动一般是指,如果收到你安全设备有威胁,我的平台是可以给你下发相应的策略去阻止它。而你的举例我认为只是收集了你安全设备的一些事件信息,然后在zabbix界面展示出来。这个本身就是zabbix的功能。

@michael1983 某证券 技术经理:

只要是Zabbix支持的协议就可以,一般来说SNMP就够了。

@某银行 系统工程师:

好多大神已经回复了,自己可以用一些开发好的服务或者写脚本,达到更多预想的功能。

如有任何问题,可点击文末阅读原文,到社区活动中提问
觉得本文有用,请转发或点击“在看”,让更多同行看到


社区正在进行“Zabbix、Prometheus等主流监控工具日常应用在线答疑”,欢迎参与!
@Zabbix大叔_乐维、@jason2006xu、@youki2008、@chinesezzqiang …… 等高手解答你的问题
点击以下地址或复制地址到浏览器即可
https://www.talkwithtrend.com/activity/?id=1539


 资料/文章推荐:


欢迎关注社区 "zabbix"技术主题 ,将会不断更新优质资料、文章、问答。地址:

https://www.talkwithtrend.com/Topic/9739


下载 twt 社区客户端 APP


长按识别二维码即可下载

或到应用商店搜索“twt”


长按二维码关注公众号

*本公众号所发布内容仅代表作者观点,不代表社区立场

继续滑动看下一个

Zabbix 日常应用中的疑难杂症解答(第一辑)

twt社区 twt企业IT社区
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存