一文搞定K8S监控告警平台选型 (一文搞定四风六纪八规)

教程大全 2025-07-13 19:15:07 浏览

前言

最近在搞K8S的监控告警平台选型,对比了目前比较流行两款开源平台kube-prometheus、夜莺,也踩了一些坑分享一下

kube-prometheus

项目地址:

一文搞定K8S监控告警平台选型

目前使用最广泛的k8s 的开源监控告警平台,在Prometheus基础上,增加了对 k8s 的各种指标的监控,使用了Kubernetes Operator进行了封装,几乎可以一键部署,部署起来以后登录Grafana,就可以看到各种指标,如下图

优点

1.生态好,基于Prometheus,相关开源组件较多,比如mysql-exporter、redis-exporter

2.对 k8s相关组件监控比较完善

3.用户基数大

缺点

1.部署包部分镜像地址要修改,否则在国内下载不下来

2.Prometheus数据要通过PVC挂载,否则重启数据会丢失

3.Grafana的时间要进行修改,默认是 UTC 时间

4. 监控指标很方便,但是告警配置比较弱,模板这些都要自己实现,同时告警通知没有与飞书、钉钉、微信这些打通,不过好在有第三方实现:PrometheUSAlert

5.监控第三方中间件,比较繁琐,没有一个大一统的方案,比如要监控MySQL,需要找 Mysql Helm 包下载在部署,Redis 同理,每个中间件配置部署都得走一遍,有点耗时

夜莺

项目地址:

夜莺监控是一款开源云原生观测分析平台,采用 all-in-One 的设计理念,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,提供开箱即用的企业级监控分析和告警能力。夜莺于 2020 年 3 月 20 日,在 github 上发布 v1 版本,目前最新版本是 V6 版本。

夜莺是Open-Falcon的团队基于云原生新开发的观测分析平台,可以说是总结之前的一些经验,搞的很不错,官方提供的基于Helm 的安装包,可以进行快速部署,地址:

优点

1. 开箱即用,支持 Docker、Helm Chart、云服务等多种部署方式;集数据采集、监控告警、可视化为一体;

2.大一统的监控数据采集,夜莺的采集端为Categraf,覆盖支持上百种采集对象,比如K8s、中间件、 服务器 、交换机等,只需要配置下地址即可采集

3. 完善的告警机制,这是夜莺相比其他平台最大的优势,它提供了简易图形化的配置、内置了常用组件的告警规则、支持国内各种通知媒介,比如:飞书、钉钉、企微、电话、邮箱、telegram等

4. 支持多数据源,支持Prometheus、Es、Loki、TDengine,也就是说可以与kube-prometheus项目进行整合使用。

缺点

1.对 k8s 监控相对弱一点,没有kube-prometheus完善,需要自己去配置相应的采集指标,不过好在官方文档有指引

2.对 Grafana 支持性差点,虽然官方说,可以支持导入 Grafana 报表,但是在使用过程中,还是发现有些组件不兼容,目前还在逐步完善

3.夜莺的报表导出无法直接导入到Grafana中,这可能也是夜莺商业化的考虑一个点,要对用户有粘性

4.生态没有Prometheus+Grafana好,Prometheus有CNCF作为背书,Grafana已经是数据可视化默认选择,所以很多开源系统都是基于这套方案来实现

总结

以上我们对比了两种监控告警平台,都有优缺点,可以根据自身需求选择其一进行使用,如果既想要完善的告警管理,又想要Grafana和完善 K8S指标监控,可以把两者结合起来使用,目前有不少公司是这样做的


脉冲控制仪要怎么操作?

脉冲袋式除尘器采用单片机进行集中控制,可分为自动和手动两种方式。 调试和设备检修时采用手动方式进行控制,设备正常运行工况下采用自动方式进行控制,脉冲控制仪作为重要的控制仪器,操作方法注意事项有以下三点:1、开机操作。 检查各电气接线,压差传送器后合上各电源开关,待风机运行,反馈信号进入,设备便开始运行。 2、脉冲清灰。 脉冲清灰采用自动控制方式进行。 将脉冲控制仪上的开关指向Demand时,采用定阻法进行清灰,用表上的红色指针设定上下压差限,当设备阻力阻力超过上限值时,则脉冲喷吹开始动作。 3、卸灰控制。 卸灰可采用手动或自动两种方式。 采用手动时,按下控制柜上“卸灰运行”按钮,卸灰开始;按下“卸灰停止”按钮,则卸灰停止。

我电脑有过几次蓝屏,中间蓝屏后开机玩游戏没事可是没两天游戏开机就没了。是不中木马了?

需要具体判断是那里的问题的1、软件。 软件方面的原因有可能是中了什么病毒,导致系统运行异常,此种问题解决方法就是彻底查杀病毒,没什么特殊捷径;另外由于硬件的驱动不兼 容导致蓝屏,解决方法就是找出不兼容的硬件驱动,将其删除,然后更换原厂的驱动;系统不稳定也可能造成蓝屏,意思就是说安装的系统版本本身存在BUG系统原本就不稳定,所以会导致蓝屏;不同软件之间的不兼容也可能导致蓝屏。 软件方面最大的可能性就是病毒和驱动不兼容这2种。 2、硬件。 主板、内存、电源、硬盘的硬件故障都可能导致蓝屏。 硬件方面的蓝屏比较难排除,只能根据经验判断,一个一个硬件排除,最终确定是哪个部件出了问题,蓝屏的解决步骤就是首先重新安装系统,安装完成后,不要打开任何硬盘分区,安装杀毒软件升级至最新版本,彻底查杀硬盘看看有没有病毒,看看有没有貌似病毒等的异常文件。 安装系统之后尽量安装原厂的驱动,以上步骤完成后如果还是有蓝屏故障,那么很可能是硬件原因了,建议去找专业维修的地方做个检测,叫他们查一下到底是什么原因。 另外灰尘等因素,以及主板的各个接口松动也是可能造成蓝屏的原因。 可以查看CPU的硅胶是否太少了,把主板上的各个部件插严了。 一般蓝屏是和内存和硬盘的关系大的,重点检测这两个

DB2与oracle有什么区别?

1、体系结构,DB2的实例和数据库分开的做法,我个人还是比较喜欢的,因为实例可以创建多个,数据库的恢复直接恢复到实例下就可以了,相对ORACLE简单多了。 2、管理工具,DB2的管理工具做得太简陋了,控制中心只能说能用而已,而且还有好多BUG,不如ORACLE的企业管理器做得好,连WEB版都没有。 3、备份管理,DB2的备份只能说是简陋了,没有备份集的管理功能,没有恢复预览和校验功能,不能写到网络驱动器上,唉太多的没有了,ORACLE的RMAN确实强大; 4、DB2的命令执行方式,我很喜欢,可以在命令行上执行SQL,也可以在命令窗口上执行SQL,相对SQLPLUS灵活多了; 5、DB2的自动维护功能做的很好,可以定期自动整理数据库碎片和重建索引,唯一不大理想的是自动维护的备份功能不能指定压缩备份,相对而言ORACLE的自动维护功能就很一般了; 6、DB2的运行状况的功能我也很喜欢,ORACLE也有类似的AHM,但是 DB2的运行状况更为直接,可以一下就看出数据库目前有啥问题,DB2还给出了如何处理的建议顾问程序; 7、DB2的内存状况监控功能本来我也很喜欢,可以直接在内存状况监控上直接改相应的参数,但是发现一个巨大BUG后,我就很不喜欢了,如果你一直点刷新,发现内存占用量会不断上升,我有次为了监控一个内存参数,让这个工具运行了一天一夜,结果回来一看,晕倒,所有的内存参数增长到数百G,我想看的历史变化情况居然没有。 8、DB2的远程网络连接采用的编目方式描述连接串的方式我感觉很不爽,为了改个客户端的连接服务器的IP地址,所有的客户端都需要将编目删除,然后重新编目连接地址,晕倒100多台PC机搞下来,尽管可以使用脚本,但是还是把人都快搞疯了。 ORACLE采用的用文件来配置远程服务器的方式,所有的PC机都通过更新服务器直接更新本机的TNSNAME,1分钟搞定。 9、DB2的数据库创建如果要手工管理容器,居然没有指定缺省的系统表空间数据文件名,你要创建一堆相应的文件名,没办法,只好照抄oracle的OFA体系结构的文件名。 10、DB2的连接配置图形工具实在是差了,在上面配置一步步配出的连接居然不能用!只好使用脚本,这点ORACLE比DB2强多了。 11、DB2在WINDOWS 平台的可靠性不怎么样,3个多星期无缘无故DOWN了4次机,ORACLE配好了应该没有这么悲惨吧。 12、DB2的锁自动管理机制,我比较喜欢,打开后,互锁的概率大大降低,相同的程序,在DB2下锁明显少许多,但是不爽的是DB2的select命令也是加锁的。 13、DB2 9.7的ORACLE兼容模式,我也很喜欢,迁移麻烦少了许多许多。 14、DEB2 的自动内存管理我看要比ORACLE 要强一些,几乎所有的内存参数都能自动管理,ORACLE11G貌似也可以全部自动管理了。 15、DB2的导出数据的工具实在太简陋了,连oracle的EXP/IMP 都不如,更不要说expdp/impdp 16、DB2的SQL语句运行速度明显快于ORACLE,5-6段相同的代码,同一台机器,参数都是缺省参数,个人测试DB2执行速度大约要快10%-15%,也许和DB2缺省的参数调优有关,ORACLE10g调优后,还是还有5-10%左右的差异。

本文版权声明本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请联系本站客服,一经查实,本站将立刻删除。

发表评论

热门推荐