随着云计算和互联网的快速发展,大量应用需要跨越不同的网络终端,广泛接入第三方服务(如支付、登录、导航等。),而且IT系统架构越来越复杂。快速的产品需求和良好的用户体验要求IT运维管理者保持核心业务的稳定和随时可用,企业运维中的痛点和难点也亟待解决。
1.面向业务的运维,既关心单点IT资源的运行状态,也关心整个业务系统的健康状态。
2.如果企业大量使用API和模块化应用,要注意每个接口的性能变化和指标。
3.对于运维主管和企业管理层来说,尤其需要墙上有一个大的监控屏幕。
4.运维需要周报、月报趋势分析,但传统运维工具很难导出数据。
5.要第一时间转移小鸟,快速找到故障节点,减少业务中断带来的损失。
智慧对比业界主流开源运维监控系统和商业化运维监控系统,分析各类产品的定位、目标用户和功能特点,希望帮助广大运维、开发和创业者找到最适合的运维工具。
开源运维监控产品
扎比克斯
推荐星级:★★★★★
Zabbix是一个企业级开源运维平台,提供基于WEB界面的分布式系统监控和网络监控功能。也是目前国内网民中使用最广泛的监控软件。云智慧遇到的85%以上的用户都在使用Zabbix作为监控解决方案。
上手容易、使用简单、功能强大、免费是云智慧对Zabbix最直观的评价。Zabbix易于管理和配置,可以生成漂亮的数据图。其自动发现功能大大减少了日常管理的工作量。丰富的数据采集方式和API接口允许用户灵活采集数据,而分布式系统架构可以支持监控更多设备。理论上,Zabbix提供的插件架构可以满足企业的任何需求。
用户群体:85%以上的泛互联网企业。
优点:
1.支持多平台的企业级分布式开源监控软件。
2.安装部署简单,灵活集成各种数据采集插件。
3.功能强大,可实现复杂的多工况报警、
4.具有绘图功能,可以将获得的数据绘制成图形。
5.提供多种API接口,支持调用脚本。
6.出现问题时,可以远程自动执行命令(需要为代理设置执行权限)
缺点:
1.项目批量修改不方便。
2.社区虽然成熟,但中文资料相对较少,服务支持有限;
3.上手容易,可以实现基础监控,但是很难熟悉Zabbix,针对深层次需求做大量的二次定制开发;
4.系统层面的报警设置相对较多,不过滤的话会有很多报警邮件;而且自定义项目报警需要自己设置,所以流程比较复杂;
5.缺乏数据汇总功能。如果无法查看一组服务器平均值,则需要进行二次开发;
6.数据报表需要专门的二次开发定义;
纳吉奥斯
推荐星级:★★★★☆
Nagios是一个开源的企业级监控系统,可以实现系统CPU、磁盘、网络等参数的基本系统监控,以及SMTP、POP3、HTTP、NNTP等基本服务类型。此外,通过安装插件和编写监控脚本,用户可以实现应用监控,为大量监控主机和多个对象部署分级监控架构。
Nagios最大的特点是强大的管理中心。虽然它的功能是监控服务和主机,但是Nagios本身并不包含这部分功能代码。所有监控和报警功能都由相关插件完成。
用户群体:适合复杂IT环境的企业。
优点:
1.出现错误的服务器、应用程序和设备将自动重启,日志将自动滚动。
2.灵活的配置,您可以自定义shell脚本,通过分布式监控模式
3.通过各种报警设置,以冗余方式支持主机监控。
4.命令在不干扰Nagios操作的情况下重新加载配置文件。
缺点:
1.事件控制台功能弱,插件不好用。
2.业绩、流量等指标待遇不强。
3.看不到历史数据,只能看到报警事件,很难追溯故障原因。
4.配置复杂,新手投入的时间精力成本都比较大。
神经中枢
推荐星级:★★★★☆
Ganglia是由加州大学伯克利分校发起的一个开源集群监控项目。它最初被设计用来监控成千上万的网络节点。Ganglia是一个分布式监控系统,具有跨平台的可扩展性和高性能计算系统。它已经被广泛移植到各种操作系统和处理器架构中。
用户群:适合大型服务器集群用户。
优点:
1.适用于监控系统性能,通过曲线可以很容易的看到各个节点的工作状态。
2.您可以自定义监控项目。监控显示有表单和图像两种,支持移动版。
3.部署简单,数万台机器可以分层次管理,无需逐一添加配置。
缺点:
1.没有内置的消息通知系统
2.没有报警机制,出现问题无法及时报警。
泽诺斯
推荐星级:★★★★☆
Zenoss Core是Zenoss的开源版本,商业版本是ZenossEnterprise。作为一款企业级智能监控软件,Zenoss Core允许IT管理员依靠单个WEB控制台监控网络架构的状态和健康状况。Zenoss Core的强大能力来自于深入的库存和配置管理数据库,以发现和管理公司IT环境的各类资产。Zenoss还提供了一个与CMDB相关的事件和错误管理系统,以帮助提高各种事件和提醒的管理效率。
优点:
1.Zenoss在其仪表板方面非常出色,可以用许多portlet进行配置。
2.每个用户的界面都是单独管理的。自定义仪表板不会影响其他用户。
3.强大的监控功能支持服务器、路由交换、防火墙、存储、数据库、中间件监控。
4.使用基于HBASE的opentsdb存储任意时间段的数据。
5.将状态监控、性能监控、资源管理和良好的报告机制有机地结合起来。
缺点:
1.对资源要求高,即使只管理少数设备,也会消耗大量硬件、内存等额外资源。
2.对于windows系统,开源版只提供SNMP,CPU、磁盘、硬件、软件、性能都通过WMI进行测试,付费版才提供。
开放式猎鹰
推荐星级:★★★★☆☆
Open-falcon是小米运维团队从互联网公司的需求出发,基于多年的运维经验,结合SRE、SA、DEVS的经验和反馈研发的企业级开源监控产品。
开放式猎鹰架构
用户群体:目前有数十家企业用户不同程度使用。
优点:
1.自动发现,支持falcon-agent,snmp,用户主动推送和用户自定义插件。
2.支持每周期数亿次的数据采集、报警判定、历史数据存储和查询。
3.高效门户,支持策略模板,模板继承和覆盖,多种报警模式,支持回叫。
4.单台机器支持200万公制的报告、归档和存储。
5.使用rrdtool的数据归档策略,一年的数百个指标历史数据在几秒钟内返回。
6.多维数据显示,用户自定义屏幕
7.目前通过各种插件支持Linux、Windows、Mysql、Redis、Me***che、RabbitMQ和switch monitoring。
缺点:由于发布时间较短,很多基础服务监控插件(如Tomcat、apache等。)还不支持,很多功能还在完善中。另外,由于缺乏专门的支持,虽然有开放的社区,但解决问题的效率相对较低。
商业运行和维护监控系统
健空堡
推荐星级:★★★★★
健康宝是云智能为用户提供IT性能监控的SaaS产品,包括网站监控、服务器监控、中间件监控、数据库监控、应用监控、API监控、页面性能监控。包括免费版、免费版和企业版,目前用户约40万,监测宝app也是国内唯一提供移动监测服务的产品。
用户群体:覆盖电商、移动互联网、广告媒体、网络游戏、教育医疗等几十万用户。,包括小米、陌陌、高德、用友、金山、途牛、聚美优品、陆金所、中国平安、建行信用卡中心、春雨医生、畅游、国家电网、中国电信、滴滴打车等
优点:
作为国内最早基于SaaS服务的网络监控平台,健康宝不仅为初级用户提供免费的标准服务,还允许企业用户按需购买所需的监控和报警资源,最大限度地节约企业的运维成本。
通过遍布全球的300多个分布式监控节点,健力宝主动实时监控和分析网络的稳定性和可用性,支持http(https)、ftp、ping、udp、tcp、***tp、traceroute等多种协议。,测量CDN效果和DNS状态,分析全网和各区域的性能趋势。
实时捕捉服务器的深层性能指标,支持Linux/Unix/Windows系统和云平台,支持CPU利用率、CPU平均负载、内存利用率、磁盘io、磁盘空利用率、网络流量和系统进程统计等物理指标,30多种应用服务。云主机的监控终端可以一键开启,无需复杂配置。至于应用服务的监控,Monitor Bao已经支持常见的应用类型,包括Apache、Lighttpd、Nginx、Tomcat、IIS、Memcache和Redis。存储层监控支持Hadoop、MySQL、MongoDB、SQLServer和Oracle的健康状态和性能监控。
健康宝是目前国内唯一支持API监控的网络监控产品。它通过API接口调用,模拟用户的使用过程,支持get、post、put、delete、head、options六种请求模式的实时监控。支持JSON、XML、文本、响应状态验证和Post***n脚本导入。
Docker监控也是Docker的专属功能,可以实时监控Docker容器的CPU、内存、网络流量和交换状态,让开发者和运维人员在使用Docker时可以清楚的掌握自己的资源消耗情况。
健康宝提供页面性能管理,基于国际标准建立页面性能指数,识别加载元素的状态和正确性,分析全网所有用户的响应时间,精准定位问题元素和优化建议。
及时有效的告警通知对于运维来说非常重要。Monitor可以根据SLA设置告警阈值,并在第一时间发送告警通知。监视器宝涵盖了最全面的报警通知方式:电子邮件、短信、电话语音、网址回拨通知、App推送等。此外,监控宝提供分级报警通知,可以根据不同级别的报警事件,向不同人员推送不同的报警,支持企业分级管理!
目前,健康宝已经开放了其智能代理,用户可以根据业务需求定制代理的开发,同时用户的数据安全得到保障。
健康宝提供私有化部署解决方案,满足政府、企业、金融行业的专有网络监控需求。
来自Compuware、CA、IBM等企业的资深IT服务专家,5年以上本地化企业级SaaS服务经验,100多人的技术服务团队,为用户提供最好的服务保障。
30网站服务监控
推荐星级:★★★☆☆☆
30网站服务监控是一款针对站长的网站监控产品,提供免费的网站和服务器监控。
用户群:个人站长
优点:
该服务是免费的,支持网站HTTP监控、PING监控、域名DNS监控和服务器监控。
提供网站访问的全景数据和简单的配置信息。
缺点:
只支持简单网站和服务器监控,历史数据保存15天,免费监控点只有4个。
上一次产品更新是在2014年9月。目前已经停止更新和运营支持。
阿里云监控
推荐星级:★★★★☆
阿里云监控是一款免费的网站监控产品,可以监控网站和服务器,提供短信、旺旺、邮件多种预警方式。
用户群:阿里云用户
优点:
与阿里云服务紧密捆绑,允许用户定制数据监控。
多阿里云IDC内网数据传输不占用客户公网资源。
支持业务数据的通用统计,从各个角度反映服务的运行情况。
缺点:
所有服务都基于阿里云,功能单一,扩展性差。
功能不够强大,无法满足基本的监控要求。
百度云观察
推荐星级:★★★☆☆☆
百度云观察是百度推出的云服务产品,类似于360云监测和阿里云监测。主要为站长们提供免费的一站式网站监控预***务,功能涵盖网站运行状态、安全性、访问速度等。
用户群:个人站长
优点:
对用户每天访问的网站进行安全检测。
国内主要城市的云节点覆盖CDN、DNS状态、主机监控。
缺点:
需要网站认证
监控点少,功能简单,只能监控网站状态,不支持监控服务器和应用。
蜜蜂网站监控
推荐星级:★☆☆☆☆
蜜蜂网站监测是一款针对中小企业需求开发的全面衡量网站运营的在线工具。它可以定期监控网站或服务器的可用性,并在网站无法连接或服务器出现错误时发送警报通知。
用户群:中小企业网站管理员
优点:
Bee通过探针节点和最后一公里两种模式监控网站的可用性,支持多种类型的站点监控和不同的网络访问传输协议;
提供多样化的监控报警设置,支持站内和RSS实时报警信息。
缺点:
仅支持基本的网站监控,监控点不可选,监控服务不稳定;
网站性能历史数据不够详细,无法导出。
随着新技术的不断发展,云服务已经成为互联网公司的必需品,但传统物理主机和云主机、私有云与公有云将长期共存。另外,互联网公司发展速度很快,小米、滴滴出行等很多公司都是短短几年发展起来的。因此,选择一款合适的云监控产品来陪伴公司同步成长是非常必要的。
本文来自无言温柔天然对象投稿,不代表舒华文档立场,如若转载,请注明出处:https://www.chinashuhua.cn/24/562645.html