CDH Service和Host监视器区别,主机监控各指标解释

Service 和Host监视器的作用

Service Monitor (SMON)

它的主要作用是:
收集有关服务的健康状况和指标信息,并在CM的Web UI上进行展示。
从YARN服务中收集活动信息,以便在CM的Web UI上显示YARN的作业列表。
从Impala服务中收集活动信息,以便在CM的Web UI上显示Impala的作业列表。

Host Monitor (HMON)

它的主要作用是:
收集有关主机的健康状况和指标信息,并在CM的Web UI上进行展示。

可以在cm上修改储存路径和保留多少磁盘空间(最低10G)

Cdh主机监控(各指标含义)

一、CPU监控

user 从系统启动开始累计到当前时刻,用户态的CPU时间(单位:jiffies) ,不包含 nice值为负进程。1jiffies=0.01秒
nice 从系统启动开始累计到当前时刻,nice值为负的进程所占用的CPU时间(单位:jiffies)
system 从系统启动开始累计到当前时刻,核心时间(单位:jiffies)
idle 从系统启动开始累计到当前时刻,除硬盘IO等待时间以外其它等待时间(单位:jiffies)
iowait 从系统启动开始累计到当前时刻,硬盘IO等待时间(单位:jiffies) ,
irq 从系统启动开始累计到当前时刻,硬中断时间(单位:jiffies)
softirq 从系统启动开始累计到当前时刻,软中断时间(单位:jiffies)

CPU时间=user+system+nice+idle+iowait+irq+softirq

二、聚合磁盘 IOPS

IOPS,也就是在一秒内,磁盘进行多少次 I/O 读写

三、系统文件容量

主机的磁盘空间、容量和已用容量

四、磁盘延迟

五、平均负载

系统的平均负载,分别是1分钟、5分钟、15分钟内系统的平均负载

提出以下建议:
>=0.70:没有任何反应,但有必要监控 CPU 负载。如果在一段时间内保持这种状态,就必须在事情变得更糟之前进行调查。
>=1.00:存在问题,您必须找到并修复它,否则系统负载的主要高峰将导致您的应用程序变慢或无响应。
>=3.00:你的系统变得 非常慢。甚至很难从命令行操作它来试图找出问题的原因,因此修复问题需要的时间比我们之前采取的行动要长。你冒的风险是系统会更饱和并且肯定会崩溃。
>=5.00:你可能无法恢复系统。你可以等待奇迹自发降低负载,或者如果你知道发生了什么并且可以负担得起,你可以在控制台中启动 kill -9 <process_name> 之类的命令 ,并祈求它运行在某些时候,以减轻系统负荷并重新获得其控制权。否则,你肯定别无选择,只能重新启动计算机。
https://blog.csdn.net/zuozewei/article/details/86483503

六、聚合磁盘吞吐量

每秒磁盘 I/O 的流量,即磁盘写入加上读出的数据的大小

吞吐量和iops
随机读写频繁的应用,如小文件存储(图片)、OLTP数据库、邮件服务器,关注随机读写性能,IOPS是关键衡量指标。
顺序读写频繁的应用,传输大量连续数据,如电视台的视频编辑,视频点播VOD(Video On Demand),关注连续读写性能。数据吞吐量是关键衡量指标。
https://www.cnblogs.com/sddai/p/8647795.html

发布了31 篇原创文章 · 获赞 11 · 访问量 6438

猜你喜欢

转载自blog.csdn.net/cyz52/article/details/103997764
CDH