使用Prometheus的Node-exporter监控Kubernetes的Node节点失败问题解决 - 代码天地

使用Prometheus的Node-exporter监控Kubernetes的Node节点失败问题解决

企业开发 2022-05-30 01:27:55 阅读次数: 0

今天继续给大家介绍Linux运维相关知识，本文主要内容是使用Prometheus的Node-exporter监控Kubernetes的Node节点失败问题解决。

一、报错现象

前段时间，我在配置Prometheus使用Node-exporter监控Kubernetes的Node节点时，发现监控失败，配置的自动发现监控项失效，在Prometheus的显示中没有出现对Node节点的监控项，查看Prometheus节点的日志，结果如下：
在这里插入图片描述

二、报错解决

我们可以使用kubectl exec命令进入到Prometheus容器内部，然后使用PING命令查看是否可以PING通上述IP地址，如果不能，那么可以采取将网络模式修改为ipvs的方式解决，解决方法如下所示：
执行命令：

kubectl edit cm kube-proxy -n kube-system

将mode改为mode “ipvs”
之后，创建/etc/sysconfig/modules/ipvs.modules文件，并在文件中写入如下内容：

modprobe -- ip_vs
modprobe -- ip_vs_rr
modprobe -- ip_vs_wrr
modprobe -- ip_vs_sh
modprobe -- nf_conntrack_ipv4

之后，我们执行命令：

chmod 755 /etc/sysconfig/modules/ipvs.modules
bash /etc/sysconfig/modules/ipvs.modules
lsmod | grep -e ip_vs -e nf_conntrack_ipv4

赋予该文件执行的权限，并且执行该文件，最后的命令时查看文件的执行情况，结果如下所示：
在这里插入图片描述
之后，我们需要重启kube-proxy，执行命令：

kubectl get pod -n kube-system | grep kube-proxy |awk '{system("kubectl delete pod "$1" -n kube-system")}'

注意，上述操作需要在Kubernetes集群的所有节点上操作。执行完毕后，我们查看kube-proxy的日志，结果如下所示：
在这里插入图片描述
如果之前的配置有误，那么Kubernetes的日志如下所示：

这时，我们就需要查看之前的步骤，然后进行改正。
最后，我们再次进入Prometheus的Pod中，发现可以PING通了，结果如下：

注：如果上述操作还是不能解决问题，那么可以参考以下方法解决：使用Prometheus的Node-exporter监控Kubernetes的Node节点失败（dial tcp i/o timeout）问题解决
原创不易，转载请说明出处：https://blog.csdn.net/weixin_40228200

猜你喜欢

转载自blog.csdn.net/weixin_40228200/article/details/124833372

使用Prometheus的Node-exporter监控Kubernetes的Node节点失败问题解决

使用Prometheus的Node-exporter监控Kubernetes的Node节点失败（dial tcp i/o timeout）问题解决

[prometheus]部署node-exporter

【监控系统】Prometheus监控组件Node-Exporter配置实战

Prometheus监控node-exporter常用指标含义

Prometheus（四） node-exporter监控服务器

Kubernetes之kubeadm集群监控篇—node-exporter部署

linux安装prometheus的node-exporter

Prometheus 监控 k8s服务发现 Node_Exporter 监控 Kubernetes 集群节点

Kubernetes监控方案kube-prometheus-prometheus-node-exporter-grafana

prometheus node-exporter增加新的自定义监控项

智能运维—Prometheus监控组件配置(pushgateway、node-exporter、mysql-exporter、k8s)

基于 Kubernetes v1.14.0 之 node-exporter系列监控部署

Prometheus收集node-exporter和cadvisor指标数据

node-exporter,prometheus,grafana三者之间的联系

kubernetes搭建二十、node-exporter+Prometheus+Grafana监控方案

Prometheus：监控与告警：12:使用cadvisor + Node Exporter进行监控

Prometheus Node Exporter 常用监控指标

Prometheus 笔记（01）— 环境搭建、docker 安装 prometheus/node-exporter/alertmanager/granafa

node-sass安装失败问题解决

【Docker】Docker 安装node-exporter prometheus pushgateway 页面显示Down

node-exporter常用指标含义

Prometheus Node_exporter

Prometheus 集成 Node Exporter

Prometheus+node-exporter

Prometheus：监控与告警：9:容器化方式使用Node Exporter和Prometheus

Prometheus：监控与告警：7: Node Exporter采集机器监控信息

Prometheus：监控与告警：17: 监控Kubernetes的Node

使用grafana+prometheus+node_exporter+influxdb 从零开始搭建服务器监控平台

Prometheus安装和配置node_exporter监控主机

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)