【云原生监控】Prometheus监控系统

🕗 发布于 2024-09-17 05:09 云原生 prometheus 监控系统 PromeSQL 企业级监控

Prometheus监控系统

资源列表

操作系统	配置	主机名	IP
CentOS 7.9	2C4G	prometheus-server	192.168.93.101
CentOS 7.9	2C4G	node-exporter	192.168.93.102
CentOS 7.9	2C4G	grafana	192.168.93.103

基础环境

关闭防火墙

systemctl stop firewalld
systemctl disable firewalld

关闭内核安全机制

setenforce 0
sed -i "s/^SELINUX=.*/SELINUX=disabled/g" /etc/selinux/config

修改主机名

hostnamectl set-hostname prometheus-server
hostnamectl set-hostname node-exporter
hostnamectl set-hostname grafana

一、部署Prometheus服务

作用：收集数据和展示数据

1.1、解压

[root@prometheus-server ~]# tar -zxvf prometheus-2.37.8.linux-amd64.tar.gz

[root@prometheus-server ~]# mv prometheus-2.37.8.linux-amd64 /usr/local/prometheus

1.2、配置systemctl启动

[root@prometheus-server ~]# cat >> /etc/systemd/system/prometheus.service << EOF
[Unit]
Description=xinjizhiwa Prometheus Server
Documentation=https://prometheus.io/docs/introduction/overview/
After=network.target
[Service]
Restart=on-failure
ExecStart=/usr/local/prometheus/prometheus \
--config.file=/usr/local/prometheus/prometheus.yml \
--web.enable-lifecycle
ExecReload=/bin/kill -HUP \$MAINPID
LimitNOFILE=65535

[Install]
WantedBy=multi-user.target
EOF

加载并启动服务

[root@prometheus-server ~]# systemctl daemon-reload
[root@prometheus-server ~]# systemctl enable prometheus.service --now

1.3、监听端口

Prometheus默认监听9090端口

[root@prometheus-server ~]# netstat -anpt | grep 9090
tcp6       0      0 :::9090                 :::*                    LISTEN      8659/prometheus     
tcp6       0      0 ::1:9090                ::1:56220               ESTABLISHED 8659/prometheus     
tcp6       0      0 ::1:56220               ::1:9090                ESTABLISHED 8659/prometheus

1.4、访问Prometheus仪表盘

访问地址：http://192.168.93.101:9090

二、部署Node-Exporter

作用：用来收集节点上的数据

2.1、解压

[root@node-exporter ~]# tar -zxvf node_exporter-1.6.1.linux-amd64.tar.gz

[root@node-exporter ~]# mv node_exporter-1.6.1.linux-amd64 /usr/local/node_exporter

2.2、配置systemctl启动

[root@node-exporter ~]# cat > /etc/systemd/system/node-exporter.service << EOF
[Unit]
Description=xinjizhiwa node-exporter
Documentation=https://prometheus.io/docs/introduction/overview/
After=network.target

[Service]
Restart=on-failure
ExecStart=/usr/local/node_exporter/node_exporter
ExecReload=/bin/kill -HUP \$MAINPID
LimitNOFILE=65535

[Install]
WantedBy=multi-user.target
EOF

加载并启动服务

[root@node-exporter ~]# systemctl daemon-reload 
[root@node-exporter ~]# systemctl enable node-exporter.service --now

2.3、监听端口

node-exporter默认监听9100端口

[root@node-exporter ~]# netstat -napt | grep 9100
tcp6       0      0 :::9100                 :::*                    LISTEN      8378/node_exporter

2.4、访问node-exporter仪表盘

访问地址：http://192.168.93.102:9100

三、配置Prometheus收集Exporter采集的数据

node-exporter会把数据统一收集，等待Prometheus进行收集数据展示

3.1、编辑Prometheus配置文件

[root@prometheus-server ~]# vim /usr/local/prometheus/prometheus.yml
# my global config
global:  scrape_interval: 3s # 抓取监控的间隔时间,多长时间获取一次数据(生产环境下,建议15-30s)  
 evaluation_interval: 15s # 多久读一次规则
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
    - static_configs:
        - targets:
          # - alertmanager:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first_rules.yml"
  # - "second_rules.yml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
# 被监控的配置
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: "prometheus"

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
      - targets: ["localhost:9090"]
  # 另起一个Job名称,被监控的主体自定义名称
  - job_name: "node-exporter"
    static_configs:
      # 被监控的数据抓取地址
      - targets: ["192.168.93.102:9100"]

3.2、重新加载Prometheus服务

此次的加载方式不是用systemctl进行加载的

[root@prometheus-server ~]# curl -X POST http://192.168.93.101:9090/-/reload

3.3、刷新Prometheus页面

点击Status>>Targets
此时，就会看到，新配置的被监控项主体的指标列表

在这里插入图片描述

四、执行PromeSQL

Prometheus自己的SQL查询语言

4.1、查看存活的节点

使用UP

4.2、查看CPU指标

使用node_cpu_seconds_total

五、Grafana展示数据

Grafana是一个开源的数据可视化和监控工具

5.1、安装并启动Grafana

[root@grafana ~]# yum -y localinstall grafana-enterprise-10.0.3-1.x86_64.rpm 

[root@grafana ~]# systemctl enable grafana-server.service --now

5.2、监听端口

Grafana默认监听3000端口

[root@grafana ~]# netstat -anpt | grep 3000
tcp6       0      0 :::3000                 :::*                    LISTEN      8421/grafana

5.3、访问Grafana页面

访问地址：http://192.168.93.103:3000
默认账户：admin
默认密码：admin
需重新设置密码即可登录
以下就是登录页面

5.4、配置数据源

依次点击home左边的三个横杠>Adminstration>Data sources>Add data-sources>Prometheus

在这里插入图片描述

填写数据源配置信息

Name：Prometheus-01  # 数据库名称，可随意填写，建议取名有见名知意
Prometheus server URL：http://192.168.93.101:9090   # Prometheus服务端的IP和默认端口

在这里插入图片描述

往下拉点击save&test

5.5、新建仪表盘

依次点击home坐标的三个横杠>Dashboards>Now>New Dashboards>Add visualization

在这里插入图片描述

选择刚刚配置的数据源

六、创建一个数据展示图

使用PromeSQL语言进行测试

6.1、测试代码

第一步，测试代码，就是计算一个cpu使用率的PromeSQL代码，测试没有问题之后，就复制展示这个SQL代码内容

(1 - sum(rate(node_cpu_seconds_total{mode="idle"}[5m])) / sum(rate(node_cpu_seconds_total[5m]))) * 100

在这里插入图片描述

6.2、写入Grafana图形

在这里插入图片描述

6.3、更改可视化监控页面

在这里插入图片描述

6.4、保存仪表盘

在这里插入图片描述

原文地址：https://blog.csdn.net/weixin_73059729/article/details/142301357

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【云原生监控】Prometheus之PushGateway
下一篇：基于环境音频和振动数据的人类活动识别

【nrm】 Node.js 包管理器
nrm（Node Registry Manager）是一个用于管理 Node.js 包管理器（如 npm和 Yarn）的注册表工具。它可以帮助用户快速切换不同的 npm 源，以便于提高包安装的速度和效
阅读更多2024-09-25
luceda ipkiss教程 74：布尔运算去掉部分图层
通过布尔运算去掉版图上部分元素
阅读更多2024-09-25
Java中的位图和布隆过滤器（如果想知道Java中有关位图和布隆过滤器的知识点，那么只看这一篇就足够了！）
Java中的位图和布隆过滤器（如果想知道Java中有关位图和布隆过滤器的知识点，那么只看这一篇就足够了！）
阅读更多2024-09-25
ReadWriteLock读写锁
ReadWriteLock是Java并发包中的一个接口，它定义了两种锁：读锁（Read Lock）和写锁（Write Lock），真正的实现类是ReentrantReadWriteLock。读锁允许多
阅读更多2024-09-25
VisionPro - 基础 - 模板匹配技术-应用2 - Search\PMAline\PatMax\Image Training 的使用和模型训练概论
Image Training 是VP最常用的一种模板匹配方法了。必须掌握：这节详细说明。本节内容：【通过图像来进行匹配，其实，在业界叫做非模板匹配。当然匹配的前提是，你需要有显著的特征。【案，上表
阅读更多2024-09-25
0基础学前端 day2
层叠样式表（CSS，Cascading Style Sheets）是用来进行网页样式和布局设计的语言。通过CSS，开发者可以控制网页中元素的颜色、字体、大小、间距以及布局等视觉效果。CSS让页面不仅仅
阅读更多2024-09-25
Ubuntu20安装g++ 13.2.0
使用 PPA 是最简单的方式来安装g++ 13或者较新的版本。如果需要特定的版本，可以选择手动编译，但这个过程较为复杂且耗时。通过这两种方法，你可以在 Ubuntu 20.04 上成功安装并使用g++
阅读更多2024-09-25
HTTPS加密流程
如果发生了中间人攻击这种情况是非常严重的，由于传输数据是需要借助非对称加密，所以在客户端发送数据前会先通过验证公钥的方式确认对方是否是服务器，再决定是否要传输数据，在这个过程中服务器会返回一个响应告诉
阅读更多2024-09-25
YOLOv9改进策略【Conv和Transformer】| Bottleneck Transformers 简单且高效的自注意力模块
本文记录的是利用优化的目标检测网络模型。标准的卷积操作虽然能有效捕获局部信息，但在处理需要全局信息整合的任务时存在局限性，而自注意力机制能够有效地建模长距离依赖，因此考虑将其引入到视觉架构中。同本文利
阅读更多2024-09-25
Linux基本指令（2）
而我们学过的文件操作中,每次都需要先打开文件,所以键盘显示器这些文件就在启动程序时打开了这些文件。我们也可以通过输出从定向来实现从一个终端向另一个终端中打印内容。带上后就可以递归将文件和子目录一起处理
阅读更多2024-09-25

【云原生监控】Prometheus监控系统

Prometheus监控系统

文章目录

资源列表

基础环境

一、部署Prometheus服务

1.1、解压

1.2、配置systemctl启动

1.3、监听端口

1.4、访问Prometheus仪表盘

二、部署Node-Exporter

2.1、解压

2.2、配置systemctl启动

2.3、监听端口

2.4、访问node-exporter仪表盘

三、配置Prometheus收集Exporter采集的数据

3.1、编辑Prometheus配置文件

3.2、重新加载Prometheus服务

3.3、刷新Prometheus页面

四、执行PromeSQL

4.1、查看存活的节点

4.2、查看CPU指标

五、Grafana展示数据

5.1、安装并启动Grafana

5.2、监听端口

5.3、访问Grafana页面

5.4、配置数据源

5.5、新建仪表盘

六、创建一个数据展示图

6.1、测试代码

6.2、写入Grafana图形

6.3、更改可视化监控页面

6.4、保存仪表盘

相关文章