40个步骤安装部署Prometheus监控系统-电子发烧友网

大家都说如果运维不上监控，那就是功力还没修炼到家。而当前在众多监控软件中，Prometheus备受大家青睐。今天浩道就跟大家分享关于Prometheus监控服务的安装部署指南。这份部署指南可以说是全网最详细了，如果按照这份指南都部署不成功，那么你只能加我VX,一对一手把手教了，不过我会教会大家的！一、Prometheus 监控工具介绍Prometheus是一套开源的监控&报警&时间序列数据库的组合，起始是由SoundCloud公司开发的。随着发展，越来越多公司和组织接受采用Prometheus，社区也十分活跃，他们便将它独立成开源项目，并且有公司来运作。google SRE的书内也曾提到跟他们BorgMon监控系统相似的实现是Prometheus。现在最常见的Kubernetes容器管理系统中，通常会搭配Prometheus进行监控。1、Prometheus 的优点

1、非常少的外部依赖，安装使用超简单；

2、已经有非常多的系统集成例如：docker HAProxy Nginx JMX等等；

3、服务自动化发现；

4、直接集成到代码；

5、设计思想是按照分布式、微服务架构来实现的；

6、多维数据模型：由度量名称和键值对标识的时间序列数据；

7、支持多种exporter采集数据；

8、PromQL：一种灵活的查询语言，可以利用多维数据完成复杂的查询；

9、不依赖分布式存储，单个服务器节点可直接工作（不需要安装数据库，直接使用即可，内置集成了数据库不需要重新的部署）；

10、基于HTTP的pull方式采集时间序列数据；

11、推送时间序列数据通过PushGateway组件支持，目标主机上报数据到PushGateway，普罗米修斯从PushGateway拉取数据，这个是可以跨网段的；

12、通过服务发现或静态配置发现目标；

13、多种图形模式及仪表盘支持（grafana）；

14、高效的存储，每个采集数据占用3.5bytes左右，300万的时间序列，30s的时间间隔，保留60天，消耗磁盘大约200G；

15、做高可用，对数据进行异地备份。联邦集群，部署多套普罗米修斯，每套普罗米修斯可以在不同的机房，然后将这些普罗米修斯汇总到一个普罗米修斯，那么就可以将各个地方的数据，整体收集上来了。

2、Prometheus 的组件与架构 Prometheus生态系统由多个组件组成，其中许多组件是可选的：

1、主要的Prometheus server，用于存储时间序列数据。

2、用于检测应用程序代码的客户端库。

3、用于支持short-lived工作的推送网关(push gateway)。

4、针对HAProxy，StatsD，Graphite等服务的exporters。

5、一个alertmanager处理警报管理器。

6、各种支持工具。

大多数Prometheus组件都是用Go编写的，因此很容易构建和部署为静态二进制文件。

具体组件的作用：

1）Prometheus Server：收集指标和存储时间序列数据，并提供查询接口（采集，存储，查询）；

2）ClientLibrary：客户端库；

3）Push Gateway：短期存储指标数据。主要用于临时性的任务，各个目标主机可以上报数据到pushgateway,，然后prometheus server统一从pushgateway拉取数据；

4）Exporters：采集已有的第三方服务监控指标并暴露metrics（类似于zabbix agent，但是exporter有很多种，针对不同的监控指标）；

5）Alertmanager：从prometheus server端收到alters之后，会进行去重，分组，并且路由到接收方，发出报警，常见的接收方式有：电子邮件，微信，钉钉；

6） Web UI：简单的Web控制台；

普罗米修斯服务端是内置了TSDB的数据库，是存储在本地的文件系统当中。存储了采集被监控端数据指标。获取指标有两种方式：1）一种直接是从pushgateway这里获取被监控指标，这是一个独立的组件，主要完成短周期任务暴露的指标，比如定时任务。（短周期任务不是每分钟都有的指标，可能在运行任务的时候才会产生指标。所以可以将临时的指标汇总到pushgateway，然后有pushgateway统一的暴露给服务端去采集）；

2）另外一种就是主要使用持久性的应用，比如nginx，mysql还要微服务jar包，这些都属于持久性运行任务的；

使用这种任务的监控就是采用exporter方式了。会配置exporter这样一个组件，主要是用来采集指标暴露给服务端。

Prometheus 根据配置的作业，直接从数据源pull拉取或者通过中间推送网关(push gateway),获取度量值Metrics。它在本地存储所有获取的样本，并在此数据上运行规则，以从现有数据聚合和记录新的时间序列，或者生成警报。Grafana或其他API使用者可用于可视化收集的数据。

服务端采集好之后就会存储在tsdb数据库当中，可以通过其ui去查看，因为其通过了http服务就可以访问其ui了。在ui上可以通过promql完成数据的查询。（export--->prometheus(TSDB)---->promsql）；

告警是由altermanager提供的，在普罗米修斯这里定义告警规则，普罗米修斯这里会周期的评估当前采集的指标是否触发了告警规则，如果触发了会将事件推送给altermanger。altermanger会根据自己相关的逻辑处理后发给接收人，提供email

普罗米修斯实现了服务的发现，也就是可以自动的找到被监控端，这个需要在普罗米修斯的配置文件里面去配置。有了服务发现就不要一个一个的去配置了，让被监控端自动纳入监控。

普罗米修斯从目标主机拉取数据的时候有两种方式，一种是静态的，也就是我们部署exporter，静态的采集指标，也可以配置服务发现，自动的发现指标数据。通过服务发现和exporter采集到的数据的方式都是采用了默认的pull方式拉取指标的，也可以使用pushgateway上报到prometheus当中。

3、监控指标数据模型

数据模型：

1）Prometheus将所有数据存储为时间序列（存储的时候都会记录时间，并且存储到时序的数据库里面，也就是内置的TSDB）；

2）具有相同度量名称以及标签属于同一个指标（指标名称是一样，但是标签是不一样的）；

3）每个时间序列都由度量标准名称和一组键值对（称为标签）唯一标识；

通过标签查询指定指标。

指标格式：指标名称加上多个标签

<metric name>{<label name>=<label value>,...}

在配置被监控端这里，要配置监控谁，在配置被监控端，必须要暴露指标出来，这种指标以https的方式给暴露出来，暴露出来之后在配置文件当中配置被监控端，最后就会被普罗米修斯给采集到，如果以上正确配置，在普罗米修斯的图形界面targets可以看到被监控端，也可以通过指标名称查看采集的数据了。

这个就相当于数据库，可以提供promql来查询数据，并且通过图表绘制出来；二、Prometheus监控安装部署1、环境及软件工具准备

1）基础环境准备，两台主机，规划信息如下：

2）关闭selinux；

vi编辑 /etc/selinux/config 文件，修改SELINUX的值为disabled

#注意修改完毕之后需要重启linux服务

SELINUX=disabled

3）关闭防火墙。

# 1 关闭firewalld服务
systemctl stop firewalld
systemctl disable firewalld
# 2 关闭iptables服务
systemctl stop iptables
systemctl disable iptables

4）prometheus官网下载：

https://prometheus.io/download/

这里下载最新版本：

https://github.com/prometheus/prometheus/releases/download/v2.45.0/prometheus-2.45.0.linux-amd64.tar.gz

5）node_exporter下载地址：

https://prometheus.io/download/

这里下载最新版本：

https://github.com/prometheus/node_exporter/releases/download/v1.6.1/node_exporter-1.6.1.linux-amd64.tar.gz

6）grafana官网下载 :

https://grafana.com/grafana/download

这里下载最新版本：

 https://dl.grafana.com/enterprise/release/grafana-enterprise-10.0.2-1.x86_64.rpm

2、prometheus安装

1）下载prometheus

weget https://github.com/prometheus/prometheus/releases/download/v2.45.0/prometheus-2.45.0.linux-amd64.tar.gz

我这里下载保存在 /opt目录下，完成如下所示：

[root@master opt]# ls -lh
总用量 87M
-rw-r--r--. 1 root root 87M 7月  19 17:21 prometheus-2.45.0.linux-amd64.tar.gz
[root@master opt]#

2）解压安装prometheus

[root@master opt]# tar -xzvf prometheus-2.45.0.linux-amd64.tar.gz
[root@master opt]# mv prometheus-2.45.0.linux-amd64 prometheus
[root@master opt]# ls -lh
总用量 87M
drwxr-xr-x. 4 1001  123 132 6月  23 23:45 prometheus
-rw-r--r--. 1 root root 87M 7月  19 17:21 prometheus-2.45.0.linux-amd64.tar.gz
[root@master opt]#

3）进入到 /opt/prometheus 目录启动prometheus

[root@master opt]# cd prometheus
[root@master prometheus]# ./prometheus
ts=2023-07-19T09:32:03.885Z caller=main.go:534 level=info msg="No time or size retention was set so using the default time retention" duration=15d
ts=2023-07-19T09:32:03.886Z caller=main.go:578 level=info msg="Starting Prometheus Server" mode=server version="(version=2.45.0, branch=HEAD, revision=8ef767e396bf8445f009f945b0162fd71827f445)"
ts=2023-07-19T09:32:03.887Z caller=main.go:583 level=info build_context="(go=go1.20.5, platform=linux/amd64, user=root@920118f645b7, date=20230623-1549, tags=netgo,builtinassets,stringlabels)"
ts=2023-07-19T09:32:03.887Z caller=main.go:584 level=info host_details="(Linux 3.10.0-957.el7.x86_64 #1 SMP Thu Nov 8 2332 UTC 2018 x86_64 master (none))"
ts=2023-07-19T09:32:03.887Z caller=main.go:585 level=info fd_limits="(soft=4096, hard=4096)"
ts=2023-07-19T09:32:03.887Z caller=main.go:586 level=info vm_limits="(soft=unlimited, hard=unlimited)"
ts=2023-07-19T09:32:03.893Z caller=web.go:562 level=info component=web msg="Start listening for connections" address=0.0.0.0:9090
ts=2023-07-19T09:32:03.896Z caller=main.go:1019 level=info msg="Starting TSDB ..."
ts=2023-07-19T09:32:03.901Z caller=tls_config.go:274 level=info component=web msg="Listening on" address=[::]:9090
ts=2023-07-19T09:32:03.901Z caller=tls_config.go:277 level=info component=web msg="TLS is disabled." http2=false address=[::]:9090
ts=2023-07-19T09:32:03.913Z caller=head.go:595 level=info component=tsdb msg="Replaying on-disk memory mappable chunks if any"
ts=2023-07-19T09:32:03.913Z caller=head.go:676 level=info component=tsdb msg="On-disk memory mappable chunks replay completed" duration=15.4µs
ts=2023-07-19T09:32:03.913Z caller=head.go:684 level=info component=tsdb msg="Replaying WAL, this may take a while"
ts=2023-07-19T09:32:03.914Z caller=head.go:755 level=info component=tsdb msg="WAL segment loaded" segment=0 maxSegment=0
ts=2023-07-19T09:32:03.914Z caller=head.go:792 level=info component=tsdb msg="WAL replay completed" checkpoint_replay_duration=41.9µs wal_replay_duration=1.1234ms wbl_replay_duration=11.2µs total_replay_duration=1.3374ms
ts=2023-07-19T09:32:03.916Z caller=main.go:1040 level=info fs_type=XFS_SUPER_MAGIC
ts=2023-07-19T09:32:03.916Z caller=main.go:1043 level=info msg="TSDB started"
ts=2023-07-19T09:32:03.916Z caller=main.go:1224 level=info msg="Loading configuration file" filename=prometheus.yml
ts=2023-07-19T09:32:03.928Z caller=main.go:1261 level=info msg="Completed loading of configuration file" filename=prometheus.yml totalDuration=11.5929ms db_storage=15.8µs remote_storage=19.2µs web_handler=10.7µs query_engine=14µs scrape=1.0045ms scrape_sd=52.4µs notify=42.7µs notify_sd=29.6µs rules=11.8µs tracing=32.6µs
ts=2023-07-19T09:32:03.928Z caller=main.go:1004 level=info msg="Server is ready to receive web requests."
ts=2023-07-19T09:32:03.928Z caller=manager.go:995 level=info component="rule manager" msg="Starting rule manager..."

4）待启动完成后，用以下地址直接无密码登录

http://192.168.20.231:9090/

如下图所示：

5）为prometheus服务创建service并设置开机自动启动

vim /usr/lib/systemd/system/prometheus.service

编辑如下内容，大家根据自己实际的安装目录进行编辑

[root@master ~]# cat /usr/lib/systemd/system/prometheus.service
[Unit]
Description=prometheus
Documentation=https://prometheus.io/
After=network.target
[Service]
Type=simple
User=root
Group=root
ExecStart=/opt/prometheus/prometheus --config.file=/opt/prometheus/prometheus.yml
Restart=on-failure
[Install]
WantedBy=multi-user.target
[root@master ~]#

使service生效并且设置开机自启动

systemctl daemon-reload

systemctl enable prometheus

6）reboot重启系统，查看服务状态是正常的

[root@master ~]# systemctl status prometheus
● prometheus.service - prometheus
   Loaded: loaded (/usr/lib/systemd/system/prometheus.service; enabled; vendor preset: disabled)
   Active: active (running) since 三 2023-07-19 0933 CST; 43s ago
     Docs: https://prometheus.io/
 Main PID: 5976 (prometheus)
   CGroup: /system.slice/prometheus.service
           └─5976 /opt/prometheus/prometheus --config.file=/opt/prometheus/prometheus.yml


7月 19 0934 master prometheus[5976]: ts=2023-07-19T0134.433Z caller=head.go:676 level=info component=tsdb msg="On-disk memory mappable chunks replay completed" duration=55.101μs
7月 19 0934 master prometheus[5976]: ts=2023-07-19T0134.433Z caller=head.go:684 level=info component=tsdb msg="Replaying WAL, this may take a while"
7月 19 0934 master prometheus[5976]: ts=2023-07-19T0134.437Z caller=head.go:755 level=info component=tsdb msg="WAL segment loaded" segment=0 maxSegment=0
7月 19 0934 master prometheus[5976]: ts=2023-07-19T0134.437Z caller=head.go:792 level=info component=tsdb msg="WAL replay completed" checkpoint_replay_duration=1.016…ion=3.831257ms
7月 19 0934 master prometheus[5976]: ts=2023-07-19T0134.439Z caller=main.go:1040 level=info fs_type=XFS_SUPER_MAGIC
7月 19 0934 master prometheus[5976]: ts=2023-07-19T0134.439Z caller=main.go:1043 level=info msg="TSDB started"
7月 19 0934 master prometheus[5976]: ts=2023-07-19T0134.439Z caller=main.go:1224 level=info msg="Loading configuration file" filename=/opt/prometheus/prometheus.yml
7月 19 0934 master prometheus[5976]: ts=2023-07-19T0134.444Z caller=main.go:1261 level=info msg="Completed loading of configuration file" filename=/opt/prometheus/prometheus.yml…μs
7月 19 0934 master prometheus[5976]: ts=2023-07-19T0134.444Z caller=main.go:1004 level=info msg="Server is ready to receive web requests."
7月 19 0934 master prometheus[5976]: ts=2023-07-19T0134.444Z caller=manager.go:995 level=info component="rule manager" msg="Starting rule manager..."
Hint: Some lines were ellipsized, use -l to show in full.
[root@master ~]#

3、grafana安装1）我这里安装最新版本的grafana，大家可以直接通过yum命令下载安装

yum install -y https://dl.grafana.com/enterprise/release/grafana-enterprise-10.0.2-1.x86_64.rpm

也可以将对应二进制文件下载到本地后再进行安装，这样速度快点。

[root@master opt]# ll
总用量 174664
-rw-r--r--. 1 root root 87661825 7月  19 10:03 grafana-enterprise-10.0.2-1.x86_64.rpm
drwxr-xr-x. 5 1001  123      144 7月  19 2023 prometheus
-rw-r--r--. 1 root root 91189594 7月  19 2023 prometheus-2.45.0.linux-amd64.tar.gz
[root@master opt]# yum install grafana-enterprise-10.0.2-1.x86_64.rpm

2）待安装完毕后，启动grafana服务，查看到服务状态如下正常。

[root@master ~]#  systemctl daemon-reload
[root@master ~]# systemctl start grafana-server
[root@master ~]# systemctl status grafana-server
● grafana-server.service - Grafana instance
   Loaded: loaded (/usr/lib/systemd/system/grafana-server.service; disabled; vendor preset: disabled)
   Active: active (running) since 三 2023-07-19 1015 CST; 25s ago
     Docs: http://docs.grafana.org
 Main PID: 6945 (grafana)
   CGroup: /system.slice/grafana-server.service
           └─6945 /usr/share/grafana/bin/grafana server --config=/etc/grafana/grafana.ini --pidfile=/var/run/grafana/grafana-server.pid --packaging=rpm cfg:default.paths.logs=/var/log/gr...


7月 19 1015 master grafana[6945]: logger=ngalert.state.manager t=2023-07-19T1015.24341291+08:00 level=info msg="Warming state cache for startup"
7月 19 1015 master grafana[6945]: logger=caching.service t=2023-07-19T1015.24445863+08:00 level=warn msg="Caching service is disabled"
7月 19 1015 master grafana[6945]: logger=report t=2023-07-19T1015.244980141+08:00 level=warn msg="Scheduling and sending of reports disabled, SMTP is not configured ... to enable."
7月 19 1015 master grafana[6945]: logger=http.server t=2023-07-19T1015.250259745+08:00 level=info msg="HTTP Server Listen" address=[::]:3000 protocol=http subUrl= socket=
7月 19 1015 master grafana[6945]: logger=sqlstore.transactions t=2023-07-19T1015.267350682+08:00 level=info msg="Database locked, sleeping then retrying" error="data...e is locked"
7月 19 1015 master grafana[6945]: logger=ngalert.state.manager t=2023-07-19T1015.268604707+08:00 level=info msg="State cache has been initialized" states=0 duration=25.191797ms
7月 19 1015 master grafana[6945]: logger=ticker t=2023-07-19T1015.268828111+08:00 level=info msg=starting first_tick=2023-07-19T1020+08:00
7月 19 1015 master grafana[6945]: logger=ngalert.multiorg.alertmanager t=2023-07-19T1015.268860012+08:00 level=info msg="starting MultiOrg Alertmanager"
7月 19 1016 master grafana[6945]: logger=grafana.update.checker t=2023-07-19T1016.035234839+08:00 level=info msg="Update check succeeded" duration=795.319198ms
7月 19 1016 master grafana[6945]: logger=plugins.update.checker t=2023-07-19T1016.117663666+08:00 level=info msg="Update check succeeded" duration=874.346258ms
Hint: Some lines were ellipsized, use -l to show in full.
[root@master ~]#

3）将grafana-server服务设置为开机自启动

systemctl enable grafana-server

4）通过以下地址访问garfana，并且配置相应的数据源

http://192.168.20.231:3000/login

登录界面如下所示，默认用户名及密码分别是admin，admin

5）登录进入grafana系统后，对数据源进行配置，点击，add your first data source，进入添加数据源页面：

6）进入后，点击Prometheus，进入配置页面；

7）编辑HTTP下的URL，这里是主机IP是192.168.20.231，所以填：http://192.68.20.231:9090

8）拉到最底部进行保存，如下所示即为保存成功。

4、监控主机中安装node_exporter

首先在监控主机192.168.20.231上进行安装该组件。

1）下载最新的node_exporter版本

wget https://github.com/prometheus/node_exporter/releases/download/v1.6.1/node_exporter-1.6.1.linux-amd64.tar.gz

下载完成后如下图所示：

2）对软件压缩包进行解压，并且将安装包放到自己系统安装目录下，我自己放在/usr/local/目录中

[root@master ruanjianfile]# tar -xzf node_exporter-1.6.1.linux-amd64.tar.gz
[root@master ruanjianfile]# mv node_exporter-1.6.1.linux-amd64 /usr/local/

3）将安装包中的可执行文件node_exporter拷贝到/usr/local/bin目录中

mv /usr/local/node_exporter-1.6.1.linux-amd64/node_exporter /usr/local/bin/

4）为node_exporter服务创建service服务

vim /usr/lib/systemd/system/node_exporter.service

大家根据自己实际安装目录，写入cat命令相关内容到上述文件中。

[root@master ruanjianfile]# cat /usr/lib/systemd/system/node_exporter.service
[Unit]
Description=node_exporter
Documentation=https://prometheus.io/
After=network.target
[Service]
Type=simple
User=root
Group=root
ExecStart=/usr/local/bin/node_exporter
Restart=on-failure
[Install]
WantedBy=multi-user.target

5）为node_exporter设置自动启动并启动服务

systemctl daemon-reload
systemctl enable node_exporter
systemctl start node_exporter

6）查看node_exporter服务状态，如下服务状态为正常状态

[root@master ~]# systemctl status node_exporter
● node_exporter.service - node_exporter
   Loaded: loaded (/usr/lib/systemd/system/node_exporter.service; enabled; vendor preset: disabled)
   Active: active (running) since 三 2023-07-19 1407 CST; 3min 0s ago
     Docs: https://prometheus.io/
 Main PID: 7146 (node_exporter)
   CGroup: /system.slice/node_exporter.service
           └─7146 /usr/local/bin/node_exporter


7月 19 14:25:07 master node_exporter[7146]: ts=2023-07-19T06:25:07.181Z caller=node_exporter.go:117 level=info collector=thermal_zone
7月 19 14:25:07 master node_exporter[7146]: ts=2023-07-19T06:25:07.181Z caller=node_exporter.go:117 level=info collector=time
7月 19 14:25:07 master node_exporter[7146]: ts=2023-07-19T06:25:07.181Z caller=node_exporter.go:117 level=info collector=timex
7月 19 14:25:07 master node_exporter[7146]: ts=2023-07-19T06:25:07.181Z caller=node_exporter.go:117 level=info collector=udp_queues
7月 19 14:25:07 master node_exporter[7146]: ts=2023-07-19T06:25:07.181Z caller=node_exporter.go:117 level=info collector=uname
7月 19 14:25:07 master node_exporter[7146]: ts=2023-07-19T06:25:07.181Z caller=node_exporter.go:117 level=info collector=vmstat
7月 19 14:25:07 master node_exporter[7146]: ts=2023-07-19T06:25:07.181Z caller=node_exporter.go:117 level=info collector=xfs
7月 19 14:25:07 master node_exporter[7146]: ts=2023-07-19T06:25:07.181Z caller=node_exporter.go:117 level=info collector=zfs
7月 19 14:25:07 master node_exporter[7146]: ts=2023-07-19T06:25:07.182Z caller=tls_config.go:274 level=info msg="Listening on" address=[::]:9100
7月 19 14:25:07 master node_exporter[7146]: ts=2023-07-19T06:25:07.182Z caller=tls_config.go:277 level=info msg="TLS is disabled." http2=f...::]:9100
Hint: Some lines were ellipsized, use -l to show in full.
[root@master ~]#

5、监控主机中进行监控相关参数配置

1）vi编辑修改prometheus中相关配置文件；

主要在对应该控件软件安装目录下/opt/prometheus/prometheus.yml这个文件中；

在原文件的scrape_configs模块下增加如下配置内容：

  - job_name: 'master_prometheus'
    static_configs:
        - targets: ['192.168.20.231:9100']

修改后/opt/prometheus/prometheus.yml如下所示：

[root@master prometheus]# cat prometheus.yml
# my global config
global:
  scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).


# Alertmanager configuration
alerting:
  alertmanagers:
    - static_configs:
        - targets:
          # - alertmanager:9093


# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first_rules.yml"
  # - "second_rules.yml"


# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=` to any timeseries scraped from this config.
  - job_name: "prometheus"


    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.


    static_configs:
      - targets: ["localhost:9090"]


  - job_name: 'master_prometheus'
    static_configs:
        - targets: ['192.168.20.231:9100']

2）检查配置是否正确：

养成好习惯，每次修改配置文件完成，用promtool检测配置文件是否正确。如下检查配置文件正确方可执行下一步。

[root@master prometheus]# /opt/prometheus/promtool check config /opt/prometheus/prometheus.yml
Checking /opt/prometheus/prometheus.yml
 SUCCESS: /opt/prometheus/prometheus.yml is valid prometheus config file syntax


[root@master prometheus]#

3）重启prometheus服务进行相关测试

systemctl restart prometheus

打开如下测试地址

http://192.168.20.231:9090/targets

如下图所示，可以看到targets已经增加了对监控主机master_prometheus的监控。

6、被监控主机中安装node_exporter及进行参数配置

首先在被监控主机192.168.20.232上进行安装该组件。

1）安装步骤参考监控主机中node_exporter安装这个章节，安装方法步骤一样。

2）在监控主机192.168.20.231上修改对应配置文件，

修改/opt/prometheus/prometheus.yml这个文件后面,添加如下内容：

  - job_name: "node1-prometheus"
    static_configs:
        - targets: ['192.168.20.232:9100']

3）检测配置文件正常后，重启服务

[root@master prometheus]# /opt/prometheus/promtool check config /opt/prometheus/prometheus.yml
Checking /opt/prometheus/prometheus.yml
 SUCCESS: /opt/prometheus/prometheus.yml is valid prometheus config file syntax


[root@master prometheus]# systemctl restart prometheus

4）待服务起来后，打开下面地址进行测试

http://192.168.20.231:9090/targets

正常如下图所示,targets已经增加了对被监控主机node1的监控。

7、grafana中添加配置监控模板

1）如图点击“+”号后，选择import dashboard

2）如下图，搜索系统默认模板8919，然后点击Load

3）点Load后，稍等会，grafana会直接从官方网站导入编号为8919的面板如下图所示：

4）选择数据源Prometheus-1，点击“Import”，显示master和node1监控界面显示如下图所示：

四、总结

到此、整套Prometheus监控系统已经部署完毕，并且已经可以正常监控。但是其展示的只是它本身最基本的功能，其它组件及模块相关的功能配置，要靠大家自行去研究学习，那样方可发挥出它强大的监控系统功能。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

监控系统

监控系统

+关注

关注
21

文章
3907

浏览量
174465
自动化

自动化

+关注

关注
29

文章
5563

浏览量
79242
Prometheus

Prometheus

+关注

关注
0

文章
27

浏览量
1714

原文标题：【全网最详细】40个步骤安装部署Prometheus监控系统

文章出处：【微信号：浩道linux，微信公众号：浩道linux】欢迎添加关注！文章转载请注明出处。

Prometheus的架构原理从“监控”谈起

Prometheus是继Kubernetes（k8s）之后，CNCF毕业的第二个开源项目，其来源于Google的Borgmon。本文从监控这件事说起，深入浅出Prometheus的架构

发表于 10-10 15:47 •4480次阅读

<b class='flag-5'>Prometheus</b>的架构原理从“<b class='flag-5'>监控</b>”谈起

Prometheus的基本原理与开发指南

导读本文由梯度科技云管研发部高级工程师周宇明撰写，共分为7章，紧密围绕Prometheus的基本原理与开发指南展开介绍：监控系统概述 Prometheus入门 Pro

发表于 11-09 10:45 •1120次阅读

<b class='flag-5'>Prometheus</b>的基本原理与开发指南

阿里云容器Kubernetes监控(二) - 使用Grafana展现Pod监控数据

展示，只需要配置一个可用的Grafana与相应的Dashboard即可。操作步骤首先我们登陆控制台，部署Grafana与Grafana的Service:选择namespace为kube-system

发表于 05-10 15:28

prometheus做监控服务的整个流程介绍

最近有个新项目需要搞一套完整的监控告警系统，我们使用了开源监控告警系统Prometheus；其功

发表于 12-23 17:34

简述linux-arm64 UOS安装开源Grafana的步骤

（linux-arm64）UOS安装开源Grafana-7.2.0,和CentOS安装步骤一样Grafana是一款用Go语言开发的开源数据可视化工具，可以做数据监控和数据统计，带有告警

发表于 06-16 15:00

部署普罗米修斯(Prometheus)监控平台前需考虑的六大因素

企业在采用容器的同时，也将容器的监控问题放在了比较优先的位置上，不少企业使用普罗米修斯（Prometheus）监控容器和微服务，对于规模企业通常会更加激进，所以当他们规模部署时将面临扩

发表于 09-07 10:16 •5542次阅读

django-prometheus数据监控

django-prometheus.zip

发表于 04-26 11:07 •1次下载

django-<b class='flag-5'>prometheus</b>数据<b class='flag-5'>监控</b>

Prometheus服务监控系统

prometheus.zip

发表于 04-26 10:23 •3次下载

<b class='flag-5'>Prometheus</b>服务<b class='flag-5'>监控</b><b class='flag-5'>系统</b>

使用Thanos+Prometheus+Grafana构建监控系统

对于弹性伸缩和高可用的系统来说，一般有大量的指标数据需要收集和存储，如何为这样的系统打造一个监控方案呢？本文介绍了如何使用 Thanos+Prome

发表于 05-05 21:14 •2635次阅读

监控神器：Prometheus

Prometheus发展速度很快，12年开发完成，16年加入CNCF，成为继K8s 之后第二个CNCF托管的项目，目前Github 42k的，而且社区很活跃，维护频率很高，基本稳定在1个月1个

发表于 07-31 11:55 •1185次阅读

如何基于kube-prometheus设计一个监控系统

本文提供了作者的应用示例，另外还记录了作者在学习、使用 Prometheus 过程中的一些笔记，如 arm 版镜像获取、一些工具的使用等。

发表于 09-13 09:47 •1032次阅读

关于Prometheus监控系统相关的知识体系

今天浩道跟大家分享关于Prometheus监控系统相关的知识体系，让你通过本文可以大体掌握其相关知识体系！

发表于 10-20 09:06 •1191次阅读

prometheus下载安装教程

Prometheus 是一个开放性的监控解决方案，用户可以非常方便的安装和使用 Prometheus 并且能够非常方便的对其进行扩展。在

发表于 01-13 16:07 •8012次阅读

基于kube-prometheus的大数据平台监控系统设计

本文介绍了如何基于 kube-prometheus 设计一个监控系统，以灵活简单的方式对 kubernetes 上的应用进行指标采集，并实现监控

发表于 05-30 17:02 •667次阅读

基于Prometheus开源的完整监控解决方案

每一个被 Prometheus 监控的服务都是一个 Job，Prometheus 为这些 Job 提供了官方的 SDK ，利用这个 SDK

发表于 10-18 09:15 •478次阅读

搜索历史

40个步骤安装部署Prometheus监控系统

评论

Prometheus的架构原理从“监控”谈起

Prometheus的基本原理与开发指南

阿里云容器Kubernetes监控(二) - 使用Grafana展现Pod监控数据

prometheus做监控服务的整个流程介绍

简述linux-arm64 UOS安装开源Grafana的步骤

部署普罗米修斯(Prometheus)监控平台前需考虑的六大因素

django-prometheus数据监控

Prometheus服务监控系统

使用Thanos+Prometheus+Grafana构建监控系统

监控神器：Prometheus

如何基于kube-prometheus设计一个监控系统

关于Prometheus监控系统相关的知识体系

prometheus下载安装教程

基于kube-prometheus的大数据平台监控系统设计

基于Prometheus开源的完整监控解决方案