配置监视者系统的监视器,以监视InfluxDB 1.x服务器
InfluxData的TICK堆栈的灵活性和可移植性使其能够轻松用于不同的监控解决方案,包括用另一个TICK堆栈监控TICK堆栈。 本指南介绍了如何设置外部TICK堆栈监控器,将重要的指标发送并进行监控。
本指南中使用了以下术语:
- 主要 - 对于监控的 TICK 堆栈或集群,正常运行时间最为重要。
- 监控器 - 监控数据被发送和处理的 监控 TICK 堆栈。
本指南假设一个主节点或集群已经在运行。
安装监视器
安装一个单独的 TICK 堆栈以作为您的监控器。
您的监控器应与您的主集群在不同的硬件上。
TICK 堆栈的安装说明提供在 安装指南 中。
为了使您的监视器能够从您的主集群接收数据,主集群必须能够通过HTTP或UDP连接到您的监视器的API端点。
在每个节点上安装Telegraf
在您希望监控的主要 InfluxDB 集群的每个节点上安装 telegraf 代理。
将Telegraf收集的数据发送到您的监视器
生成一个Telegraf配置文件
并修改InfluxDB输出url设置以包括您监视器的
InfluxDB API端点的URL。
telegraf.conf
# ...
[[outputs.influxdb]]
## The full HTTP or UDP URL for your InfluxDB instance.
urls = ["http://monitor-url.com:8086"]
# ...
配置Telegraf输入插件
默认情况下,Telegraf 被配置为从主机收集以下系统指标:
- 中央处理器
- 磁盘
- 磁盘输入输出
- 内存
- 处理过程
- 交换
- 系统(负载、CPU数量、用户数量、运行时间等)
使用其他 Telegraf 输入插件 来收集各种指标。
监控InfluxDB性能指标
要监控InfluxDB的内部性能,请在用于运行Telegraf 在InfluxDB实例上的Telegraf配置文件中启用InfluxDB输入插件。InfluxDB输入插件从本地InfluxDB /debug/vars端点拉取InfluxDB内部指标。
# ...
[[inputs.influxdb]]
# ...
## Multiple URLs from which to read InfluxDB-formatted JSON
## Default is "http://localhost:8086/debug/vars".
urls = [
"http://localhost:8086/debug/vars"
]
# ...
监控Kapacitor性能指标
要监控Kapacitor的内部性能,请在用于运行Telegraf的Telegraf配置文件中启用Kapacitor输入插件在Kapacitor实例上。Kapacitor输入插件从本地Kapacitor /debug/vars 端点拉取Kapactor内部指标。
# ...
[[inputs.kapacitor]]
# ...
## Multiple URLs from which to read Kapacitor-formatted JSON
## Default is "http://localhost:9092/kapacitor/v1/debug/vars".
urls = [
"http://localhost:9092/kapacitor/v1/debug/vars"
]
# ...
(可选) 命名空间监控数据
如果 Telegraf 正在您的监控实例上运行,它将默认将您的监控自身的指标存储在 telegraf 数据库中。为了将您的监控的内部数据与其他监控数据分开,请配置您的本地 Telegraf 代理,将数据写入除 telegraf 之外的数据库,使用在 [[outputs.influxdb]] 下的 database 设置在您的 telelgraf.conf 中。
# ...
[[outputs.influxdb]]
# ...
## The target database for metrics; will be created as needed.
database = "monitor_local"
# ...
(可选) 更新主要主机名
Telegraf的默认行为是在每个数据点上包含一个 host 标签,使用主机机器提供的 os.hostname。通过更新 [agent] 部分下的 hostname 设置来自定义主机名,在你的 telegraf.conf 中。
telegraf.conf中的自定义主机名示例
[agent]
# ...
## Override default hostname, if empty use os.Hostname()
hostname = "primary_influxdb_1"
# ...
启动 Telegraf
在每个主要节点上安装并配置Telegraf后,使用您的自定义配置文件启动Telegraf。
telegraf -config path/to/telegraf.conf
创建Kapacitor监控警报
监控数据现在应该正在从您的主集群流向您的监视器,在那里可以被监视器的Kapacitor组件处理。Create Kapacitor alerts 以便在检测到任何被监控的指标中的问题时提醒您。