注意
本文档适用于 Ceph 的开发版本。
Influx 模块
influx 模块持续收集时间序列数据并将其发送到 influxdb 数据库。
influx 模块是在 13.x Mimic 版本中引入的。
启用
要启用该模块,请使用以下命令
ceph mgr module enable influx
如果您希望随后禁用该模块,可以使用等效的 disable 命令
ceph mgr module disable influx
配置
要使 influx 模块将统计信息发送到 InfluxDB 服务器,必须配置服务器地址和一些身份验证凭据。
使用以下命令设置配置值
ceph config set mgr mgr/influx/<key> <value>
最重要的设置是 mgr/influx/hostname、mgr/influx/username 和 mgr/influx/password。例如,典型的配置可能如下所示
ceph config set mgr mgr/influx/hostname influx.mydomain.com
ceph config set mgr mgr/influx/username admin123
ceph config set mgr mgr/influx/password p4ssw0rd
以下是所有配置设置的列表
- hostname
InfluxDB 服务器主机名
- 类型:
str
- username
InfluxDB 服务器用户的用户名
- 类型:
str
- password
InfluxDB 服务器用户的密码
- 类型:
str
- interval
向 InfluxDB 报告之间的时间间隔。默认值为 30 秒。
- 类型:
秒- 默认值:
30- min:
5
- database
InfluxDB 数据库名称。您需要创建此数据库并向配置的用户名授予写入权限,或者该用户名必须具有管理员权限才能创建它。
- 类型:
str- 默认值:
ceph
- port
InfluxDB 服务器端口
- 类型:
int- 默认值:
8086
- ssl
使用 https 连接 InfluxDB 服务器。使用“true”或“false”。
- 类型:
str- 默认值:
false
- verify_ssl
验证 InfluxDB 服务器的 https 证书。使用“true”或“false”。
- 类型:
str- 默认值:
true
- threads
应为发送数据到 InfluxDB 生成多少个工作线程。
- 类型:
int- 默认值:
5- 允许范围:
[1, 32]
- batch_size
发送到 InfluxDB 时,数据点的批次大小应为多少。
- 类型:
int- 默认值:
5000
调试
默认情况下,已设置一些调试语句和错误语句在日志文件中打印。用户可以在必要时添加更多。要使用模块中的调试选项
将此添加到
ceph.conf文件。[mgr] debug_mgr = 20
使用此命令
ceph influx self-test。检查日志文件。用户可能会发现使用
mgr[influx]过滤日志文件更容易。
有趣的计数器
下表描述了此模块输出的值的子集。
池
计数器 |
描述 |
|---|---|
stored |
存储在池中的字节数,不包括副本 |
max_avail |
池中可用的最大字节数 |
objects |
池中的对象数 |
wr_bytes |
写入池中的字节数 |
dirty |
池中脏字节数 |
rd_bytes |
从池中读取的字节数 |
stored_raw |
池中使用的字节数,包括制作的副本 |
OSD
计数器 |
描述 |
|---|---|
op_w |
客户端写入操作 |
op_in_bytes |
客户端操作总写入大小 |
op_r |
客户端读取操作 |
op_out_bytes |
客户端操作总读取大小 |
计数器 |
描述 |
|---|---|
op_wip |
当前正在处理的复制操作(primary) |
op_latency |
客户端操作延迟(包括队列时间) |
op_process_latency |
客户端操作延迟(不包括队列时间) |
op_prepare_latency |
客户端操作延迟(不包括队列时间和等待完成) |
op_r_latency |
读取操作延迟(包括队列时间) |
op_r_process_latency |
读取操作延迟(不包括队列时间) |
op_w_in_bytes |
客户端写入数据 |
op_w_latency |
写入操作延迟(包括队列时间) |
op_w_process_latency |
写入操作延迟(不包括队列时间) |
op_w_prepare_latency |
写入操作延迟(不包括队列时间和等待完成) |
op_rw |
客户端读-改-写操作 |
op_rw_in_bytes |
客户端读-改-写操作写入 |
op_rw_out_bytes |
客户端读-改-写操作读取 |
op_rw_latency |
读-改-写操作延迟(包括队列时间) |
op_rw_process_latency |
读-改-写操作延迟(不包括队列时间) |
op_rw_prepare_latency |
读-改-写操作延迟(不包括队列时间和等待完成) |
op_before_queue_op_lat |
调用队列之前的 IO 延迟(在真正进入 ShardedOpWq 队列之前) op_before_dequeue_op_lat |
op_before_dequeue_op_lat |
调用 dequeue_op 之前的 IO 延迟(已出队并获取 PG 锁) |
延迟计数器以微秒为单位测量,除非在描述中另有说明。