InfluxDB 术语表
此页面记录了早期版本的 InfluxDB OSS。 InfluxDB OSS v2 是最新的稳定版本。 请参阅相应的 InfluxDB v2 文档: 术语表。
聚合
一个返回一组点的聚合值的InfluxQL函数。有关可用和即将推出的聚合的完整列表,请参见 InfluxQL functions。
相关条目: function, selector, transformation
批处理
以换行符(0x0A)分隔的InfluxDB行协议格式的数据点集合。
可以使用单个HTTP请求向写入端点提交一批数据点。
这通过大幅减少HTTP开销,使得使用InfluxDB API的写入操作更高效。
InfluxData建议的批量大小为5,000-10,000个数据点,尽管不同的用例可能更适合显著更小或更大的批量。
相关条目: InfluxDB line protocol, point
桶
桶是存储时间序列数据的命名位置,在 InfluxDB 2.0 中。在 InfluxDB 1.8+ 中,数据库与保留策略的每种组合(数据库/保留策略)代表一个桶。使用与 InfluxDB 1.8+ 一起包含的 InfluxDB 2.x API 兼容端点 与桶进行交互。
连续查询 (CQ)
在数据库中自动和定期运行的InfluxQL查询。
连续查询需要在SELECT子句中使用一个函数,并且必须包含一个GROUP BY time()子句。
请参见连续查询。
相关条目: function
数据库
用户、保留策略、持续查询和时间序列数据的逻辑容器。
相关条目: continuous query, retention policy, user
持续时间
保留策略的属性,决定了InfluxDB存储数据的时间长度。 超过该持续时间的数据会自动从数据库中删除。 请参阅 数据库管理 以了解如何设置持续时间。
相关条目: retention policy
字段
InfluxDB 数据结构中记录元数据和实际数据值的键值对。字段在 InfluxDB 数据结构中是必需的,并且它们不是索引 - 对字段值的查询会扫描所有匹配指定时间范围的点,因此相对于标签,这种查询的性能较差。
查询提示: 将字段与标签进行比较;标签是被索引的。
相关条目: field key, field set, field value, tag
字段键
构成字段的键值对的关键部分。
字段键是字符串,存储元数据。
相关条目: field, field set, field value, tag key
字段集合
一个点的字段键和值的集合。
相关条目: field, field key, field value, point
字段值
构成字段的键值对的值部分。
字段值是实际数据;它们可以是字符串、浮点数、整数或布尔值。
字段值总是与时间戳相关联。
字段值未被索引 - 针对字段值的查询会扫描所有匹配指定时间范围的点,因此性能不好。
查询提示: 比较字段值和标签值;标签值是被索引的。
相关条目: field, field key, field set, tag value, timestamp
函数
InfluxQL 聚合、选择器和转换。
请参阅 InfluxQL Functions 以获取 InfluxQL 函数的完整列表。
相关条目: aggregation, selector, transformation
标识符
引用连续查询名称、数据库名称、字段键、测量名称、保留策略名称、订阅名称、标签键和用户名的令牌。
相关条目: database, field key, measurement, retention policy, tag key, user
InfluxDB 行协议
用于将数据点写入InfluxDB的文本格式。请参阅 InfluxDB行协议。
测量
描述存储在相关字段中的数据的InfluxDB数据结构的一部分。
度量是字符串。
元存储
包含有关系统状态的内部信息。 元数据存储包含用户信息、数据库、保留策略、分片元数据、连续查询和订阅。
相关条目: database, retention policy, user
节点
一个独立的 influxd 进程。
相关条目: server
现在()
本地服务器的纳秒时间戳。
点
在InfluxDB中,一个点代表单个数据记录,类似于SQL数据库表中的一行。每个点:
- 具有一个测量、一个标签集、一个字段键、一个字段值和一个时间戳;
- 通过其系列和时间戳唯一标识。
在一个系列中,您不能存储多个时间戳相同的点。 如果您将一个点写入一个与现有点的时间戳匹配的系列,则字段集将成为旧字段集和新字段集的并集,任何冲突都将归于新字段集。有关重复点的更多信息,请参见 InfluxDB 如何处理重复点?
相关条目: field set, series, timestamp
每秒点数
一种已弃用的度量,用于测量数据持久化到 InfluxDB 的速率。 该模式允许并鼓励每个点记录多个度量值,从而使每秒点数变得模糊。
写入速度通常以每秒的值表示,这是一个更精确的度量标准。
查询
从InfluxDB检索数据的操作。
请参见 数据探索,模式探索,数据库管理。
复制因子
保留策略的属性,确定在集群中同时存储(或保留)多少份数据。复制副本确保当数据节点(或多个)不可用时数据仍然可用。
对于三个或更少的节点,默认的复制因子等于数据节点的数量。
对于超过三个节点的情况,默认的复制因子为3。要更改默认的复制因子,请在保留策略中指定复制因子 n。
相关条目: duration, node, retention policy
保留策略 (RP)
描述了InfluxDB保留数据的时间(持续时间)、在集群中存储数据的副本数量(复制因子)以及分片组覆盖的时间范围(分片组持续时间)。RPs在每个数据库中是唯一的,并与测量和标签集一起定义一个系列。
当您创建数据库时,InfluxDB 创建了一个名为 autogen 的保留策略,持续时间无限,复制因子设置为一,分片组持续时间设置为七天。有关更多信息,请参见 保留策略管理。
相关条目: duration, measurement, replication factor, series, shard duration, tag set
模式
InfluxDB中数据是如何组织的。 InfluxDB模式的基本要素是数据库、保留策略、系列、测量、标签键、标签值和字段键。 有关更多信息,请参见模式设计。
相关条目: database, field key, measurement, retention policy, series, tag key, tag value
选择器
一个从指定点范围返回单个点的 InfluxQL 函数。查看 InfluxQL Functions 以获取可用和即将到来的选择器的完整列表。
相关条目: aggregation, function, transformation
系列
由共享测量、标签集和字段键定义的数据的逻辑分组。
相关条目: field set, measurement, tag set
系列基数
在一个InfluxDB实例中,唯一数据库、测量、标签集和字段键组合的数量。
例如,假设一个 InfluxDB 实例有一个数据库和一个测量。 单个测量有两个标签键: email 和 status。 如果有三个不同的 email,并且每个电子邮件地址与两个不同的 status 相关联,则该测量的系列基数为 6 (3 * 2 = 6):
| 电子邮件 | 状态 |
|---|---|
| lorr@influxdata.com | 开始 |
| lorr@influxdata.com | 完成 |
| marv@influxdata.com | 开始 |
| marv@influxdata.com | 完成 |
| cliff@influxdata.com | 开始 |
| cliff@influxdata.com | 完成 |
请注意,在某些情况下,仅仅进行乘法运算可能会高估系列基数,因为存在依赖标签。
依赖标签是被另一个标签范围限定的标签,并不会增加系列基数。
如果我们在上面的示例中添加标签 firstname,系列基数将不是 18 (3 * 2 * 3 = 18)。
它将保持不变为 6,因为 firstname 已经被 email 标签范围限定:
| 电子邮件 | 状态 | 名 |
|---|---|---|
| lorr@influxdata.com | 开始 | lorraine |
| lorr@influxdata.com | 完成 | 洛瑞恩 |
| marv@influxdata.com | 开始 | 马文 |
| marv@influxdata.com | 完成 | 马尔文 |
| cliff@influxdata.com | 开始 | 克利福德 |
| cliff@influxdata.com | 完成 | 克利夫ord |
查看 SHOW CARDINALITY 以了解有关系列基数的InfluxQL命令。
相关条目: field key,measurement, tag key, tag set
系列关键
系列关键字通过测量、标签集和字段关键字来标识特定系列。
例如:
# measurement, tag set, field key
h2o_level, location=santa_monica, h2o_feet
相关条目:series
服务器
一个正在运行InfluxDB的机器,可以是虚拟的也可以是物理的。每个服务器上应该只有一个InfluxDB进程。
相关条目: node
分片
一个分片包含实际的编码和压缩数据,并在磁盘上由TSM文件表示。 每个分片只属于一个分片组。 单个分片组中可以存在多个分片。 每个分片包含一组特定的系列。 所有落在给定系列中的点将在给定分片组的同一个分片(TSM文件)上存储。
相关条目: series, shard duration, shard group, tsm
分片持续时间
分片持续时间决定了每个分片组跨越的时间。
具体的时间间隔由保留策略的 SHARD DURATION 决定。
有关更多信息,请参见 保留策略管理。
例如,给定一个保留策略,其中 SHARD DURATION 设置为 1w,每个分片组将跨越一整周,并包含该周内所有时间戳的点。
相关条目: database, retention policy, series, shard, shard group
分片组
分片组是分片的逻辑容器。 分片组根据时间和保留策略进行组织。 每个包含数据的保留策略至少有一个关联的分片组。 给定的分片组包含所有在该分片组覆盖的时间段内有数据的分片。 每个分片组跨越的时间段是分片持续时间。
相关条目: database, retention policy, series, shard, shard duration
订阅
订阅允许 Kapacitor 以推送模型而不是基于查询数据的拉取模型从 InfluxDB 接收数据。 当 Kapacitor 被配置为与 InfluxDB 一起工作时,订阅将自动将 InfluxDB 对所订阅数据库的每次写入推送到 Kapacitor。 订阅可以使用 TCP 或 UDP 来传输写入。
标签
InfluxDB 数据结构中记录元数据的键值对。标签是数据结构的可选部分,但它们对于存储常被查询的元数据非常有用;标签是索引的,因此对标签的查询性能良好。查询提示:将标签与字段进行比较;字段是未索引的。
相关条目: field, tag key, tag set, tag value
标签键
构成标签的键值对的关键部分。
标签键是字符串,它们存储元数据。
标签键是索引化的,因此对标签键的查询效率很高。
查询提示: 将标签键与字段键进行比较;字段键不是索引。
相关条目: field key, tag, tag set, tag value
标签集
一个点上的标签键和值的集合。
相关条目: point, series, tag, tag key, tag value
标签值
由键值对构成的标签的值部分。
标签值是字符串,它们存储元数据。
标签值被索引,因此对标签值的查询性能良好。
时间戳
与某个点相关的日期和时间。
所有在InfluxDB中的时间都是UTC。
有关在写入数据时如何指定时间,请参见 Write Syntax。有关在查询数据时如何指定时间,请参见 Data Exploration。
相关条目: point
转化
一个 InfluxQL 函数,它返回从指定点计算出的值或一组值,但不会返回这些点的聚合值。 请参见 InfluxQL Functions 以获取可用和即将推出的聚合的完整列表。
相关条目: aggregation, function, selector
TSM(时间结构合并树)
为InfluxDB量身定制的数据存储格式。TSM允许比现有的B+或LSM树实现更大的压缩和更高的写入和读取吞吐量。详细信息请参见Storage Engine。
用户
InfluxDB中有两种用户:
- 管理员用户 对所有数据库具有
READ和WRITE的访问权限,并且对管理查询和用户管理命令具有完全访问权限。 - 非管理员用户 对每个数据库具有
READ、WRITE或ALL(同时具有READ和WRITE)的访问权限。
当启用身份验证时,InfluxDB 仅执行发送带有有效用户名和密码的 HTTP 请求。请参见 Authentication and Authorization。
每秒值
持久化数据到InfluxDB的速率的首选测量。写入速度通常以每秒的值来引用。
要计算每秒的值率,将每秒写入的点数乘以每个点存储的值的数量。例如,如果每个点有四个字段,并且每秒写入5000个点的批次10次,那么每秒的值率为 4 field values per point * 5000 points per batch * 10 batches per second = 200,000 values per second。
相关条目: batch, field, point, points per second
写前日志(Write Ahead Log)
最近写入点的临时缓存。为了减少对永久存储文件的访问频率,InfluxDB 将新点缓存到 WAL 中,直到它们的总大小或年龄触发刷新到更永久的存储。这允许将写入有效地批处理到 TSM 中。
WAL中的点可以被查询,并且它们在系统重启后仍然存在。在进程启动时,必须刷新WAL中的所有点,系统才能接受新的写入。
相关条目: tsm