Documentation

词汇表

聚合

一个返回一组点的聚合值的 InfluxQL 函数。有关可用和即将推出的聚合的完整列表,请参阅 InfluxQL functions

相关条目: function, selector, transformation

批处理

以换行符(0x0A)分隔的InfluxDB行协议格式的数据点集合。 可以使用单个HTTP请求向写入端点提交一批数据点。 这通过大幅减少HTTP开销,使得使用InfluxDB API的写入操作更高效。 InfluxData建议的批量大小为5,000-10,000个数据点,尽管不同的用例可能更适合显著更小或更大的批量。

相关条目: InfluxDB line protocol, point

存储桶是一个命名的位置,在InfluxDB 2.0中存储时间序列数据。在 InfluxDB 1.8+ 中,数据库和保留策略(数据库/保留策略)的每种组合表示一个存储桶。使用InfluxDB 2.0 API 兼容性端点,与 InfluxDB 1.8+ 一起包含,以便与存储桶进行交互。

连续查询 (CQ)

在数据库中自动和定期运行的InfluxQL查询。
连续查询需要在SELECT子句中使用一个函数,并且必须包含一个GROUP BY time()子句。
请参见连续查询

相关条目: function

数据节点

运行数据服务的节点。

为了高可用性,安装必须至少有两个数据节点。 您集群中的数据节点数量必须与您最高的 复制因子相同。 任何大于两个的复制因子都为您在集群中提供额外的容错能力和 查询容量。

数据节点的大小将取决于您的需求。 亚马逊EC2 m4.large或m4.xlarge是一个好的起点。

相关条目: data service, replication factor

数据服务

存储所有时间序列数据并处理所有写入和查询。

相关条目: data node

数据库

用户、保留策略、持续查询和时间序列数据的逻辑容器。

相关条目: continuous query, retention policy, user

持续时间

保留策略的属性,决定了InfluxDB存储数据的时间长度。 超过该持续时间的数据会自动从数据库中删除。 请参阅 数据库管理 以了解如何设置持续时间。

相关条目: retention policy

字段

InfluxDB 数据结构中记录元数据和实际数据值的键值对。字段在 InfluxDB 数据结构中是必需的,并且它们不是索引 - 对字段值的查询会扫描所有匹配指定时间范围的点,因此相对于标签,这种查询的性能较差。

查询提示: 将字段与标签进行比较;标签是被索引的。

相关条目: field key, field set, field value, tag

字段键

构成字段的键值对的关键部分。字段键是字符串,存储元数据。

相关条目: field, field set, field value, tag key

字段集合

一个点的字段键和值的集合。

相关条目: field, field key, field value, point

字段值

构成字段的键值对的值部分。字段值是实际数据;它们可以是字符串、浮点数、整数或布尔值。字段值总是与时间戳相关联。

字段值未被索引 - 针对字段值的查询会扫描所有匹配指定时间范围的点,因此性能不好。

查询提示: 比较字段值和标签值;标签值是被索引的。

相关条目: field, field key, field set, tag value, timestamp

函数

InfluxQL 聚合、选择器和转换。
请参阅 InfluxQL Functions 以获取 InfluxQL 函数的完整列表。

相关条目: aggregation, selector, transformation

标识符

引用连续查询名称、数据库名称、字段键、测量名称、保留策略名称、订阅名称、标签键和用户名的令牌。

相关条目: database, field key, measurement, retention policy, tag key, user

InfluxDB 行协议

用于将数据点写入InfluxDB的文本格式。请参阅 InfluxDB行协议

测量

描述存储在相关字段中的数据的InfluxDB数据结构的一部分。度量是字符串。

相关条目: field, series

元节点

运行元服务的节点。

为了高可用性,安装必须有三个元节点。元节点可以是非常小型的实例,比如 EC2 t2.micro 甚至是 nano。为了额外的容错,安装可以使用五个元节点;元节点的数量必须是奇数。

相关条目: meta service

元服务

保持有关集群状态的一致数据存储,包括哪些服务器、数据库、用户、持续查询、保留策略、订阅和时间段。

相关条目: meta node

元存储

包含有关系统状态的内部信息。 元数据存储包含用户信息、数据库、保留策略、分片元数据、连续查询和订阅。

相关条目: database, retention policy, user

节点

一个独立的 influxd 进程。

相关条目: server

现在()

本地服务器的纳秒时间戳。

被动节点(实验性)

被动节点充当负载均衡器——它们接受写调用,执行分片查找和RPC调用(在活动数据节点上),并将写入分发到活动数据节点。它们不拥有分片或接受写入。注意: 这是一个实验性功能。

在InfluxDB中,一个点代表单个数据记录,类似于SQL数据库表中的一行。每个点:

  • 具有一个测量、一个标签集、一个字段键、一个字段值和一个时间戳;
  • 通过其系列和时间戳唯一标识。

在一个系列中,您不能存储多个时间戳相同的点。 如果您将一个点写入一个与现有点的时间戳匹配的系列,则字段集将成为旧字段集和新字段集的并集,任何冲突都将归于新字段集。有关重复点的更多信息,请参见 InfluxDB 如何处理重复点?

相关条目: field set, series, timestamp

每秒点数

一种已弃用的度量,表示数据持久化到 InfluxDB 的速率。 该模式允许并鼓励每个点记录多个指标值,从而使每秒的点数变得模糊。

写入速度通常以每秒的值表示,这是一个更精确的度量标准。

相关条目: point, schema, 每秒值

查询

从InfluxDB检索数据的操作。
请参见 数据探索模式探索数据库管理

复制因子 (RF)

保留策略的属性,决定了在集群中存储多少份数据。复制副本确保在一个或多个数据节点不可用时,数据仍然可以访问。InfluxDB在N个数据节点之间复制数据,其中N是复制因子。

为了保持查询的数据可用性,复制因子应小于或等于集群中的数据节点数量:

  • 当复制因子大于不可用数据节点的数量时,数据是完全可用的。
  • 当副本因子小于不可用数据节点的数量时,数据可能不可用。

任何大于二的复制因子都为您提供了额外的故障容忍能力和集群内的查询能力。

相关条目: duration, node, retention policy

保留策略 (RP)

描述了InfluxDB保留数据的时间(持续时间)、在集群中存储数据的副本数量(复制因子)以及分片组覆盖的时间范围(分片组持续时间)。RPs在每个数据库中是唯一的,并与测量和标签集一起定义一个系列。

当您创建数据库时,InfluxDB 创建了一个名为 autogen 的保留策略,持续时间无限,复制因子设置为一,分片组持续时间设置为七天。有关更多信息,请参见 保留策略管理

相关条目: duration, measurement, replication factor, series, shard duration, tag set

模式

数据在InfluxDB中的组织方式。 InfluxDB架构的基本要素是数据库、保留策略、时间序列、测量、标签键、标签值和字段键。 有关更多信息,请参见 Schema Design

相关条目: database, field key, measurement, retention policy, series, tag key, tag value

选择器

一个从指定点范围返回单个点的 InfluxQL 函数。查看 InfluxQL Functions 以获取可用和即将到来的选择器的完整列表。

相关条目: aggregation, function, transformation

系列

由共享测量、标签集和字段键定义的数据的逻辑分组。

相关条目: field set, measurement, tag set

系列基数

在一个InfluxDB实例中,唯一数据库、测量、标签集和字段键组合的数量。

例如,假设一个 InfluxDB 实例有一个数据库和一个测量。 单个测量有两个标签键: emailstatus。 如果有三个不同的 email,并且每个电子邮件地址与两个不同的 status 相关联,则该测量的系列基数为 6 (3 * 2 = 6):

电子邮件状态
lorr@influxdata.com开始
lorr@influxdata.com完成
marv@influxdata.com开始
marv@influxdata.com完成
cliff@influxdata.com开始
cliff@influxdata.com完成

请注意,在某些情况下,仅仅进行乘法运算可能会高估系列基数,因为存在依赖标签。 依赖标签是被另一个标签范围限定的标签,并不会增加系列基数。 如果我们在上面的示例中添加标签 firstname,系列基数将不是 18 (3 * 2 * 3 = 18)。 它将保持不变为 6,因为 firstname 已经被 email 标签范围限定:

电子邮件状态
lorr@influxdata.com开始lorraine
lorr@influxdata.com完成洛瑞恩
marv@influxdata.com开始马文
marv@influxdata.com完成马尔文
cliff@influxdata.com开始克利福德
cliff@influxdata.com完成克利夫ord

查看 SHOW CARDINALITY 以了解有关系列基数的InfluxQL命令。

相关条目: field key,measurement, tag key, tag set

系列关键

系列关键字通过测量、标签集和字段关键字来标识特定系列。

例如:

# measurement, tag set, field key
h2o_level, location=santa_monica, h2o_feet

相关条目:series

服务器

一个正在运行InfluxDB的机器,可以是虚拟的也可以是物理的。每个服务器上应该只有一个InfluxDB进程。

相关条目: node

分片

一个分片包含实际的编码和压缩数据,并在磁盘上由TSM文件表示。 每个分片只属于一个分片组。 单个分片组中可以存在多个分片。 每个分片包含一组特定的系列。 所有落在给定系列中的点将在给定分片组的同一个分片(TSM文件)上存储。

相关条目: series, shard duration, shard group, tsm

分片持续时间

分片持续时间决定了每个分片组跨越的时间。 具体的时间间隔由保留策略的 SHARD DURATION 决定。 有关更多信息,请参见 保留策略管理

例如,给定一个保留策略,其中 SHARD DURATION 设置为 1w,每个分片组将跨越一整周,并包含该周内所有时间戳的点。

相关条目: database, retention policy, series, shard, shard group

分片组

分片组是分片的逻辑容器。 分片组根据时间和保留策略进行组织。 每个包含数据的保留策略至少有一个关联的分片组。 给定的分片组包含所有在该分片组覆盖的时间段内有数据的分片。 每个分片组跨越的时间段是分片持续时间。

相关条目: database, retention policy, series, shard, shard duration

订阅

订阅允许 Kapacitor 以推送模型而不是基于查询数据的拉取模型从 InfluxDB 接收数据。 当 Kapacitor 被配置为与 InfluxDB 一起工作时,订阅将自动将 InfluxDB 对所订阅数据库的每次写入推送到 Kapacitor。 订阅可以使用 TCP 或 UDP 来传输写入。

标签

InfluxDB 数据结构中记录元数据的键值对。标签是数据结构的可选部分,但它们对于存储常被查询的元数据非常有用;标签是索引的,因此对标签的查询性能良好。查询提示:将标签与字段进行比较;字段是未索引的。

相关条目: field, tag key, tag set, tag value

标签键

构成标签的键值对的关键部分。 标签键是字符串,它们存储元数据。 标签键是索引化的,因此对标签键的查询效率很高。

查询提示: 将标签键与字段键进行比较;字段键不是索引。

相关条目: field key, tag, tag set, tag value

标签集

一个点上的标签键和值的集合。

相关条目: point, series, tag, tag key, tag value

标签值

由键值对构成的标签的值部分。标签值是字符串,它们存储元数据。标签值被索引,因此对标签值的查询性能良好。

相关条目: tag, tag key, tag set

时间戳

与某个点相关的日期和时间。所有在InfluxDB中的时间都是UTC。

有关在写入数据时如何指定时间,请参见 Write Syntax。有关在查询数据时如何指定时间,请参见 Data Exploration

相关条目: point

转化

一个 InfluxQL 函数,它返回从指定点计算出的值或一组值,但不会返回这些点的聚合值。 请参见 InfluxQL Functions 以获取可用和即将推出的聚合的完整列表。

相关条目: aggregation, function, selector

TSM(时间结构合并树)

为InfluxDB量身定制的数据存储格式。TSM允许比现有的B+或LSM树实现更大的压缩和更高的写入和读取吞吐量。详细信息请参见Storage Engine

用户

InfluxDB Enterprise中有三种用户:

  • 全球管理员用户拥有所有权限。
  • 管理员用户 对所有数据库具有 READWRITE 的访问权限,并且对管理查询和用户管理命令具有完全访问权限。
  • 非管理员用户 对每个数据库具有 READWRITEALL(同时具有 READWRITE)的访问权限。

当启用身份验证时,InfluxDB 仅执行发送带有有效用户名和密码的 HTTP 请求。请参见 Authentication and Authorization

每秒值

将数据持久化到InfluxDB的速率的首选测量。写入速度通常以每秒值进行引用。

要计算每秒的值率,将每秒写入的点数乘以每个点存储的值的数量。例如,如果每个点有四个字段,并且每秒写入5000个点的批次10次,那么每秒的值率为 4 field values per point * 5000 points per batch * 10 batches per second = 200,000 values per second

相关条目: batch, field, point, points per second

写前日志(Write Ahead Log)

最近写入点的临时缓存。为了减少对永久存储文件的访问频率,InfluxDB 将新点缓存到 WAL 中,直到它们的总大小或年龄触发刷新到更永久的存储。这允许将写入有效地批处理到 TSM 中。

WAL中的点可以被查询,并且它们在系统重启后仍然存在。在进程启动时,必须刷新WAL中的所有点,系统才能接受新的写入。

相关条目: tsm

网页控制台

InfluxDB企业版的旧版用户界面。

该接口已被弃用。我们建议使用 Chronograf

如果您正在从企业网络控制台过渡到Chronograf,请查看如何 将Chronograf连接到InfluxDB企业集群



Flux的未来

Flux 正在进入维护模式。您可以像现在一样继续使用它,而无需对您的代码进行任何更改。

阅读更多

InfluxDB 3 开源版本现已公开Alpha测试

InfluxDB 3 Open Source is now available for alpha testing, licensed under MIT or Apache 2 licensing.

我们将发布两个产品作为测试版的一部分。

InfluxDB 3 核心,是我们新的开源产品。 它是一个用于时间序列和事件数据的实时数据引擎。 InfluxDB 3 企业版是建立在核心基础之上的商业版本,增加了历史查询能力、读取副本、高可用性、可扩展性和细粒度安全性。

有关如何开始的更多信息,请查看: