Documentation

数据摄取生命周期最佳实践

导入到InfluxDB的数据必须符合所存储数据库的保留期限。 超出保留期限的时间戳数据点将无法被查询,但仍可能在对象存储目录中保持引用,这会导致运营开销和成本的增加。为了减少这些因素,管理导入数据的生命周期是非常重要的。

使用以下最佳实践来管理您 InfluxDB 集群中数据的生命周期:

使用适当的保留期限

创建或更新数据库时,使用适合您需求的保留期限。存储超过要求的数据会给您的InfluxDB集群增加不必要的操作成本。

调整垃圾收集

一旦数据超出了数据库的保留期,垃圾收集服务可以将与数据相关的所有文档从目录和对象存储中删除。调整垃圾收集器的截止期以确保数据及时删除。

使用以下环境变量来调整垃圾收集器:

  • INFLUXDB_IOX_GC_OBJECTSTORE_CUTOFF: Parquet 文件在目录中未被引用时,成为从对象存储中删除的资格年龄。默认值为 30d
  • INFLUXDB_IOX_GC_PARQUETFILE_CUTOFF: 保留在目录中引用标记为删除的Parquet文件的行的时间。默认值为 30d

这些值调节垃圾收集器的积极性。较短的持续时间值意味着文件可以更快地被删除。

为了确保在删除文件和引用之前有一个宽限期,最小的垃圾收集器 (GC) 对象存储和 Parquet 文件截止时间为三个小时 (3h)。

我们建议将这些选项设置为与您组织的备份和恢复策略相一致的值。例如,6h(6小时)的值适用于运行一个仅维护最近数据引用且不需要备份的精简目录。

用例示例

使用以下场景作为不同用例的指南:

没有备份的前沿数据

自定义备份窗口 对象存储版本控制

自定义备份窗口 使用对象存储版本控制



Flux的未来

Flux 正在进入维护模式。您可以像现在一样继续使用它,而无需对您的代码进行任何更改。

阅读更多

InfluxDB 3 开源版本现已公开Alpha测试

InfluxDB 3 Open Source is now available for alpha testing, licensed under MIT or Apache 2 licensing.

我们将发布两个产品作为测试版的一部分。

InfluxDB 3 核心,是我们新的开源产品。 它是一个用于时间序列和事件数据的实时数据引擎。 InfluxDB 3 企业版是建立在核心基础之上的商业版本,增加了历史查询能力、读取副本、高可用性、可扩展性和细粒度安全性。

有关如何开始的更多信息,请查看: