执行内连接
使用 join.inner() 对两个数据流执行内连接。
内连接会删除两个输入流中没有匹配行的任何行。
使用 join.inner 来连接您的数据
导入
join包。定义要连接的 左 和 右 数据流:
- 每个流必须有一个或多个具有共同值的列。列标签不需要匹配,但列值必须匹配。
- 每个流应该具有相同的 group keys。
有关更多信息,请参见 join data requirements。
使用
join.inner()将两个流连接在一起。
提供以下所需的参数:
以下示例使用来自
machineProduction 示例数据集
的过滤选择作为左数据流,并使用array.from()
创建的临时表作为右数据流。
示例数据分组
下面的示例将左流解组,以匹配右流的分组。
在两个流连接在一起后,连接的数据按stationID分组。
import "array"
import "influxdata/influxdb/sample"
import "join"
left =
sample.data(set: "machineProduction")
|> filter(fn: (r) => r.stationID == "g1" or r.stationID == "g2" or r.stationID == "g3")
|> filter(fn: (r) => r._field == "oil_temp")
|> limit(n: 5)
right =
array.from(
rows: [
{station: "g1", opType: "auto", last_maintained: 2021-07-15T00:00:00Z},
{station: "g2", opType: "manned", last_maintained: 2021-07-02T00:00:00Z},
],
)
join.inner(
left: left |> group(),
right: right,
on: (l, r) => l.stationID == r.station,
as: (l, r) => ({l with opType: r.opType, maintained: r.last_maintained}),
)
|> group(columns: ["stationID"])