JOIN 子句
使用 JOIN 子句根据逻辑关系将来自不同表的数据连接在一起。
语法
SELECT_clause
FROM <left_join_items>
[INNER | LEFT [OUTER] | RIGHT [OUTER] | FULL [OUTER]] JOIN <right_join_items>
ON <join_condition>
[WHERE_clause]
[GROUP_BY_clause]
[HAVING_clause]
[ORDER_BY_clause]
参数
- left_join_items: 在
FROM子句中指定的一张或多张表,表示连接的左侧。 - right_join_items: 在
JOIN子句中指定的一个或多个表,表示连接的右侧。 - join_condition: 在
ON子句中的一个谓词表达式,使用=(等于)比较操作符将联接左侧的列值与联接右侧的列值进行比较。具有与定义的谓词匹配的值的行使用指定的join type进行联接。
如果连接的两侧都包含同名的列,您需要使用完全限定引用以防止歧义。完全限定引用使用点表示法同时引用表名和列名——例如: table_name.column_name
连接类型
支持以下连接类型:
连接示例表
以下示例演示了使用以下表的连接方法:
生产线
| 时间 | 站点 | 产生 |
|---|
| 2022-01-01T08:00:00Z | B1 | 26 |
| 2022-01-01T09:00:00Z | B1 | 54 |
| 2022-01-01T10:00:00Z | B1 | 56 |
| 2022-01-01T11:00:00Z | B1 | |
| 2022-01-01T12:00:00Z | B1 | 82 |
错误
| 时间 | 车站 | 级别 | 消息 |
|---|
| 2022-01-01T10:00:00Z | B1 | warn | 需要维护 |
| 2022-01-01T11:00:00Z | B1 | crit | 站点离线 |
内连接
内连接根据在ON子句中定义的公共列值,将来自左侧和右侧表的行组合在一起。没有匹配列值的行不包含在输出表中。
内部连接示例
SELECT
*
FROM
prod_line
RIGHT JOIN errors ON
prod_line.time = errors.time
AND prod_line.station = errors.station
ORDER BY
prod_line.time
内连接结果
| 时间 | 站点 | 产生的 | 时间 | 站点 | 级别 | 消息 |
|---|
| 2022-01-01T10:00:00Z | B1 | 56 | 2022-01-01T10:00:00Z | B1 | warn | 需要维护 |
| 2022-01-01T11:00:00Z | B1 | | 2022-01-01T11:00:00Z | B1 | crit | 站点离线 |
左 [外] 连接
左外连接返回连接左侧的所有行,并且仅在具有匹配列值的行中从连接右侧返回数据,这些值在ON子句中定义。
左外连接示例
SELECT
*
FROM
prod_line
LEFT JOIN errors ON
prod_line.time = errors.time
AND prod_line.station = errors.station
ORDER BY
prod_line.time
左外连接结果
| 时间 | 站点 | 产生的 | 时间 | 站点 | 级别 | 消息 |
|---|
| 2022-01-01T08:00:00Z | B1 | 26 | | | | |
| 2022-01-01T09:00:00Z | B1 | 54 | | | | |
| 2022-01-01T10:00:00Z | B1 | 56 | 2022-01-01T10:00:00Z | B1 | warn | 需要维护 |
| 2022-01-01T11:00:00Z | B1 | | 2022-01-01T11:00:00Z | B1 | crit | 站点离线 |
| 2022-01-01T12:00:00Z | B1 | 82 | | | | |
右 [外] 连接
右外连接返回连接右侧的所有行,并且仅在左侧连接中返回具有在ON子句中定义的匹配列值的行的数据。
右外连接示例
SELECT
*
FROM
prod_line
RIGHT JOIN errors ON
prod_line.time = errors.time
AND prod_line.station = errors.station
ORDER BY
prod_line.time
右外连接结果
| 时间 | 站点 | 产生的 | 时间 | 站点 | 级别 | 消息 |
|---|
| 2022-01-01T10:00:00Z | B1 | 56 | 2022-01-01T10:00:00Z | B1 | warn | 需要维护 |
| 2022-01-01T11:00:00Z | B1 | | 2022-01-01T11:00:00Z | B1 | crit | 站点离线 |
完全 [外部] 连接
全外连接返回连接左右两侧的所有数据,并将具有在ON子句中定义的匹配列值的行组合在一起。每一侧连接中不可用的数据为NULL。
完全外连接示例
SELECT
*
FROM
prod_line
FULL JOIN errors ON
prod_line.time = errors.time
AND prod_line.station = errors.station
ORDER BY
time
完全外连接结果
| 时间 | 站点 | 产生的 | 时间 | 站点 | 级别 | 消息 |
|---|
| 2022-01-01T08:00:00Z | B1 | 26 | | | | |
| 2022-01-01T09:00:00Z | B1 | 54 | | | | |
| 2022-01-01T10:00:00Z | B1 | 56 | 2022-01-01T10:00:00Z | B1 | warn | 需要维护 |
| 2022-01-01T11:00:00Z | B1 | | 2022-01-01T11:00:00Z | B1 | crit | 站点离线 |
| 2022-01-01T12:00:00Z | B1 | 82 | | | | |
排查连接问题
对未限定字段的模糊引用
如果连接的两侧都有一列,并且在 SELECT、ON、WHERE、HAVING、GROUP BY 或 ORDER BY 子句中使用,则必须使用 完全限定引用。例如,如果连接的两侧都有一个 time 列,并且您想明确选择一个时间列,则必须指定使用哪个连接侧的时间列:
SELECT
prod_line.time,
produced,
message,
FROM
prod_line
INNER JOIN errors ON
-- ...