一个ARRAY
列存储固定大小的数组。列中的所有字段必须具有相同的长度和相同的基础类型。数组通常用于存储数字数组,但可以包含任何统一的数据类型,包括ARRAY
、LIST
和STRUCT
类型。
数组可以用来存储向量,例如词嵌入或图像嵌入。
要存储可变长度的列表,请使用LIST
类型。有关嵌套数据类型之间的比较,请参阅数据类型概述。
PostgreSQL 中的
ARRAY
类型允许可变长度字段。DuckDB 的ARRAY
类型是固定长度的。
创建数组
数组可以使用array_value(expr, ...)
函数创建。
使用array_value
函数构造:
SELECT array_value(1, 2, 3);
你可以始终隐式地将数组转换为列表(并使用列表函数,如 list_extract
, [i]
):
SELECT array_value(1, 2, 3)[2];
你可以将列表转换为数组(维度必须匹配):
SELECT [3, 2, 1]::INTEGER[3];
数组可以嵌套:
SELECT array_value(array_value(1, 2), array_value(3, 4), array_value(5, 6));
数组可以存储结构体:
SELECT array_value({'a': 1, 'b': 2}, {'a': 3, 'b': 4});
定义一个数组字段
数组可以使用⟨TYPE_NAME⟩[⟨LENGTH⟩]
语法创建。例如,要创建一个包含3个整数的数组字段,请运行:
CREATE TABLE array_table (id INTEGER, arr INTEGER[3]);
INSERT INTO array_table VALUES (10, [1, 2, 3]), (20, [4, 5, 6]);
从数组中检索值
从数组中检索一个或多个值可以通过使用括号和切片符号,或者通过列表函数如list_extract
和array_extract
来实现。使用定义数组字段中的示例。
以下用于提取数组第二个元素的查询是等价的:
SELECT id, arr[1] AS element FROM array_table;
SELECT id, list_extract(arr, 1) AS element FROM array_table;
SELECT id, array_extract(arr, 1) AS element FROM array_table;
id | 元素 |
---|---|
10 | 1 |
20 | 4 |
使用切片符号返回一个LIST
:
SELECT id, arr[1:2] AS elements FROM array_table;
id | 元素 |
---|---|
10 | [1, 2] |
20 | [4, 5] |
Functions
所有的LIST
函数都可以与ARRAY
类型一起使用。此外,还支持几个ARRAY
原生函数。
请参阅ARRAY
函数。
Examples
创建示例数据:
CREATE TABLE x (i INTEGER, v FLOAT[3]);
CREATE TABLE y (i INTEGER, v FLOAT[3]);
INSERT INTO x VALUES (1, array_value(1.0::FLOAT, 2.0::FLOAT, 3.0::FLOAT));
INSERT INTO y VALUES (1, array_value(2.0::FLOAT, 3.0::FLOAT, 4.0::FLOAT));
计算叉积:
SELECT array_cross_product(x.v, y.v)
FROM x, y
WHERE x.i = y.i;
计算余弦相似度:
SELECT array_cosine_similarity(x.v, y.v)
FROM x, y
WHERE x.i = y.i;
排序
ARRAY
实例的排序使用字典顺序定义。NULL
值比其他所有值都大,并且彼此相等。
See Also
更多功能,请参见List Functions。