Querying Parquet Metadata

Search Shortcut cmd + k | ctrl + k

Documentation / Data Import / Parquet Files

Parquet 元数据

parquet_metadata 函数可用于查询 Parquet 文件中包含的元数据，这些元数据揭示了 Parquet 文件的各种内部细节，例如不同列的统计信息。这对于了解 Parquet 文件中可以跳过哪些内容非常有用，甚至可以快速了解不同列包含的内容：

SELECT *
FROM parquet_metadata('test.parquet');

以下是parquet_metadata返回的列的表。

parquet_schema 函数可用于查询 Parquet 文件中包含的内部模式。请注意，这是 Parquet 文件元数据中包含的模式。如果您想找出 Parquet 文件中包含的列名和类型，使用 DESCRIBE 会更方便。

获取列名和列类型：

DESCRIBE SELECT * FROM 'test.parquet';

获取Parquet文件的内部模式：

SELECT *
FROM parquet_schema('test.parquet');

以下是parquet_schema返回的列的表。

parquet_file_metadata 函数可用于查询文件级别的元数据，例如格式版本和使用的加密算法：

SELECT *
FROM parquet_file_metadata('test.parquet');

以下是parquet_file_metadata返回的列的表。

parquet_kv_metadata 函数可用于查询定义为键值对的自定义元数据：

SELECT *
FROM parquet_kv_metadata('test.parquet');

以下是parquet_kv_metadata返回的列的表。