Data Import – DuckDB

⌘+k ctrl+k

1.1.3 (stable)

Search Shortcut cmd + k | ctrl + k

安装
Documentation

入门指南
连接

数据导入

客户端API

SQL

配置

扩展

指南

概述
数据查看器

数据库集成

文件格式

网络和云存储

Meta 查询

ODBC

性能

Python

SQL 编辑器

SQL 功能

代码片段

术语表
离线浏览

操作手册

开发

内部

Documentation / Guides / Performance

Data Import

推荐的导入方法

当从其他系统导入数据到DuckDB时，有几个考虑因素需要纳入考虑。我们建议按照以下顺序进行导入：

对于由DuckDB扫描器扩展支持的系统，建议使用扫描器。DuckDB目前提供了MySQL、PostgreSQL和SQLite的扫描器。
如果数据源系统中有批量导出功能，将数据导出为Parquet或CSV格式，然后使用DuckDB的Parquet或CSV加载器加载数据。
如果上述方法不适用，考虑使用DuckDB的appender，目前可在C、C++、Go、Java和Rust的API中使用。
如果数据源系统支持Apache Arrow并且数据传输是重复性任务，考虑使用DuckDB的Arrow扩展。

避免使用的方法

如果可能，避免逐行循环（一次一个元组），而应使用批量操作。逐行插入（即使使用预处理语句）对性能有害，会导致加载时间变慢。

最佳实践除非你的数据量很小（小于100k行），否则避免在循环中使用插入操作。

关于此页面