⌘+k ctrl+k
1.1.3 (stable)
Search Shortcut cmd + k | ctrl + k
Data Import

当从其他系统导入数据到DuckDB时,有几个考虑因素需要纳入考虑。 我们建议按照以下顺序进行导入:

  1. 对于由DuckDB扫描器扩展支持的系统,建议使用扫描器。DuckDB目前提供了MySQLPostgreSQLSQLite的扫描器。
  2. 如果数据源系统中有批量导出功能,将数据导出为Parquet或CSV格式,然后使用DuckDB的ParquetCSV加载器加载数据。
  3. 如果上述方法不适用,考虑使用DuckDB的appender,目前可在C、C++、Go、Java和Rust的API中使用。
  4. 如果数据源系统支持Apache Arrow并且数据传输是重复性任务,考虑使用DuckDB的Arrow扩展。

避免使用的方法

如果可能,避免逐行循环(一次一个元组),而应使用批量操作。 逐行插入(即使使用预处理语句)对性能有害,会导致加载时间变慢。

最佳实践 除非你的数据量很小(小于100k行),否则避免在循环中使用插入操作。