Skip to main content

使用您自己的数据进行快速入门

本指南帮助您学习如何:

  • 将您自己的数据集添加到 Wren AI
  • 定义表之间的关系

添加您自己的数据

Wren AI 可以通过连接到数据库或从文件中读取来建立与您的数据集的连接。有关连接到数据源的更多信息,请参阅 Connect Data Sources Overview

在本教程中,我们将使用DuckDB来说明如何通过以下步骤从CSV文件中添加数据集。

1. 准备你的数据集
准备你的数据集文件。这里我们以电子商务数据集文件为例。
有关我们支持的文件格式的更多信息,请参阅DuckDB文档

info

下载我们的示例数据进行尝试: e-commerce.tar

2. 在容器中创建一个文件夹

docker exec wrenai-wren-engine-1 bash -c "mkdir -p /usr/src/app/etc/data"

3. 将归档文件复制到容器中

docker cp ./e-commerce.tar wrenai-wren-engine-1:/usr/src/app/etc/data/

4. 提取归档文件

docker exec wrenai-wren-engine-1 bash -c "tar xvf /usr/src/app/etc/data/e-commerce.tar -C /usr/src/app/etc/data"

5. 通过DuckDB连接读取文件
点击DuckDB选项 connect

1. 填写连接属性

  • 显示名称:为此连接命名,这里我们填写“电子商务”。
  • 初始SQL语句:使用SQL语句读取您的数据集。
CREATE TABLE reviews AS SELECT * FROM read_csv('./etc/data/e-commerce/reviews.csv', header = true);
CREATE TABLE customers AS SELECT * FROM read_csv('./etc/data/e-commerce/customers.csv', header = true);
CREATE TABLE orders AS SELECT * FROM read_csv('./etc/data/e-commerce/orders.csv', header = true);

点击下一步按钮开始连接。 duckdb2

选择表格

每个CSV文件将作为一个表创建,选择所有表并点击下一步select_table

定义关系

点击+添加按钮以定义表之间的关系,以便使数据模型可见。 relationship 1. 在客户表中添加以下关系:

类型
customers.Idorders.CustomerId一对多

2. 在订单表中添加以下关系:

类型
orders.OrderIdreviews.OrderId一对多

点击完成提交您的设置。

在建模页面理解您的数据

model

在主页上提问

随时向Wren AI提问。 ask