使用您自己的数据进行快速入门
本指南帮助您学习如何:
- 将您自己的数据集添加到 Wren AI
- 定义表之间的关系
添加您自己的数据
Wren AI 可以通过连接到数据库或从文件中读取来建立与您的数据集的连接。有关连接到数据源的更多信息,请参阅 Connect Data Sources Overview。
在本教程中,我们将使用DuckDB来说明如何通过以下步骤从CSV文件中添加数据集。
1. 准备你的数据集
准备你的数据集文件。这里我们以电子商务数据集文件为例。
有关我们支持的文件格式的更多信息,请参阅DuckDB文档。
info
下载我们的示例数据进行尝试: e-commerce.tar
2. 在容器中创建一个文件夹
docker exec wrenai-wren-engine-1 bash -c "mkdir -p /usr/src/app/etc/data"
3. 将归档文件复制到容器中
docker cp ./e-commerce.tar wrenai-wren-engine-1:/usr/src/app/etc/data/
4. 提取归档文件
docker exec wrenai-wren-engine-1 bash -c "tar xvf /usr/src/app/etc/data/e-commerce.tar -C /usr/src/app/etc/data"
5. 通过DuckDB连接读取文件
点击DuckDB选项
1. 填写连接属性
- 显示名称:为此连接命名,这里我们填写“电子商务”。
- 初始SQL语句:使用SQL语句读取您的数据集。
CREATE TABLE reviews AS SELECT * FROM read_csv('./etc/data/e-commerce/reviews.csv', header = true);
CREATE TABLE customers AS SELECT * FROM read_csv('./etc/data/e-commerce/customers.csv', header = true);
CREATE TABLE orders AS SELECT * FROM read_csv('./etc/data/e-commerce/orders.csv', header = true);
点击下一步按钮开始连接。
选择表格
每个CSV文件将作为一个表创建,选择所有表并点击下一步。
定义关系
点击+添加按钮以定义表之间的关系,以便使数据模型可见。
1. 在客户表中添加以下关系:
从 | 到 | 类型 |
---|---|---|
customers.Id | orders.CustomerId | 一对多 |
2. 在订单表中添加以下关系:
从 | 到 | 类型 |
---|---|---|
orders.OrderId | reviews.OrderId | 一对多 |
点击完成提交您的设置。
在建模页面理解您的数据
在主页上提问
随时向Wren AI提问。