术语表#
- ColumnSchema#
Woodwork 列的所有类型信息,包括逻辑类型和任何语义标签。
- EntitySet#
数据框的集合以及它们之间的关系。由
EntitySet
类表示。- 关系#
父数据框和子数据框之间的映射。子数据框必须包含一个引用父数据框索引列的列。由
Relationship
类表示。- 子数据框#
通过关系引用另一个数据框的数据框。一对多关系中的“多”。
- 实例#
相当于关系数据库中的一行。每个数据框有许多实例,每个实例对数据框上定义的每一列和特征都有一个值。
- 截止时间#
计算特征时允许使用的数据的最后时间点。
- 父数据框#
通过关系被另一个数据框引用的数据框。一对多关系中的“一”。
- 特征#
用于机器学习的数据转换。Featuretools 有一个自定义语言用于定义特征,如 这里 所述。所有特征都由
FeatureBase
的子类表示。- 特征工程#
将数据转换为更适合机器学习的表示形式的过程。
- 目标数据框#
我们将为其生成特征的数据框。
- 语义标签#
关于列的含义或潜在用途的可选附加信息。用于确定哪些原语可以应用于列以生成特征。
- 逻辑类型#
关于如何解释或解析列的附加信息,超出了数据在磁盘或内存中的存储方式。用于确定哪些原语可以应用于列以生成特征。