术语表#

ColumnSchema#

Woodwork 列的所有类型信息,包括逻辑类型和任何语义标签。

EntitySet#

数据框的集合以及它们之间的关系。由 EntitySet 类表示。

关系#

父数据框和子数据框之间的映射。子数据框必须包含一个引用父数据框索引列的列。由 Relationship 类表示。

子数据框#

通过关系引用另一个数据框的数据框。一对多关系中的“多”。

实例#

相当于关系数据库中的一行。每个数据框有许多实例,每个实例对数据框上定义的每一列和特征都有一个值。

截止时间#

计算特征时允许使用的数据的最后时间点。

父数据框#

通过关系被另一个数据框引用的数据框。一对多关系中的“一”。

特征#

用于机器学习的数据转换。Featuretools 有一个自定义语言用于定义特征,如 这里 所述。所有特征都由 FeatureBase 的子类表示。

特征工程#

将数据转换为更适合机器学习的表示形式的过程。

目标数据框#

我们将为其生成特征的数据框。

语义标签#

关于列的含义或潜在用途的可选附加信息。用于确定哪些原语可以应用于列以生成特征。

逻辑类型#

关于如何解释或解析列的附加信息,超出了数据在磁盘或内存中的存储方式。用于确定哪些原语可以应用于列以生成特征。