featuretools.EntitySet.normalize_dataframe#

EntitySet.normalize_dataframe(base_dataframe_name, new_dataframe_name, index, additional_columns=None, copy_columns=None, make_time_index=None, make_secondary_time_index=None, new_dataframe_time_index=None, new_dataframe_secondary_time_index=None)[source]#

创建一个新的数据框和关系,基于现有列中的唯一值.

Parameters:
  • base_dataframe_name (str) – 要从中拆分的数据框名称.

  • new_dataframe_name (str) – 新数据框的名称.

  • index (str) – 旧数据框中的列,将成为新数据框的索引. 将在此列上创建关系.

  • additional_columns (list[str]) – 要从基础数据框中移除并移动到新数据框的列名列表.

  • copy_columns (list[str]) – 要从旧数据框复制并移动到新数据框的列名列表.

  • make_time_index (bool 或 str, 可选) – 基于基础数据框中的时间索引为新数据框创建时间索引, 可选地指定基础数据框中用于时间索引的列.如果指定为 True 且未指定特定列名, 则使用主时间索引.如果基础数据框有时间索引,则默认为 True.

  • make_secondary_time_index (dict[str -> list[str]], 可选) – 从键创建次级时间索引. 字典的值是与次级时间索引关联的列.只允许一个次级时间索引.如果为 None,则只关联时间索引.

  • new_dataframe_time_index (str, 可选) – 重命名新数据框的时间索引.

  • new_dataframe_secondary_time_index (str, 可选) – 重命名新数据框的次级时间索引.