load_from_arff_to_dataframe#

load_from_arff_to_dataframe(full_file_path_and_name, has_class_labels=True, return_separate_X_and_y=True, replace_missing_vals_with='NaN')[源代码][源代码]#

从 .arff 文件加载数据到 Pandas DataFrame 中。

参数:
full_file_path_and_name: str

要读取的 .arff 文件的完整路径名。

has_class_labels: bool

如果为真,则行包含分隔的字符串,类值包含分隔的字符串列表,检查 ‘return_separate_X_and_y’ 否则为假。

return_separate_X_and_y: bool

如果为真,则应将 X 和 Y 值作为单独的 Data Frames (X) 和 numpy 数组 (y) 返回,否则返回 false。这仅与数据相关。

replace_missing_vals_with: str

在解析之前,文本文件中缺失值应替换的值。

返回:
DataFrame, ndarray

如果 return_separate_X_and_y 为真,则返回一个包含 DataFrame 和包含相关时间序列及其对应类别值的 numpy 数组的元组。

DataFrame

如果不返回单独的 X 和 y,则返回一个包含所有时间序列的单个 DataFrame,以及(如果相关)一列“class_vals”,其中包含相关的类别值。