运行聚类实验#

run_clustering_experiment(trainX, clusterer, results_path, trainY=None, testX=None, testY=None, cls_name=None, dataset_name=None, resample_id=0, overwrite=True)[源代码][源代码]#

运行一个聚类实验并将结果保存到文件中。

运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件,如果需要,还可以写入 trainFold<resampleID>.csv。此版本根据路径从文件加载数据。聚类器始终在所需的输入数据 trainX 上进行训练。输出到 trainResample<resampleID>.csv 将是 trainX 的预测聚类。如果还传递了 trainY,这些也会写入文件。如果聚类器进行概率预测,这些也会写入文件。有关输出的更多信息,请参阅 write_results_to_uea_format。请注意,此方法将始终覆盖现有结果,调用前请检查或使用 load_and_run_clustering_experiment 代替。

参数:
trainXpd.DataFrame 或 np.array

要聚类的数据。

聚类器BaseClusterer

聚类对象

results_pathstr

将结果写入何处

trainYnp.array,默认 = None

训练数据中的类标签,仅用于文件写入,聚类器会忽略这些标签

测试Xpd.DataFrame 或 np.array,默认 = None

测试属性数据,如果存在则用于预测 testY

测试Ynp.array,默认 = None

测试数据的实际类别标签,仅用于文件写入,聚类器忽略此项

cls_namestr, 默认 = None

聚类器的名称,写入结果文件,如果为 None 则忽略

数据集名称str, 默认 = None

问题名称,写入结果文件,如果为None则忽略

resample_idint, 默认 = 0

重采样标识符,默认为 0