运行聚类实验#
- run_clustering_experiment(trainX, clusterer, results_path, trainY=None, testX=None, testY=None, cls_name=None, dataset_name=None, resample_id=0, overwrite=True)[源代码][源代码]#
运行一个聚类实验并将结果保存到文件中。
运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件,如果需要,还可以写入 trainFold<resampleID>.csv。此版本根据路径从文件加载数据。聚类器始终在所需的输入数据 trainX 上进行训练。输出到 trainResample<resampleID>.csv 将是 trainX 的预测聚类。如果还传递了 trainY,这些也会写入文件。如果聚类器进行概率预测,这些也会写入文件。有关输出的更多信息,请参阅 write_results_to_uea_format。请注意,此方法将始终覆盖现有结果,调用前请检查或使用 load_and_run_clustering_experiment 代替。
- 参数:
- trainXpd.DataFrame 或 np.array
要聚类的数据。
- 聚类器BaseClusterer
聚类对象
- results_pathstr
将结果写入何处
- trainYnp.array,默认 = None
训练数据中的类标签,仅用于文件写入,聚类器会忽略这些标签
- 测试Xpd.DataFrame 或 np.array,默认 = None
测试属性数据,如果存在则用于预测 testY
- 测试Ynp.array,默认 = None
测试数据的实际类别标签,仅用于文件写入,聚类器忽略此项
- cls_namestr, 默认 = None
聚类器的名称,写入结果文件,如果为 None 则忽略
- 数据集名称str, 默认 = None
问题名称,写入结果文件,如果为None则忽略
- resample_idint, 默认 = 0
重采样标识符,默认为 0