运行聚类实验#

run_clustering_experiment(trainX, clusterer, results_path, trainY=None, testX=None, testY=None, cls_name=None, dataset_name=None, resample_id=0, overwrite=True)[源代码][源代码]#

运行一个聚类实验并将结果保存到文件中。

运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件，如果需要，还可以写入 trainFold<resampleID>.csv。此版本根据路径从文件加载数据。聚类器始终在所需的输入数据 trainX 上进行训练。输出到 trainResample<resampleID>.csv 将是 trainX 的预测聚类。如果还传递了 trainY，这些也会写入文件。如果聚类器进行概率预测，这些也会写入文件。有关输出的更多信息，请参阅 write_results_to_uea_format。请注意，此方法将始终覆盖现有结果，调用前请检查或使用 load_and_run_clustering_experiment 代替。

参数:

trainXpd.DataFrame 或 np.array: 要聚类的数据。
聚类器BaseClusterer: 聚类对象
results_pathstr: 将结果写入何处
trainYnp.array，默认 = None: 训练数据中的类标签，仅用于文件写入，聚类器会忽略这些标签
测试Xpd.DataFrame 或 np.array，默认 = None: 测试属性数据，如果存在则用于预测 testY
测试Ynp.array，默认 = None: 测试数据的实际类别标签，仅用于文件写入，聚类器忽略此项
cls_namestr, 默认 = None: 聚类器的名称，写入结果文件，如果为 None 则忽略
数据集名称str, 默认 = None: 问题名称，写入结果文件，如果为None则忽略
resample_idint, 默认 = 0: 重采样标识符，默认为 0