load_and_run_clustering_experiment#

load_and_run_clustering_experiment(problem_path, results_path, dataset, clusterer, resample_id=0, cls_name=None, overwrite=False, format='.ts', train_file=False)[源代码][源代码]#

运行一个聚类实验。

运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件,如果需要,还可以写入 trainFold<resampleID>.csv。此版本根据路径从文件加载数据。聚类器始终基于

参数:
问题路径str

问题文件的位置,完整路径。

results_pathstr

写入结果的位置。任何需要的目录将被创建。

数据集str

问题名称。文件必须为 <problem_path>/<dataset>/<dataset>+ “_TRAIN”+format,”_TEST” 同理。

聚类器聚类器
cls_namestr, 默认 =None

确定将写入目录称为什么。如果为 None,则设置为 type(clusterer).__name__

resample_idint, 默认 = 0

重采样的种子。如果设置为0,则使用文件中的默认训练/测试分割。也用于输出文件名。

覆盖布尔值,默认 = False

如果为 False,只有在没有结果文件存在时才会构建结果。如果为 True,则会覆盖已有的任何内容。

格式: 字符串, 默认 = “.ts”

有效的格式是 “.ts”, “.arff”, “.tsv” 和 “.long”。有关格式的更多信息,请参见 examples/loading_data.ipynb

train_file: boolean, 默认 = False

是否生成训练文件。如果为真,它将对训练数据执行10倍交叉验证并保存