load_and_run_clustering_experiment#
- load_and_run_clustering_experiment(problem_path, results_path, dataset, clusterer, resample_id=0, cls_name=None, overwrite=False, format='.ts', train_file=False)[源代码][源代码]#
运行一个聚类实验。
运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件,如果需要,还可以写入 trainFold<resampleID>.csv。此版本根据路径从文件加载数据。聚类器始终基于
- 参数:
- 问题路径str
问题文件的位置,完整路径。
- results_pathstr
写入结果的位置。任何需要的目录将被创建。
- 数据集str
问题名称。文件必须为 <problem_path>/<dataset>/<dataset>+ “_TRAIN”+format,”_TEST” 同理。
- 聚类器聚类器
- cls_namestr, 默认 =None
确定将写入目录称为什么。如果为 None,则设置为 type(clusterer).__name__
- resample_idint, 默认 = 0
重采样的种子。如果设置为0,则使用文件中的默认训练/测试分割。也用于输出文件名。
- 覆盖布尔值,默认 = False
如果为 False,只有在没有结果文件存在时才会构建结果。如果为 True,则会覆盖已有的任何内容。
- 格式: 字符串, 默认 = “.ts”
有效的格式是 “.ts”, “.arff”, “.tsv” 和 “.long”。有关格式的更多信息,请参见 examples/loading_data.ipynb
- train_file: boolean, 默认 = False
是否生成训练文件。如果为真,它将对训练数据执行10倍交叉验证并保存