run_classification_experiment#

run_classification_experiment(X_train, y_train, X_test, y_test, classifier, results_path, cls_name='', dataset='', resample_id=0, train_file=False, test_file=True)[源代码][源代码]#

运行一个分类实验并将结果保存到文件中。

运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件,如果需要,还可以写入 trainFold<resampleID>.csv。

参数:
X_trainpd.DataFrame 或 np.array

用于训练分类器的数据。

y_trainnp.array,默认 = None

训练数据类别标签。

X_testpd.DataFrame 或 np.array,默认 = None

用于测试训练好的分类器的数据。

y_testnp.array,默认 = None

测试数据类标签。

分类器BaseClassifier

实验中使用的分类器。

results_pathstr

结果写入位置。任何需要的目录将被创建。

cls_namestr, 默认=””

分类器的名称。

数据集str, 默认=””

问题名称。

resample_idint, 默认=0

重采样的种子。如果设置为0,则使用文件中的默认训练/测试分割。也用于输出文件名。

train_filebool, 默认=False

是否生成训练文件。如果为真,它将对训练数据执行10折交叉验证并保存。如果分类器能生成自己的估计,则使用这些估计。

测试文件bool, 默认=True:

是否生成测试文件。如果分类器能够生成自己的训练概率,分类器将被构建,但不会输出任何文件。