ContinuousIntervalTree#

class ContinuousIntervalTree(max_depth=9223372036854775807, thresholds=20, random_state=None)[源代码][源代码]#

连续区间树 (CIT) 向量分类器 (又名时间序列树)。

在 Deng 等人 (2013) 的 Time Series Forest (TSF) 论文中描述的 时间序列树 [1]。一种基于信息增益的简单树,用于连续属性,使用自定义的边际增益度量来打破平局。

作为基于区间的时序分类器的基分类器实现,例如 CanonicalIntervalForestDrCIF

参数:
max_depthint, 默认值=sys.maxsize

树的最大深度。

阈值int, 默认值=20

在树节点上分割连续属性的阈值数量。

random_stateint, RandomState 实例或 None, 默认=None

如果 int ,random_state 是随机数生成器使用的种子;如果 RandomState 实例,random_state 是随机数生成器;如果 None ,随机数生成器是 np.random 使用的 RandomState 实例。

属性:
classes_列表

训练集中的唯一类别标签。

n_classes_整数

训练集中唯一类别的数量。

n_instances_整数

训练集中训练案例的数量。

n_atts_整数

训练集中的属性数量。

参见

CanonicalIntervalForest
DrCIF

注释

对于Java版本,请参见 tsml

参考文献

[1]

H.Deng, G.Runger, E.Tuv 和 M.Vladimir, “用于分类和特征提取的时间序列森林”, 信息科学, 239, 2013

示例

>>> from sktime.classification.sklearn import ContinuousIntervalTree
>>> from sktime.datasets import load_unit_test
>>> from sktime.datatypes._panel._convert import from_nested_to_3d_numpy
>>> X_train, y_train = load_unit_test(split="train", return_X_y=True)
>>> X_test, y_test = load_unit_test(split="test", return_X_y=True)
>>> X_train = from_nested_to_3d_numpy(X_train)
>>> X_test = from_nested_to_3d_numpy(X_test)
>>> clf = ContinuousIntervalTree()
>>> clf.fit(X_train, y_train)
ContinuousIntervalTree(...)
>>> y_pred = clf.predict(X_test)

方法

fit(X, y)

在案例 (X,y) 上拟合一棵树,其中 y 是目标变量。

get_metadata_routing()

获取此对象的元数据路由。

get_params([deep])

获取此估计器的参数。

predict(X)

预测X中的所有情况。

predict_proba(X)

X 中所有情况下的每个类别的概率估计。

set_params(**params)

设置此估计器的参数。

tree_node_splits_and_gain()

递归地找到每个树节点的分割和信息增益。

fit(X, y)[源代码][源代码]#

在案例 (X,y) 上拟合一棵树,其中 y 是目标变量。

使用边际增益度量为连续属性构建基于信息增益的树,以处理平局情况。

参数:
X2d ndarray 或 DataFrame,形状为 [n_instances, n_attributes]

训练数据。

y类数组, 形状 = [n_实例]

类别标签。

返回:
自身

自我引用。

注释

通过创建一个拟合模型来改变状态,该模型更新以“_”结尾的属性。

predict(X)[源代码][源代码]#

预测X中的所有情况。基于 predict_proba 构建。

参数:
X2d ndarray 或 DataFrame,形状为 [n_instances, n_attributes]

用于进行预测的数据。

返回:
y类数组, 形状 = [n_实例]

预测的类别标签。

predict_proba(X)[源代码][源代码]#

X 中所有情况下的每个类别的概率估计。

参数:
X2d ndarray 或 DataFrame,形状为 [n_instances, n_attributes]

用于进行预测的数据。

返回:
y : 类似数组, 形状 = [n_instances, n_classes_]类数组,形状 = [n_实例,]

使用 classes_ 中的顺序预测的概率。

tree_node_splits_and_gain()[源代码][源代码]#

递归地找到每个树节点的分割和信息增益。

get_metadata_routing()[源代码]#

获取此对象的元数据路由。

请查看 用户指南 以了解路由机制的工作原理。

返回:
路由MetadataRequest

一个封装了路由信息的 MetadataRequest

get_params(deep=True)[源代码]#

获取此估计器的参数。

参数:
深度bool, 默认=True

如果为 True,将返回此估计器及其包含的作为估计器的子对象的参数。

返回:
参数字典

参数名称映射到它们的值。

set_params(**params)[源代码]#

设置此估计器的参数。

该方法适用于简单的估计器以及嵌套对象(如 Pipeline)。后者具有 <组件>__<参数> 形式的参数,因此可以更新嵌套对象的每个组件。

参数:
**参数字典

估计器参数。

返回:
自身估计器实例

估计器实例。