分割器#

The sktime.split 模块包含用于数据分割和重采样的算法。

sktime 中的所有分割器可以使用 sktime.registry.all_estimators 工具列出,使用 estimator_types="splitter",可以选择性地通过标签进行过滤。有效的标签可以使用 sktime.registry.all_tags 列出。

基于标签的完整表格也可以在 估算器搜索页面 上找到(在“估算器类型”下拉菜单中选择“分割器”)。

分割工具#

temporal_train_test_split 是一个用于将单个时间序列快速分割为训练集和测试集的实用函数。

建议对性能评估感兴趣的预测用户使用完整回测,而不是单一分割,例如通过 evaluate,参见 预测API参考

temporal_train_test_split(y[, X, test_size, ...])

将时间序列数据容器拆分为单一的训练/测试拆分。

时间索引分割器#

时间索引分割器根据时间顺序分割一个或多个时间序列。它们通常用于预测器的评估和调优。它们具有标签 "split_type"="temporal"

CutoffSplitter(cutoffs[, fh, window_length])

截止窗口分割器。

SingleWindowSplitter(fh[, window_length])

单窗口分割器。

SlidingWindowSplitter([fh, window_length, ...])

滑动窗口分割器。

ExpandingWindowSplitter([fh, ...])

扩展窗口分割器。

ExpandingCutoffSplitter(cutoff, fh, step_length)

扩展时间序列数据的截止分割器。

ExpandingGreedySplitter(test_size[, folds, ...])

从序列末尾连续切割测试折叠的分割器。

TemporalTrainTestSplitter([train_size, ...])

基于训练集或测试集样本大小的时序训练-测试分割器。

时间索引分割器组成#

以下分割器是组合,可用于创建更复杂的时间索引分割策略。

Repeat(splitter[, times, mode, random_repeat])

向拆分器添加重复项,逐元素或逐序列。

SameLocSplitter(cv[, y_template])

从另一个分割器复制位置索引的分割器。

TestPlusTrainSplitter(cv)

将训练集添加到测试集的分隔器。

实例分割器#

实例分割器通过实例索引(即整个序列的标识符)来分割面板或分层时间序列。训练集和测试集包含原始面板中的整个序列。实例分割器具有标签 "split_type"="instance"

InstanceSplitter(cv)

将 sklearn 实例分割器应用于时间序列面板的分割器。