数据集#

datasets 模块包含:

  • 从互联网上的数据仓库获取数据集,并以 sktime 兼容的格式将其检索为内存中的数据集的加载器

  • 加载器用于获取单个数据集,通常用于说明目的

  • 用于教学和说明目的的玩具数据生成器

  • 用于写入和加载时间序列特定文件格式的实用程序

来自数据集仓库的加载器#

这些加载器访问互联网上的数据集仓库,并从中获取一个或多个数据集,单个数据集可以指定为字符串。

这些加载器可用于访问用于基准测试的参考数据集。

加载和写入数据集的函数。

load_forecastingdata(name[, ...])

从 Monash 时间序列预测档案中获取预测数据集。

load_fpp3(dataset[, temp_folder])

从 fpp3 包加载数据集。

load_m5([extract_path, include_events, ...])

https://zenodo.org/records/12636070 获取 M5 数据集。

load_UCR_UEA_dataset(name[, split, ...])

从 UCR UEA 时间序列档案加载数据集。

独立数据集#

这些加载器获取一个常用的独立数据集,通常用于说明目的。

单一时间序列#

加载和写入数据集的函数。

load_airline()

加载航空公司单变量时间序列数据集 [1]。

load_longley([y_name])

加载Longley数据集以使用外生变量进行预测。

load_lynx()

加载用于预测的 lynx 单变量时间序列数据集。

load_macroeconomic()

加载美国宏观经济数据 [R7ccb796becb7-1]

load_shampoo_sales()

加载用于预测的洗发水销售单变量时间序列数据集。

load_solar([start, end, normalise, ...])

从谢菲尔德太阳能 PV_Live API 获取英国的国家太阳能估算。

load_uschange([y_name])

加载MTS数据集以预测个人消费和收入的增长率。

时间序列面板#

加载和写入数据集的函数。

load_acsf1([split, return_X_y, return_type])

加载典型电器的能耗数据集。

load_arrow_head([split, return_X_y, return_type])

加载 ArrowHead 时间序列分类问题并返回 X 和 y。

load_basic_motions([split, return_X_y, ...])

加载 BasicMotions 时间序列分类问题并返回 X 和 y。

load_gunpoint([split, return_X_y, return_type])

加载 GunPoint 时间序列分类问题并返回 X 和 y。

load_italy_power_demand([split, return_X_y, ...])

加载 ItalyPowerDemand 时间序列分类问题。

load_japanese_vowels([split, return_X_y, ...])

加载 JapaneseVowels 时间序列分类问题。

load_macroeconomic()

加载美国宏观经济数据 [R7ccb796becb7-1]

load_osuleaf([split, return_X_y, return_type])

加载 OSULeaf 时间序列分类问题并返回 X 和 y。

load_tecator([split, return_X_y, return_type])

加载 Tecator 时间序列回归问题并返回 X 和 y。

玩具数据生成器#

分层时间序列数据#

加载和写入数据集的函数。

load_hierarchical_sales_toydata()

返回分层销售玩具数据以演示分层预测。

从文件加载和写入文件#

这些工具从时间序列特定的数据格式中加载和写入数据。

注意:对于从非特定于时间序列的格式加载/写入数据,请使用诸如 pandas.read_csv 这样的通用工具。

加载和写入数据集的函数。

load_from_arff_to_dataframe(...[, ...])

从 .arff 文件加载数据到 Pandas DataFrame 中。

load_from_tsfile(full_file_path_and_name[, ...])

将时间序列 .ts 文件加载到 X 和(可选)y 中。

load_from_tsfile_to_dataframe(...[, ...])

将数据从 .ts 文件加载到 Pandas DataFrame 中。

load_from_ucr_tsv_to_dataframe(...[, ...])

将数据从 .tsv 文件加载到 Pandas DataFrame 中。

load_from_long_to_dataframe(...[, separator])

将长格式文件中的数据加载到 Pandas DataFrame 中。

load_tsf_to_dataframe(full_file_path_and_name)

将 .tsf 文件中的内容转换为数据框。

write_panel_to_tsfile(data, path[, target, ...])

将 sktime 多实例数据集写入 .ts 格式的文本文件。

write_dataframe_to_tsfile(data, path[, ...])

将数据集以数据框格式输出到 .ts 文件。

write_ndarray_to_tsfile(data, path[, ...])

将数据集以 ndarray 格式输出到 .ts 文件。

write_tabular_transformation_to_arff(data, ...)

使用表格转换器转换数据集,并将结果写入arff文件。

write_results_to_uea_format(estimator_name, ...)

按照 sktime 使用的标准格式编写实验的预测结果。