数据集#
datasets
模块包含:
从互联网上的数据仓库获取数据集,并以
sktime
兼容的格式将其检索为内存中的数据集的加载器加载器用于获取单个数据集,通常用于说明目的
用于教学和说明目的的玩具数据生成器
用于写入和加载时间序列特定文件格式的实用程序
来自数据集仓库的加载器#
这些加载器访问互联网上的数据集仓库,并从中获取一个或多个数据集,单个数据集可以指定为字符串。
这些加载器可用于访问用于基准测试的参考数据集。
加载和写入数据集的函数。
|
从 Monash 时间序列预测档案中获取预测数据集。 |
|
从 fpp3 包加载数据集。 |
|
从 https://zenodo.org/records/12636070 获取 M5 数据集。 |
|
从 UCR UEA 时间序列档案加载数据集。 |
独立数据集#
这些加载器获取一个常用的独立数据集,通常用于说明目的。
单一时间序列#
加载和写入数据集的函数。
加载航空公司单变量时间序列数据集 [1]。 |
|
|
加载Longley数据集以使用外生变量进行预测。 |
加载用于预测的 lynx 单变量时间序列数据集。 |
|
加载美国宏观经济数据 [R7ccb796becb7-1]。 |
|
加载用于预测的洗发水销售单变量时间序列数据集。 |
|
|
从谢菲尔德太阳能 PV_Live API 获取英国的国家太阳能估算。 |
|
加载MTS数据集以预测个人消费和收入的增长率。 |
时间序列面板#
加载和写入数据集的函数。
|
加载典型电器的能耗数据集。 |
|
加载 ArrowHead 时间序列分类问题并返回 X 和 y。 |
|
加载 BasicMotions 时间序列分类问题并返回 X 和 y。 |
|
加载 GunPoint 时间序列分类问题并返回 X 和 y。 |
|
加载 ItalyPowerDemand 时间序列分类问题。 |
|
加载 JapaneseVowels 时间序列分类问题。 |
加载美国宏观经济数据 [R7ccb796becb7-1]。 |
|
|
加载 OSULeaf 时间序列分类问题并返回 X 和 y。 |
|
加载 Tecator 时间序列回归问题并返回 X 和 y。 |
玩具数据生成器#
分层时间序列数据#
加载和写入数据集的函数。
返回分层销售玩具数据以演示分层预测。 |
从文件加载和写入文件#
这些工具从时间序列特定的数据格式中加载和写入数据。
注意:对于从非特定于时间序列的格式加载/写入数据,请使用诸如 pandas.read_csv
这样的通用工具。
加载和写入数据集的函数。
|
从 .arff 文件加载数据到 Pandas DataFrame 中。 |
|
将时间序列 .ts 文件加载到 X 和(可选)y 中。 |
|
将数据从 .ts 文件加载到 Pandas DataFrame 中。 |
|
将数据从 .tsv 文件加载到 Pandas DataFrame 中。 |
|
将长格式文件中的数据加载到 Pandas DataFrame 中。 |
|
将 .tsf 文件中的内容转换为数据框。 |
|
将 sktime 多实例数据集写入 .ts 格式的文本文件。 |
|
将数据集以数据框格式输出到 .ts 文件。 |
|
将数据集以 ndarray 格式输出到 .ts 文件。 |
|
使用表格转换器转换数据集,并将结果写入arff文件。 |
|
按照 sktime 使用的标准格式编写实验的预测结果。 |