load_forecastingdata#

load_forecastingdata(name, replace_missing_vals='NAN', value_column_name='series_value', return_type='default_tsf', extract_path=None)[源代码][源代码]#

从 Monash 时间序列预测档案中获取预测数据集。

如果尚未下载,则下载并提取数据集。获取的数据集为标准的 .tsf 格式。更多详情请参见 https://forecastingdata.org/

参数:
名称: str

数据集名称。如果给定的数据集在 tsf_all_dataset 中列出,此函数将首先在 extract_path 中查找,如果不存在,则尝试从 https://forecastingdata.org/ 下载数据,并将其保存到 extract_path。

replace_missing_vals: str, 默认=”NAN”

一个术语,用于指示返回的数据框中序列中的缺失值。

value_column_name: str, default=”series_value”

在返回的数据框中,任何希望作为包含序列值的列名的名称。

返回类型str - “pd_multiindex_hier”, “default_tsf” (默认), 或有效的 sktime

内存数据容器格式的mtype字符串,用于指定返回类型: - “pd_multiindex_hier” = sktime类型``pd_multiindex_hier``的pd.DataFrame - “default_tsf” = 忠实反映原始tsf格式的容器

实现代码位于:rakshitha123/TSForecasting blob/master/utils/data_loader.py。

  • 其他有效的 mtype 字符串是 Panel 或 Hierarchical mtypes

    datatypes.MTYPE_REGISTER。如果给出了面板或分层 mtype 字符串,将尝试转换为该 mtype。

有关教程和详细规范,请参见 examples/AA_datatypes_and_datasets.ipynb

extract_pathstr, 可选 (默认=None)

查找数据的路径。如果没有提供路径,函数会在 sktime/datasets/data/ 中查找。如果提供了路径,它可以是绝对的,例如 C:/Temp,或者是相对的,例如 Temp 或 ./Temp。

返回:
loaded_data: pd.DataFrame

包含时间序列的转换后的数据框。

元数据: dict

预测问题的元数据。字典键为:”frequency”(频率)、”forecast_horizon”(预测范围)、”contain_missing_values”(包含缺失值)、”contain_equal_length”(包含等长值)