load_forecastingdata#

load_forecastingdata(name, replace_missing_vals='NAN', value_column_name='series_value', return_type='default_tsf', extract_path=None)[源代码][源代码]#

从 Monash 时间序列预测档案中获取预测数据集。

如果尚未下载，则下载并提取数据集。获取的数据集为标准的 .tsf 格式。更多详情请参见 https://forecastingdata.org/。

参数:

名称: str

数据集名称。如果给定的数据集在 tsf_all_dataset 中列出，此函数将首先在 extract_path 中查找，如果不存在，则尝试从 https://forecastingdata.org/ 下载数据，并将其保存到 extract_path。

replace_missing_vals: str, 默认=”NAN”

一个术语，用于指示返回的数据框中序列中的缺失值。

value_column_name: str, default=”series_value”

在返回的数据框中，任何希望作为包含序列值的列名的名称。

返回类型str - “pd_multiindex_hier”, “default_tsf” (默认), 或有效的 sktime

内存数据容器格式的mtype字符串，用于指定返回类型： - “pd_multiindex_hier” = sktime类型``pd_multiindex_hier``的pd.DataFrame - “default_tsf” = 忠实反映原始tsf格式的容器

实现代码位于：rakshitha123/TSForecasting blob/master/utils/data_loader.py。

其他有效的 mtype 字符串是 Panel 或 Hierarchical mtypes
datatypes.MTYPE_REGISTER。如果给出了面板或分层 mtype 字符串，将尝试转换为该 mtype。

有关教程和详细规范，请参见 examples/AA_datatypes_and_datasets.ipynb

extract_pathstr, 可选 (默认=None)

查找数据的路径。如果没有提供路径，函数会在 sktime/datasets/data/ 中查找。如果提供了路径，它可以是绝对的，例如 C:/Temp，或者是相对的，例如 Temp 或 ./Temp。

返回:

loaded_data: pd.DataFrame: 包含时间序列的转换后的数据框。
元数据: dict: 预测问题的元数据。字典键为：”frequency”（频率）、”forecast_horizon”（预测范围）、”contain_missing_values”（包含缺失值）、”contain_equal_length”（包含等长值）