load_forecastingdata#
- load_forecastingdata(name, replace_missing_vals='NAN', value_column_name='series_value', return_type='default_tsf', extract_path=None)[源代码][源代码]#
从 Monash 时间序列预测档案中获取预测数据集。
如果尚未下载,则下载并提取数据集。获取的数据集为标准的 .tsf 格式。更多详情请参见 https://forecastingdata.org/。
- 参数:
- 名称: str
数据集名称。如果给定的数据集在 tsf_all_dataset 中列出,此函数将首先在 extract_path 中查找,如果不存在,则尝试从 https://forecastingdata.org/ 下载数据,并将其保存到 extract_path。
- replace_missing_vals: str, 默认=”NAN”
一个术语,用于指示返回的数据框中序列中的缺失值。
- value_column_name: str, default=”series_value”
在返回的数据框中,任何希望作为包含序列值的列名的名称。
- 返回类型str - “pd_multiindex_hier”, “default_tsf” (默认), 或有效的 sktime
内存数据容器格式的mtype字符串,用于指定返回类型: - “pd_multiindex_hier” = sktime类型``pd_multiindex_hier``的pd.DataFrame - “default_tsf” = 忠实反映原始tsf格式的容器
实现代码位于:rakshitha123/TSForecasting blob/master/utils/data_loader.py。
- 其他有效的 mtype 字符串是 Panel 或 Hierarchical mtypes
datatypes.MTYPE_REGISTER。如果给出了面板或分层 mtype 字符串,将尝试转换为该 mtype。
有关教程和详细规范,请参见 examples/AA_datatypes_and_datasets.ipynb
- extract_pathstr, 可选 (默认=None)
查找数据的路径。如果没有提供路径,函数会在
sktime/datasets/data/
中查找。如果提供了路径,它可以是绝对的,例如 C:/Temp,或者是相对的,例如 Temp 或 ./Temp。
- 返回:
- loaded_data: pd.DataFrame
包含时间序列的转换后的数据框。
- 元数据: dict
预测问题的元数据。字典键为:”frequency”(频率)、”forecast_horizon”(预测范围)、”contain_missing_values”(包含缺失值)、”contain_equal_length”(包含等长值)