load_osuleaf#
- load_osuleaf(split=None, return_X_y=True, return_type=None)[源代码][源代码]#
加载OSULeaf时间序列分类问题并返回X和y。
- 参数:
- split: None 或 ‘TRAIN’, ‘TEST’ 之一,可选(默认=None)
是否加载问题的训练或测试实例。默认情况下,它会加载训练和测试实例(在一个容器中)。
- return_X_y: bool, 可选 (默认=True)
如果为真,则分别返回 (特征, 目标),而不是一个包含特征和目标列的单一数据框。
- return_type: 有效的Panel mtype字符串或None,可选(默认=None=”nested_univ”)
返回 X 的内存数据格式规范,None = “nested_univ” 类型。str 可以是任何支持的 sktime Panel mtype。
有关 mtypes 列表,请参阅 datatypes.MTYPE_REGISTER;有关规范,请参阅 examples/AA_datatypes_and_datasets.ipynb
- 常用规范:
“nested_univ: 嵌套的 pd.DataFrame, pd.Series 在单元格中 “numpy3D”/”numpy3d”/”np3D”: 3D np.ndarray (实例, 变量, 时间索引) “numpy2d”/”np2d”/”numpyflat”: 2D np.ndarray (实例, 时间索引) “pd-multiindex”: 带有 2 级 (实例, 时间) MultiIndex 的 pd.DataFrame”
如果数据无法存储在请求的类型中,则会引发异常。
- 返回:
- X: sktime 数据容器,遵循 mtype 规范
return_type
问题的时序数据,包含 n 个实例
- y: 长度为 n 的一维 numpy 数组,仅在 return_X_y 为 True 时返回
X 中每个时间序列实例的类别标签。如果 return_X_y 为 False,y 将被附加到 X 中。
- X: sktime 数据容器,遵循 mtype 规范
注释
维度: 单变量 序列长度: 427 训练样本: 200 测试样本: 242 类别数量: 6
OSULeaf 数据集包含叶子的二维轮廓。这些系列是通过对六类植物的数字化叶子图像进行颜色图像分割和边界提取(逆时针方向)获得的:Acer Circinatum、Acer Glabrum、Acer Macrophyllum、Acer Negundo、Quercus Garryana 和 Quercus Kelloggii,用于 A Grandhi 的硕士论文《基于内容的图像检索:植物物种识别》。
数据集详情: http://www.timeseriesclassification.com/description.php ?Dataset=OSULeaf
示例
>>> from sktime.datasets import load_osuleaf >>> X, y = load_osuleaf()