load_japanese_vowels#

load_japanese_vowels(split=None, return_X_y=True, return_type=None)[源代码][源代码]#

加载 JapaneseVowels 时间序列分类问题。

不等长序列的多变量问题示例。

参数:
split: None 或 ‘TRAIN’、’TEST’ 之一,可选(默认=None)

是否加载问题的训练或测试实例。默认情况下,它会加载训练和测试实例(在一个容器中)。

return_X_y: bool, 可选 (默认=True)

如果为真,返回 (特征, 目标) 分别而不是一个带有特征和目标列的单一数据框。

return_type: 有效的Panel mtype字符串或None,可选(默认=None=”nested_univ”)

返回 X 的内存数据格式规范,None = “nested_univ” 类型。str 可以是任何支持的 sktime Panel mtype。

有关 mtypes 的列表,请参阅 datatypes.MTYPE_REGISTER;有关规范,请参阅 examples/AA_datatypes_and_datasets.ipynb

常用规范:

nested_univ: 单元格中的嵌套 pd.DataFrame, pd.Series “numpy3D”/”numpy3d”/”np3D”: 3D np.ndarray (实例, 变量, 时间索引) “numpy2d”/”np2d”/”numpyflat”: 2D np.ndarray (实例, 时间索引) “pd-multiindex”: 具有2级(实例, 时间) MultiIndex 的 pd.DataFrame

如果数据无法存储在请求的类型中,则会引发异常。

返回:
X: 包含 m 行和 c 列的 pd.DataFrame

问题中具有 m 个案例和 c 个维度的时序数据

y: numpy 数组

X 中每个案例的类别标签

注释

维度: 多元, 12 序列长度: 7-29 训练案例: 270 测试案例: 370 类别数量: 9

一个UCI档案数据集。9名日本男性发音者被记录发音元音’a’和’e’。对原始录音应用’12度线性预测分析’,以获得具有12个维度和序列长度在7到29之间的时间序列。分类任务是预测说话者。因此,每个实例是一个转换后的发音,包含12*29个值,并附有一个单一的类别标签,[1…9]。给定的训练集由每个说话者的30个发音组成,然而测试集的分布根据时间和实验可用性的外部因素而变化,每个说话者有24到88个实例。参考文献:M. Kudo, J. Toyama and M. Shimbo. (1999). “Multidimensional Curve Classification Using Passing-Through Regions”. Pattern Recognition Letters, Vol. 20, No. 11–13, pages 1103–1111. 数据集详情:http://timeseriesclassification.com/description.php?Dataset=JapaneseVowels

示例

>>> from sktime.datasets import load_japanese_vowels
>>> X, y = load_japanese_vowels()