load_tecator#

load_tecator(split=None, return_X_y=True, return_type=None)[源代码][源代码]#

加载Tecator时间序列回归问题并返回X和y。

参数:

split: None 或 ‘TRAIN’、’TEST’ 之一，可选（默认=None）

是否加载问题的训练或测试实例。默认情况下，它会加载训练和测试实例（在一个容器中）。

return_X_y: bool, 可选 (默认=True)

如果为 True，则分别返回 (特征, 目标)，而不是一个包含特征和目标列的单一数据框。

return_type: 有效的Panel mtype字符串或None，可选（默认=None=”nested_univ”）

返回 X 的内存数据格式规范，None = “nested_univ” 类型。str 可以是任何支持的 sktime Panel mtype。

有关 mtypes 的列表，请参阅 datatypes.MTYPE_REGISTER；有关规范，请参阅 examples/AA_datatypes_and_datasets.ipynb

常用规范：: nested_univ: 单元格中的嵌套 pd.DataFrame, pd.Series “numpy3D”/”numpy3d”/”np3D”: 3D np.ndarray (实例, 变量, 时间索引) “numpy2d”/”np2d”/”numpyflat”: 2D np.ndarray (实例, 时间索引) “pd-multiindex”: 具有2级(实例, 时间) MultiIndex 的 pd.DataFrame

如果数据无法存储在请求的类型中，则会引发异常。

返回:

X: sktime 数据容器，遵循 mtype 规范 return_type: 问题的时序数据，包含 n 个实例
y: 长度为 n 的 1D numpy 数组，仅在 return_X_y 为 True 时返回: X 中每个时间序列实例的目标值。如果 return_X_y 为 False，则 y 会被附加到 X 中。

注释

维度: 单变量序列长度: 100 训练案例: 172 测试案例: 43

此数据集的目的是基于肉的近红外光谱测量其脂肪含量。: 红外吸收光谱。

吸光度光谱在850 nm到1050 nm的波长范围内测量。脂肪含量通过标准化学分析方法测量。数据集包含215个肉类样本，每个样本有100个光谱测量值。更多信息请参见：https://www.openml.org/search?type=data&sort=runs&id=505&status=active

参考文献

[1] C.Borggaard 和 H.H.Thodberg, “光谱的最优最小神经解释”, 分析化学 64 (1992), p 545-551. [2] H.H.Thodberg, “贝叶斯之王牌: 应用神经网络与修剪”, 手稿 1132, 丹麦肉类研究所 (1993), p 1-12.

示例

>>> from sktime.datasets import load_tecator
>>> X, y = load_tecator()