erp_distance#

erp_distance(x: ndarray, y: ndarray, window: float | None = None, itakura_max_slope: float | None = None, bounding_matrix: ndarray | None = None, g: float = 0.0, **kwargs: Any) → float[源代码][源代码]#

计算两个序列之间的真实惩罚（ERP）编辑距离。

ERP，首次提出于 [1]，尝试通过更好地考虑索引如何在成本矩阵中传递来对齐时间序列。通常在 dtw 成本矩阵中，如果找不到对齐，则将前一个值传递。ERP 提出了间隙或没有匹配点的序列的概念。然后根据这些间隙与 ‘g’ 的距离来惩罚它们。

参数:

x: np.ndarray (1d 或 2d 数组): 第一个时间序列。
y: np.ndarray (1d 或 2d 数组): 第二个时间序列。
window: float, defaults = None: 这是Sakoe-Chiba窗口的半径（如果使用Sakoe-Chiba下界）。值必须在0.和1.之间。
itakura_max_slope: float, 默认值 = None: Itakura 平行四边形的斜率梯度（如果使用 Itakura 平行四边形下界）。值必须在 0. 和 1. 之间。
bounding_matrix: np.ndarray (2d，大小为 mxn，其中 m 是 len(x)，n 是 len(y))，: defaults = None

自定义使用的边界矩阵。如果定义了，则忽略其他 lower_bounding 参数。矩阵应构造为，被认为在边界内的索引值应为 0，边界矩阵外的索引值应为无穷大。
g: float, 默认值 = 0.: 用于惩罚间隙的参考值。
**kwargs: 任何: 额外的关键字参数。

返回:

浮动: x 和 y 之间的 ERP 距离。

引发:

ValueError: 如果 sakoe_chiba_window_radius 不是浮点数。如果 itakura_max_slope 不是浮点数。如果提供的 x 或 y 的值不是 numpy 数组。如果 x 或 y 的值有超过 3 个维度。如果提供了度量字符串，但不是定义的有效字符串。如果提供了度量对象（类实例）且不继承自 NumbaDistance。如果无法确定度量类型。如果 g 不是浮点数。如果同时设置了 window 和 itakura_max_slope。

参考文献

[1]

Lei Chen 和 Raymond Ng. 2004. 关于 Lp-范数和编辑距离的结合。

在第三十届国际超大规模数据库会议论文集中

第30卷（VLDB ‘04）。VLDB基金会，792-803。

示例

>>> import numpy as np
>>> from sktime.distances import erp_distance
>>> x_1d = np.array([1, 2, 3, 4])  # 1d array
>>> y_1d = np.array([5, 6, 7, 8])  # 1d array
>>> erp_distance(x_1d, y_1d)
16.0

>>> x_2d = np.array([[1, 2, 3, 4], [5, 6, 7, 8]])  # 2d array
>>> y_2d = np.array([[9, 10, 11, 12], [13, 14, 15, 16]])  # 2d array
>>> erp_distance(x_2d, y_2d)
45.254833995939045