wddtw_distance#

wddtw_distance(x: ndarray, y: ndarray, window: float | None = None, itakura_max_slope: float | None = None, bounding_matrix: ndarray | None = None, compute_derivative=None, g: float = 0.0, **kwargs: Any) float[源代码][源代码]#

计算加权导数动态时间规整(WDDTW)距离。

WDDTW 首次在 [1] 中被提出,作为 DDTW 的扩展。通过向导数添加权重,这意味着对齐不仅考虑时间序列的形状,还考虑了相位。

正式地,导数计算如下:

\[D_{x}[q] = \frac{{}(q_{i} - q_{i-1} + ((q_{i+1} - q_{i-1}/2)}{2}\]

因此,可以使用 D(导数)计算加权导数,如下:

\[d_{w}(x_{i}, y_{j}) = ||w_{|i-j|}(D_{x_{i}} - D_{y_{j}})||\]
参数:
x: np.ndarray (1d 或 2d 数组)

第一个时间序列。

y: np.ndarray (1d 或 2d 数组)

第二个时间序列。

window: float, defaults = None

这是Sakoe-Chiba窗口的半径(如果使用Sakoe-Chiba下界)。值必须在0.和1.之间。

itakura_max_slope: float, 默认为 None

Itakura 平行四边形的斜率梯度(如果使用 Itakura 平行四边形下界)。值必须在 0. 和 1. 之间。

bounding_matrix: np.ndarray (2d,大小为 mxn,其中 m 是 len(x),n 是 len(y)),

defaults = None

自定义使用的边界矩阵。如果定义了,则忽略其他 lower_bounding 参数。矩阵的结构应使得在边界内的索引值为 0,而边界外的索引值应为无穷大。

compute_derivative: Callable[[np.ndarray], np.ndarray],

defaults = 平均坡度差异

计算导数的可调用对象。如果没有提供,则使用两点间斜率的平均值。

g: float, 默认值 = 0.

控制函数曲率(斜率)的常数;即,g 控制具有较大相位差的点的惩罚程度。

**kwargs: 任意

额外的关键字参数。

返回:
浮动

Wddtw 距离 x 和 y 之间。

引发:
ValueError

如果 sakoe_chiba_window_radius 不是浮点数。如果 itakura_max_slope 不是浮点数。如果提供的 x 或 y 的值不是 numpy 数组。如果 x 或 y 的值有超过 2 个维度。如果提供了 metric 字符串,但不是定义的有效字符串。如果提供了 metric 对象(类的实例)并且不继承自 NumbaDistance。如果无法确定 metric 类型。如果 compute derivative 可调用对象没有经过 no_python 编译。如果 g 的值不是浮点数。如果同时设置了 window 和 itakura_max_slope。

参考文献

[1]

Young-Seon Jeong, Myong K. Jeong, Olufemi A. Omitaomu, 加权动态时间

时间序列分类的扭曲,模式识别,第44卷,第9期,2011年,第2231-2240页,ISSN 0031-3203,https://doi.org/10.1016/j.patcog.2010.09.022

示例

>>> import numpy as np
>>> from sktime.distances import wddtw_distance
>>> x_1d = np.array([1, 2, 3, 4])  # 1d array
>>> y_1d = np.array([5, 6, 7, 8])  # 1d array
>>> wddtw_distance(x_1d, y_1d) 
0.0
>>> x_2d = np.array([[1, 2, 3, 4], [5, 6, 7, 8]])  # 2d array
>>> y_2d = np.array([[9, 10, 11, 12], [13, 14, 15, 16]])  # 2d array
>>> wddtw_distance(x_2d, y_2d) 
0.0