ray.rllib.utils.numpy.lstm#

ray.rllib.utils.numpy.lstm(x, weights: numpy.ndarray, biases: numpy.ndarray | None = None, initial_internal_states: numpy.ndarray | None = None, time_major: bool = False, forget_bias: float = 1.0)[源代码]#

计算给定权重/偏置、状态和输入的LSTM层输出。

参数:
  • x – LSTM层的输入包括时间秩(如果时间优先则为第0个,否则为第1个)和批次秩(如果时间优先则为第1个,否则为第0个)。

  • weights – 权重矩阵。

  • biases – 偏置向量。如果为 None,则全为 0。

  • initial_internal_states – 传递给层的初始内部状态。如果为 None,则为全零。

  • time_major – 是否使用时间主序。默认值:False。

  • forget_bias – 添加到第一个S型函数(遗忘门)的输出。默认值:1.0。

返回:

由 1) LSTM 层的输出和 2) 元组:最后的 (c-状态, h-状态) 组成的元组。