ray.rllib.utils.numpy.softmax#

ray.rllib.utils.numpy.softmax(x: numpy.ndarray | list, axis: int = -1, epsilon: float | None = None) numpy.ndarray[源代码]#

返回 x 的 softmax 值。

使用的精确公式是:S(xi) = e^xi / SUMj(e^xj),其中 j 遍历 x 中的所有元素。

参数:
  • x – softmax 函数的输入。

  • axis – 要进行softmax的轴。

  • epsilon – 可选的 epsilon 作为最小值。如果为 None,则使用 SMALL_NUMBER

返回:

x 上的 softmax。