ray.rllib.utils.numpy.softmax#
- ray.rllib.utils.numpy.softmax(x: numpy.ndarray | list, axis: int = -1, epsilon: float | None = None) numpy.ndarray [源代码]#
返回 x 的 softmax 值。
使用的精确公式是:S(xi) = e^xi / SUMj(e^xj),其中 j 遍历 x 中的所有元素。
- 参数:
x – softmax 函数的输入。
axis – 要进行softmax的轴。
epsilon – 可选的 epsilon 作为最小值。如果为 None,则使用
SMALL_NUMBER
。
- 返回:
x 上的 softmax。