ray.rllib.policy.eager_tf_policy_v2.EagerTFPolicyV2.apply_gradients_fn#
- EagerTFPolicyV2.apply_gradients_fn(optimizer: tf.keras.optimizers.Optimizer, grads: List[Tuple[numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor]] | List[numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor]) tf.Operation [源代码]#
梯度计算函数(从损失张量,使用本地优化器)。
- 参数:
optimizer – 用于计算梯度的 tf(本地)优化器对象。
grads – 要应用的梯度张量。
- 返回:
应用提供的梯度的TF操作。
- 返回类型:
“tf.Operation”