Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.policy.eager_tf_policy_v2.EagerTFPolicyV2.apply_gradients_fn#

EagerTFPolicyV2.apply_gradients_fn(optimizer: tf.keras.optimizers.Optimizer, grads: List[Tuple[numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor]] | List[numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor]) → tf.Operation[源代码]#

梯度计算函数（从损失张量，使用本地优化器）。

参数:

optimizer – 用于计算梯度的 tf（本地）优化器对象。
grads – 要应用的梯度张量。

返回:

应用提供的梯度的TF操作。

返回类型:

“tf.Operation”