ray.rllib.policy.policy.Policy.maybe_remove_time_dimension#

Policy.maybe_remove_time_dimension(input_dict: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor])[源代码]#

移除循环 RLModules 的时间维度。

参数:

input_dict – 输入字典。

返回:

可能移除了时间维度的输入字典。