ray.rllib.policy.torch_policy_v2.TorchPolicyV2.maybe_add_time_dimension#

TorchPolicyV2.maybe_add_time_dimension(input_dict: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor], seq_lens: numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor, framework: str = None)#

为循环 RLModules 添加时间维度。

参数:
  • input_dict – 输入字典。

  • seq_lens – 序列长度。

  • framework – 用于添加时间维度的框架。如果为 None,将默认为策略的框架。

返回:

输入字典,可能添加了时间维度。