ray.rllib.policy.policy.Policy.maybe_add_time_dimension#
- Policy.maybe_add_time_dimension(input_dict: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor], seq_lens: numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor, framework: str = None)[源代码]#
为循环 RLModules 添加时间维度。
- 参数:
input_dict – 输入字典。
seq_lens – 序列长度。
framework – 用于添加时间维度的框架。如果为 None,将默认为策略的框架。
- 返回:
输入字典,可能添加了时间维度。