Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.policy.policy.Policy.maybe_add_time_dimension#

Policy.maybe_add_time_dimension(input_dict: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor], seq_lens: numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor, framework: str = None)[源代码]#

为循环 RLModules 添加时间维度。

参数:

input_dict – 输入字典。
seq_lens – 序列长度。
framework – 用于添加时间维度的框架。如果为 None，将默认为策略的框架。

返回:

输入字典，可能添加了时间维度。