ray.rllib.策略.获取初始状态#

Policy.get_initial_state() List[numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor][源代码]#

返回当前策略的初始RNN状态。

返回:

当前策略的初始RNN状态。

返回类型:

List[TensorType]