ray.rllib.policy.policy.Policy.num_state_tensors# Policy.num_state_tensors() → int[源代码]# 策略的RNN模型所需的内部状态数量。 返回: 此策略模型所保留的 RNN 内部状态的数量。 返回类型: int