ray.rllib.env.env_runner_group.EnvRunnerGroup.is_policy_to_train#
- EnvRunnerGroup.is_policy_to_train(policy_id: str, batch: SampleBatch | MultiAgentBatch | Dict[str, Any] | None = None) bool [源代码]#
给定的 PolicyID(可选地在某些批次内)是否可训练。
开发者API: 此API可能会在Ray的次要版本之间发生变化。