ray.rllib.env.env_runner_group.EnvRunnerGroup.is_policy_to_train#

EnvRunnerGroup.is_policy_to_train(policy_id: str, batch: SampleBatch | MultiAgentBatch | Dict[str, Any] | None = None) bool[源代码]#

给定的 PolicyID(可选地在某些批次内)是否可训练。

开发者API: 此API可能会在Ray的次要版本之间发生变化。