ray.rllib.evaluation.rollout_worker.RolloutWorker.set_is_policy_to_train#

RolloutWorker.set_is_policy_to_train(is_policy_to_train: Collection[str] | Callable[[str, SampleBatch | MultiAgentBatch | Dict[str, Any] | None], bool]) None[源代码]#

self.is_policy_to_train() 设置为一个新可调用对象。

参数:

is_policy_to_train – 要训练的策略ID集合,或一个可调用对象,该对象接受PolicyID和(可选)SampleBatchType并返回一个布尔值(是否可训练?)。如果为None,将保留现有的设置。不在列表中(或可调用对象返回False)的策略ID将不会被更新。