Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.evaluation.rollout_worker.RolloutWorker.set_is_policy_to_train#

RolloutWorker.set_is_policy_to_train(is_policy_to_train: Collection[str] | Callable[[str, SampleBatch | MultiAgentBatch | Dict[str, Any] | None], bool]) → None[源代码]#

将 self.is_policy_to_train() 设置为一个新可调用对象。

参数:: is_policy_to_train – 要训练的策略ID集合，或一个可调用对象，该对象接受PolicyID和（可选）SampleBatchType并返回一个布尔值（是否可训练？）。如果为None，将保留现有的设置。不在列表中（或可调用对象返回False）的策略ID将不会被更新。