ray.rllib.evaluation.rollout_worker.RolloutWorker.remove_policy#

RolloutWorker.remove_policy(*, policy_id: str = 'default_policy', policy_mapping_fn: Callable[[Any], str] | None = None, policies_to_train: Collection[str] | Callable[[str, SampleBatch | MultiAgentBatch | Dict[str, Any]], bool] | None = None) None[源代码]#

从此 RolloutWorker 中移除一个策略。

参数:
  • policy_id – 要移除的策略ID。默认为None,表示DEFAULT_POLICY_ID。

  • policy_mapping_fn – 一个可选的(更新后的)策略映射函数,从此处开始使用。请注意,已经进行中的情节不会更改其映射,而是会继续使用旧的映射,直到该情节结束。

  • policies_to_train – 一个可选的策略ID集合,用于训练或一个可调用的函数,该函数接受PolicyID和(可选的)SampleBatchType并返回一个布尔值(是否可训练?)。如果为None,将保持现有的设置。不在列表中(或可调用函数返回False)的策略ID对应的策略将不会被更新。