Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.evaluation.rollout_worker.RolloutWorker.remove_policy#

RolloutWorker.remove_policy(*, policy_id: str = 'default_policy', policy_mapping_fn: Callable[[Any], str] | None = None, policies_to_train: Collection[str] | Callable[[str, SampleBatch | MultiAgentBatch | Dict[str, Any]], bool] | None = None) → None[源代码]#

从此 RolloutWorker 中移除一个策略。

参数:

policy_id – 要移除的策略ID。默认为None，表示DEFAULT_POLICY_ID。
policy_mapping_fn – 一个可选的（更新后的）策略映射函数，从此处开始使用。请注意，已经进行中的情节不会更改其映射，而是会继续使用旧的映射，直到该情节结束。
policies_to_train – 一个可选的策略ID集合，用于训练或一个可调用的函数，该函数接受PolicyID和（可选的）SampleBatchType并返回一个布尔值（是否可训练？）。如果为None，将保持现有的设置。不在列表中（或可调用函数返回False）的策略ID对应的策略将不会被更新。

优云智算