ray.rllib.env.env_runner_group.EnvRunnerGroup.foreach_policy_to_train#

EnvRunnerGroup.foreach_policy_to_train(func: Callable[[Policy, str], T]) → List[T][源代码]#

如果 policies_to_train 中包含所有工作者的策略，则对 func 应用到这些策略上。

参数:: func – 一个函数 - 接受一个策略及其ID - 该函数在所有工作者的策略上调用，对于这些策略，worker.is_policy_to_train() 返回 True。
返回:: 所有 func([可训练策略], [ID]) 调用的 n 个返回值的列表。
返回类型:: List[any]

开发者API: 此API可能会在Ray的次要版本之间发生变化。