ray.rllib.env.env_runner_group.EnvRunnerGroup.foreach_policy_to_train#

EnvRunnerGroup.foreach_policy_to_train(func: Callable[[Policy, str], T]) List[T][源代码]#

如果 policies_to_train 中包含所有工作者的策略,则对 func 应用到这些策略上。

参数:

func – 一个函数 - 接受一个策略及其ID - 该函数在所有工作者的策略上调用,对于这些策略,worker.is_policy_to_train() 返回 True。

返回:

所有 func([可训练策略], [ID]) 调用的 n 个返回值的列表。

返回类型:

List[any]

开发者API: 此API可能会在Ray的次要版本之间发生变化。