ray.rllib.env.env_runner_group.EnvRunnerGroup.foreach_policy_to_train#
- EnvRunnerGroup.foreach_policy_to_train(func: Callable[[Policy, str], T]) List[T] [源代码]#
如果
policies_to_train
中包含所有工作者的策略,则对func
应用到这些策略上。- 参数:
func – 一个函数 - 接受一个策略及其ID - 该函数在所有工作者的策略上调用,对于这些策略,
worker.is_policy_to_train()
返回 True。- 返回:
所有
func([可训练策略], [ID])
调用的 n 个返回值的列表。- 返回类型:
List[any]
开发者API: 此API可能会在Ray的次要版本之间发生变化。