ray.rllib.env.env_runner_group.EnvRunnerGroup.foreach_policy#
- EnvRunnerGroup.foreach_policy(func: Callable[[Policy, str], T]) List[T] [源代码]#
使用每个工作者的 (policy, PolicyID) 元组调用
func
。请注意,在多智能体情况下,每个工作者可能有多于一个策略。
- 参数:
func – 一个函数 - 接受一个策略及其ID - 该函数在所有工作者的策略上调用。
- 返回:
所有工作者的策略上 func 的返回值列表。这个列表的长度是:(工作者数量 + 1 (本地工作者)) * [多智能体配置字典中的策略数量]。本地工作者的结果排在前面,然后是所有远程工作者的结果。
开发者API: 此API可能会在Ray的次要版本之间发生变化。