ray.rllib.env.env_runner_group.EnvRunnerGroup.__init__#

EnvRunnerGroup.__init__(*, env_creator: Callable[[EnvContext], Any | gymnasium.Env | None] | None = None, validate_env: Callable[[Any | gymnasium.Env], None] | None = None, default_policy_class: Type[Policy] | None = None, config: AlgorithmConfig | None = None, num_env_runners: int = 0, local_env_runner: bool = True, logdir: str | None = None, _setup: bool = True, tune_trial_id: str | None = None, num_workers=-1, local_worker=-1)[源代码]#

初始化一个 EnvRunnerGroup 实例。

参数:
  • env_creator – 返回给定环境配置的env的函数。

  • validate_env – 可选的可调用对象,用于验证生成的环境(仅在 worker=0 时)。如果环境无效,此可调用对象应引发异常。

  • default_policy_class – 一个可选的默认策略类,用于在(多智能体)`policies` 字典内部。如果其中的 PolicySpecs 没有定义类,则使用这个 default_policy_class。如果为 None,PolicySpecs 将使用算法的默认策略类。

  • config – 可选的 AlgorithmConfig(或配置字典)。

  • num_env_runners – 要创建的远程 EnvRunner 数量。

  • local_env_runner – 是否在返回的集合中也创建一个本地(非 @ray.remote)的 EnvRunner(默认:True)。如果 num_env_runners 为 0,则总是创建一个本地的 EnvRunner。

  • logdir – 工作者的可选日志目录。

  • _setup – 是否实际设置工作进程。这仅用于测试。