ray.rllib.env.env_runner_group.EnvRunnerGroup.__init__#
- EnvRunnerGroup.__init__(*, env_creator: Callable[[EnvContext], Any | gymnasium.Env | None] | None = None, validate_env: Callable[[Any | gymnasium.Env], None] | None = None, default_policy_class: Type[Policy] | None = None, config: AlgorithmConfig | None = None, num_env_runners: int = 0, local_env_runner: bool = True, logdir: str | None = None, _setup: bool = True, tune_trial_id: str | None = None, num_workers=-1, local_worker=-1)[源代码]#
初始化一个 EnvRunnerGroup 实例。
- 参数:
env_creator – 返回给定环境配置的env的函数。
validate_env – 可选的可调用对象,用于验证生成的环境(仅在 worker=0 时)。如果环境无效,此可调用对象应引发异常。
default_policy_class – 一个可选的默认策略类,用于在(多智能体)`policies` 字典内部。如果其中的 PolicySpecs 没有定义类,则使用这个
default_policy_class
。如果为 None,PolicySpecs 将使用算法的默认策略类。config – 可选的 AlgorithmConfig(或配置字典)。
num_env_runners – 要创建的远程 EnvRunner 数量。
local_env_runner – 是否在返回的集合中也创建一个本地(非 @ray.remote)的 EnvRunner(默认:True)。如果
num_env_runners
为 0,则总是创建一个本地的 EnvRunner。logdir – 工作者的可选日志目录。
_setup – 是否实际设置工作进程。这仅用于测试。