ray.rllib.algorithms.algorithm_config.AlgorithmConfig.build#

AlgorithmConfig.build(env: str | Any | gymnasium.Env | None = None, logger_creator: Callable[[], Logger] | None = None, use_copy: bool = True) Algorithm[源代码]#

从此 AlgorithmConfig(或其副本)构建一个算法。

参数:
  • env – 要使用的环境名称(例如,一个gym注册的字符串),一个完整的类路径(例如,”ray.rllib.examples.envs.classes.random_env.RandomEnv”),或者直接是一个环境类。注意,这个参数也可以通过`config`中的”env”键来指定。

  • logger_creator – 创建 ray.tune.Logger 对象的可调用对象。如果未指定,则创建默认记录器。

  • use_copy – 是否对 self 进行深度复制,并将副本传递给算法(而不是 self)作为配置。这在您希望反复使用同一个 AlgorithmConfig 时很有用,例如在测试用例中,我们循环遍历不同的深度学习框架。

返回:

一个 ray.rllib.algorithms.algorithm.Algorithm 对象。