ray.rllib.algorithms.algorithm_config.AlgorithmConfig.build#
- AlgorithmConfig.build(env: str | Any | gymnasium.Env | None = None, logger_creator: Callable[[], Logger] | None = None, use_copy: bool = True) Algorithm [源代码]#
从此 AlgorithmConfig(或其副本)构建一个算法。
- 参数:
env – 要使用的环境名称(例如,一个gym注册的字符串),一个完整的类路径(例如,”ray.rllib.examples.envs.classes.random_env.RandomEnv”),或者直接是一个环境类。注意,这个参数也可以通过`config`中的”env”键来指定。
logger_creator – 创建 ray.tune.Logger 对象的可调用对象。如果未指定,则创建默认记录器。
use_copy – 是否对
self
进行深度复制,并将副本传递给算法(而不是self
)作为配置。这在您希望反复使用同一个 AlgorithmConfig 时很有用,例如在测试用例中,我们循环遍历不同的深度学习框架。
- 返回:
一个 ray.rllib.algorithms.algorithm.Algorithm 对象。