ray.rllib.算法.算法配置.AlgorithmConfig.覆盖#

classmethod AlgorithmConfig.overrides(**kwargs)[源代码]#

生成并验证一组配置键/值对(通过 kwargs 传递)。

验证给定的配置键是否有效是在构造时立即进行的(通过与该类的默认 AlgorithmConfig 对象的属性进行比较)。允许与完整的 AlgorithmConfig 对象结合,以生成一个新的 AlgorithmConfig 对象。

在任何地方使用时,我们希望用户只需定义一些配置设置,这些设置会根据某些主要配置进行更改,例如在多代理设置和评估配置中。

from ray.rllib.algorithms.ppo import PPOConfig
from ray.rllib.policy.policy import PolicySpec
config = (
    PPOConfig()
    .multi_agent(
        policies={
            "pol0": PolicySpec(config=PPOConfig.overrides(lambda_=0.95))
        },
    )
)
from ray.rllib.algorithms.algorithm_config import AlgorithmConfig
from ray.rllib.algorithms.ppo import PPOConfig
config = (
    PPOConfig()
    .evaluation(
        evaluation_num_env_runners=1,
        evaluation_interval=1,
        evaluation_config=AlgorithmConfig.overrides(explore=False),
    )
)
返回:

一个将有效的配置属性名称映射到值的字典。

抛出:

KeyError – 如果传递了一个不存在的属性名称(kwargs 键)。有效的属性名称取自 cls 的默认 AlgorithmConfig 对象。