ray.rllib.utils.exploration.parameter_noise.ParameterNoise.__init__#

ParameterNoise.__init__(action_space, *, framework: str, policy_config: dict, model: ModelV2, initial_stddev: float = 1.0, random_timesteps: int = 10000, sub_exploration: dict | None = None, **kwargs)[源代码]#

初始化一个 ParameterNoise 探索对象。

参数:
  • initial_stddev – 用于噪声的初始标准差。

  • random_timesteps – 完全随机行动的时间步数(参见 [1])。

  • sub_exploration – 可选的子探索配置。None 表示自动检测/设置。