ray.rllib.utils.exploration.gaussian_noise.GaussianNoise.__init__#

GaussianNoise.__init__(action_space: gymnasium.spaces.Space, *, framework: str, model: ModelV2, random_timesteps: int = 1000, stddev: float = 0.1, initial_scale: float = 1.0, final_scale: float = 0.02, scale_timesteps: int = 10000, scale_schedule: Schedule | None = None, **kwargs)[源代码]#

初始化一个 GaussianNoise 实例。

参数:
  • random_timesteps – 完全随机行动的时间步数。只有在经过这个时间步数之后,self.scale 退火过程才会开始(见下文)。

  • stddev – 用于添加到动作中的高斯噪声的标准差(sigma)。

  • initial_scale – 初始缩放权重,用于乘以噪声。

  • final_scale – 最终用于乘以噪声的缩放权重。

  • scale_timesteps – 线性退火缩放因子的时间步长(在使用 random_timesteps 步随机动作之后)。

  • scale_schedule – 一个可选的 Schedule 对象以使用(而不是从给定的参数构造一个)。