ray.rllib.utils.exploration.gaussian_noise.GaussianNoise.__init__#
- GaussianNoise.__init__(action_space: gymnasium.spaces.Space, *, framework: str, model: ModelV2, random_timesteps: int = 1000, stddev: float = 0.1, initial_scale: float = 1.0, final_scale: float = 0.02, scale_timesteps: int = 10000, scale_schedule: Schedule | None = None, **kwargs)[源代码]#
初始化一个 GaussianNoise 实例。
- 参数:
random_timesteps – 完全随机行动的时间步数。只有在经过这个时间步数之后,
self.scale
退火过程才会开始(见下文)。stddev – 用于添加到动作中的高斯噪声的标准差(sigma)。
initial_scale – 初始缩放权重,用于乘以噪声。
final_scale – 最终用于乘以噪声的缩放权重。
scale_timesteps – 线性退火缩放因子的时间步长(在使用
random_timesteps
步随机动作之后)。scale_schedule – 一个可选的 Schedule 对象以使用(而不是从给定的参数构造一个)。