ray.rllib.utils.exploration.gaussian_noise.GaussianNoise#

class ray.rllib.utils.exploration.gaussian_noise.GaussianNoise(action_space: gymnasium.spaces.Space, *, framework: str, model: ModelV2, random_timesteps: int = 1000, stddev: float = 0.1, initial_scale: float = 1.0, final_scale: float = 0.02, scale_timesteps: int = 10000, scale_schedule: Schedule | None = None, **kwargs)[源代码]#

基类:Exploration

一个向连续动作添加白噪声的探索。

如果 explore=True,返回动作加上随时间退火的尺度 x 高斯噪声。此外,在开始时可能会有一些完全随机的时期。

如果 explore=False,则返回确定性动作。

方法

__init__

初始化一个 GaussianNoise 实例。

before_compute_actions

在调用 policy.compute_actions() 之前的准备工作钩子。

get_exploration_optimizer

可以将优化器添加到策略自身的 optimizers 中。

get_state

返回当前的缩放值。

on_episode_end

在剧集结束时处理必要的探索逻辑。

on_episode_start

在剧集开始时处理必要的探索逻辑。

postprocess_trajectory

处理已完成剧情节点的后处理。