ray.rllib.utils.exploration.stochastic_sampling.StochasticSampling.__init__#

StochasticSampling.__init__(action_space: gymnasium.spaces.Space, *, framework: str, model: ModelV2, random_timesteps: int = 0, **kwargs)[源代码]#

初始化一个 StochasticSampling 探索对象。

参数:
  • action_space – 环境使用的健身房动作空间。

  • framework – None、“tf”、“torch” 中的一个。

  • model – 拥有策略使用的 ModelV2。

  • random_timesteps – 完全随机行动的时间步数。只有在这些时间步数之后,才会实际抽取样本来获取探索行动。