Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.utils.exploration.stochastic_sampling.StochasticSampling.init#

StochasticSampling.__init__(action_space: gymnasium.spaces.Space, *, framework: str, model: ModelV2, random_timesteps: int = 0, **kwargs)[源代码]#

初始化一个 StochasticSampling 探索对象。

参数:

action_space – 环境使用的健身房动作空间。
framework – None、“tf”、“torch” 中的一个。
model – 拥有策略使用的 ModelV2。
random_timesteps – 完全随机行动的时间步数。只有在这些时间步数之后，才会实际抽取样本来获取探索行动。