ray.rllib.utils.exploration.stochastic_sampling.StochasticSampling.__init__#
- StochasticSampling.__init__(action_space: gymnasium.spaces.Space, *, framework: str, model: ModelV2, random_timesteps: int = 0, **kwargs)[源代码]#
初始化一个 StochasticSampling 探索对象。
- 参数:
action_space – 环境使用的健身房动作空间。
framework – None、“tf”、“torch” 中的一个。
model – 拥有策略使用的 ModelV2。
random_timesteps – 完全随机行动的时间步数。只有在这些时间步数之后,才会实际抽取样本来获取探索行动。