ray.rllib.utils.replay_buffers.reservoir_replay_buffer.ReservoirReplayBuffer#

class ray.rllib.utils.replay_buffers.reservoir_replay_buffer.ReservoirReplayBuffer(capacity: int = 10000, storage_unit: str = 'timesteps', **kwargs)[源代码]#

基类:ReplayBuffer

此缓冲区实现了水库采样。

该算法由Jeffrey S. Vitter在《Random sampling with a reservoir》中描述。

方法

__init__

初始化一个 ReservoirBuffer 实例。

add

将一批经验或其他数据添加到此缓冲区。

apply

使用此 Actor 实例调用给定的函数。

get_host

返回计算机的网络名称。

get_state

返回所有本地状态。

ping

Ping 操作者。

sample

从该缓冲区中采样 num_items 个项目。

set_state

将所有本地状态恢复到提供的 state

stats

返回此缓冲区的统计信息。