ray.rllib.utils.replay_buffers.reservoir_replay_buffer.ReservoirReplayBuffer#
- class ray.rllib.utils.replay_buffers.reservoir_replay_buffer.ReservoirReplayBuffer(capacity: int = 10000, storage_unit: str = 'timesteps', **kwargs)[源代码]#
基类:
ReplayBuffer
此缓冲区实现了水库采样。
该算法由Jeffrey S. Vitter在《Random sampling with a reservoir》中描述。
方法
初始化一个 ReservoirBuffer 实例。
将一批经验或其他数据添加到此缓冲区。
使用此 Actor 实例调用给定的函数。
返回计算机的网络名称。
返回所有本地状态。
Ping 操作者。
从该缓冲区中采样
num_items
个项目。将所有本地状态恢复到提供的
state
。返回此缓冲区的统计信息。