ray.rllib.utils.replay_buffers.prioritized_replay_buffer.PrioritizedReplayBuffer#

class ray.rllib.utils.replay_buffers.prioritized_replay_buffer.PrioritizedReplayBuffer(capacity: int = 10000, storage_unit: str = 'timesteps', alpha: float = 1.0, **kwargs)[源代码]#

基类：ReplayBuffer

这个缓冲区实现了优先经验回放。

该算法由 Tom Schaul 等人描述于《优先经验回放》。完整论文见 https://arxiv.org/pdf/1511.05952.pdf。

开发者API: 此API可能会在Ray的次要版本之间发生变化。

方法

`__init__`	初始化一个 PrioritizedReplayBuffer 实例。
`add`	将一批经验或其他数据添加到此缓冲区。
`apply`	使用此 Actor 实例调用给定的函数。
`get_host`	返回计算机的网络名称。
`get_state`	返回所有本地状态。
`ping`	Ping 操作者。
`sample`	从这个缓冲区中采样 `num_items` 项，包括优先级。
`set_state`	将所有本地状态恢复到提供的 `state`。
`stats`	返回此缓冲区的统计信息。
`update_priorities`	更新给定索引项的优先级。