ray.rllib.utils.replay_buffers.replay_buffer.ReplayBuffer.__init__#

ReplayBuffer.__init__(capacity: int = 10000, storage_unit: str | StorageUnit = 'timesteps', **kwargs)[源代码]#

初始化一个(FIFO)ReplayBuffer 实例。

参数:
  • capacity – 在此FIFO缓冲区中存储的最大时间步数。达到此数量后,将丢弃较旧的样本以为新样本腾出空间。

  • storage_unit – 如果不是 StorageUnit,则可以是 ‘timesteps’、’sequences’ 或 ‘episodes’。指定经验如何存储。

  • **kwargs – 向前兼容的关键字参数。