ray.rllib.policy.Policy.get_num_samples_loaded_into_buffer#

Policy.get_num_samples_loaded_into_buffer(buffer_index: int = 0) int[源代码]#

返回给定缓冲区中当前加载的样本数量。

参数:

buffer_index – 要在设备上使用的缓冲区(一个 MultiGPUTowerStack)的索引。每个设备上的缓冲区数量取决于 num_multi_gpu_tower_stacks 配置键的值。

返回:

每个设备加载的元组数量。