ray.rllib.policy.Policy.get_num_samples_loaded_into_buffer# Policy.get_num_samples_loaded_into_buffer(buffer_index: int = 0) → int[源代码]# 返回给定缓冲区中当前加载的样本数量。 参数: buffer_index – 要在设备上使用的缓冲区(一个 MultiGPUTowerStack)的索引。每个设备上的缓冲区数量取决于 num_multi_gpu_tower_stacks 配置键的值。 返回: 每个设备加载的元组数量。