ray.rllib.policy.sample_batch.SampleBatch.pop# SampleBatch.pop(k[, d]) → v, remove specified key and return the corresponding value.# 如果未找到键,则返回给定的默认值;否则,引发 KeyError。