ray.rllib.policy.policy.Policy.get_session#

Policy.get_session() tensorflow.compat.v1.Session | None[源代码]#

返回用于计算动作的 tf.Session 对象,或返回 None。

注意:此方法仅适用于 TFPolicy 子类。所有其他子类应预期从此方法返回 None。

返回:

用于计算此策略的动作和损失的 tf Session,或为 None。