ray.rllib.policy.torch_policy_v2.TorchPolicyV2.make_model_and_action_dist#

TorchPolicyV2.make_model_and_action_dist() Tuple[ModelV2, Type[TorchDistributionWrapper]][源代码]#

创建模型和动作分布函数。

返回:

ModelV2 模型。ActionDistribution 类。