ray.rllib.core.rl_模块.多_rl_模块.MultiRLModule.输入规格_训练# MultiRLModule.input_specs_train() → List[str | Tuple[str, ...]]# 返回 forward_train 方法的输入规格。