玩具文本

玩具文本环境设计得非常简单,具有小的离散状态和动作空间,因此易于学习。因此,它们适合用于调试强化学习算法的实现。

环境可以通过每个环境文档中指定的参数进行配置。