Toggle site navigation sidebar

Gymnasium Documentation

Farama Foundation

Hide navigation sidebar

Hide table of contents sidebar

Gymnasium Documentation

介绍

基本用法
训练一个代理
创建自定义环境
记录代理
加速训练
与 Gym 的兼容性
迁移指南 - v0.21 到 v1.0.0

API

环境
制作与注册
空格
Toggle navigation of 空格
包装器
Toggle navigation of 包装器
矢量化
Toggle navigation of 矢量化
实用函数
功能环境

环境

经典控制
Toggle navigation of 经典控制
Box2D
Toggle navigation of Box2D
玩具文本
Toggle navigation of 玩具文本
MuJoCo
Toggle navigation of MuJoCo
雅达利
Toggle navigation of 雅达利
- 冒险
- AirRaid
- 外星人
- Amidar
- 袭击
- Asterix
- 小行星
- 亚特兰蒂斯
- 亚特兰蒂斯2
- 西洋双陆棋
- 银行抢劫
- 基本数学
- BattleZone
- BeamRider
- 狂暴
- 二十一点
- 保龄球
- 拳击
- 突破
- 嘉年华
- 赌场
- 蜈蚣
- ChopperCommand
- 疯狂攀岩者
- 弩
- 暗室
- 防御者
- 恶魔攻击
- DonkeyKong
- DoubleDunk
- 地球世界
- ElevatorAction
- Enduro
- 埋葬
- 和
- 钓鱼大赛
- FlagCapture
- 高速公路
- 青蛙过河
- 霜冻
- Galaxian
- Gopher
- Gravitar
- Hangman
- 闹鬼的房子
- 英雄
- HumanCannonball
- 冰球
- 詹姆斯·邦德
- JourneyEscape
- 爆炸
- 袋鼠
- KeystoneKapers
- 金刚
- Klax
- Koolaid
- 克鲁尔
- 功夫大师
- LaserGates
- LostLuggage
- 马里奥兄弟
- 迷你高尔夫
- 蒙特祖玛的复仇
- MrDo
- 吃豆小姐
- 命名这个游戏
- 奥赛罗
- Pacman
- 凤凰
- 陷阱
- 陷阱2
- Pong
- 波扬
- PrivateEye
- Qbert
- Riverraid
- RoadRunner
- Robotank
- 海底探险
- 兰斯洛特爵士
- 滑雪
- Solaris
- 太空入侵者
- 太空大战
- 星际枪手
- 超人
- 环绕
- 网球
- 俄罗斯方块
- TicTacToe3D
- 时间飞行员
- Trondead
- 动荡
- 图坦卡蒙
- UpNDown
- 冒险
- 视频检查器
- VideoChess
- VideoCube
- 视频弹球
- WizardOfWor
- WordZapper
- YarsRevenge
- Zaxxon
外部环境

教程

Gymnasium 基础
Toggle navigation of Gymnasium 基础
训练代理
Toggle navigation of 训练代理
第三方教程
彗星教程

开发

Github
Gymnasium 发布说明
Gym 发布说明
贡献文档

Toggle table of contents sidebar

玩具文本¶

玩具文本环境设计得非常简单，具有小的离散状态和动作空间，因此易于学习。因此，它们适合用于调试强化学习算法的实现。

环境可以通过每个环境文档中指定的参数进行配置。

Copyright © 2023 Farama Foundation