海底探险¶
这个环境是 Atari 环境 的一部分。请先阅读该页面以获取一般信息。
动作空间 |
离散(18) |
观察空间 |
Box(0, 255, (210, 160, 3), uint8) |
导入 |
|
有关具有不同观察和动作空间的更多 Seaquest 变体,请参阅变体部分。
描述¶
你控制一艘能够向各个方向移动并发射鱼雷的潜艇。目标是尽可能多地救出潜水员,同时躲避并击毁敌方潜艇和杀手鲨鱼;相应的分数将会被奖励。游戏开始时有一艘潜艇,地平线上还有三艘待命。每次你的得分增加10,000分,就会有一艘额外的潜艇送到你的基地。你一次只能在屏幕上保留六艘备用潜艇。如果你的潜艇与任何东西(除了你自己的潜水员)相撞,它就会爆炸。潜艇的氧气是有限的,在游戏中以恒定的速率减少。当氧气罐几乎空了时,你需要浮出水面,如果你不及时这样做,你的潜艇就会爆炸,你会失去一个潜水员。每次你被迫浮出水面,且潜水员少于六个时,你也会失去一个潜水员。
如需更详细的文档,请参阅 AtariAge 页面
动作¶
Seaquest 的动作空间为 Discrete(18)
,下表列出了每个动作的含义。由于 Seaquest 使用完整的动作集,因此如果在 gymnasium.make
中传递 full_action_space=True
,则不会修改环境的行为空间。
值 |
意义 |
值 |
意义 |
值 |
意义 |
---|---|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
观察¶
Atari 环境有三种可能的观察类型:"rgb"
、"grayscale"
和 "ram"
。
obs_type="rgb" -> observation_space=Box(0, 255, (210, 160, 3), np.uint8)
obs_type="ram" -> observation_space=Box(0, 255, (128,), np.uint8)
obs_type="grayscale" -> Box(0, 255, (210, 160), np.uint8)
,这是“rgb”类型的灰度版本
请参阅变体部分,了解每个环境ID默认使用的观察类型。
奖励¶
得分是你唯一的奖励。摧毁敌方潜艇和杀手鲨鱼可得20分。每次你带着六名潜水员浮出水面时,敌方潜艇和杀手鲨鱼的价值增加10分,最高可达每项90分。被救起的潜水员初始值为50分。然后,每次你浮出水面时,他们的分数增加50分,最高可达每人1000分。你还会因剩余的氧气获得额外奖励。剩余氧气越多,获得的奖励分数越多。如需更详细的文档,请参阅AtariAge页面。
变体¶
Seaquest 有以下几种环境ID变体,它们在观察、帧跳过次数和重复动作概率方面有所不同。
环境-ID |
obs_type= |
frameskip= |
repeat_action_probability= |
---|---|---|---|
Seaquest-v0 |
|
|
|
Seaquest-ram-v0 |
|
|
|
Seaquest-ramDeterministic-v0 |
|
|
|
Seaquest-ramNoFrameskip-v0 |
|
|
|
SeaquestDeterministic-v0 |
|
|
|
SeaquestNoFrameskip-v0 |
|
|
|
Seaquest-v4 |
|
|
|
Seaquest-ram-v4 |
|
|
|
Seaquest-ramDeterministic-v4 |
|
|
|
Seaquest-ramNoFrameskip-v4 |
|
|
|
SeaquestDeterministic-v4 |
|
|
|
SeaquestNoFrameskip-v4 |
|
|
|
ALE/Seaquest-v5 |
|
|
|
ALE/Seaquest-ram-v5 |
|
|
|
难度和模式¶
可以通过关键字参数 difficulty
和 mode
指定环境的多种风格。风格是游戏模式和难度设置的组合。下表列出了可能的难度和模式值以及默认值。
可用模式 |
默认模式 |
可用难度 |
默认难度 |
---|---|---|---|
|
|
|
|
版本历史¶
关于版本和配置之间复杂差异的详细讨论,可以在关于Atari环境的通用文章中找到。
v5: 粘性功能被重新加入,随机跳帧功能被移除。环境现在位于“ALE”命名空间中。
v4: 动作的粘性已被移除
v0: 初始版本发布