关注过人工智能发展的同学应该听说过DeepMind发明了一个让机器自己学会玩Atari2600游戏的算法——[Human-level control through deep reinforcement learning]。
我们家魔兽怎么就没人关注呢?肯定是WoW is too hard,任发Nature的大牛也做不出来效果吧偷笑
出于好奇,我把残暴赫娅做成了一个小游戏,实现到了Gym环境里。小游戏需要你控制五个玩家的移动,来完成对赫娅的击杀。
为了化简问题,输出循环都被去掉了,只要在可以输出的范围伤害是自动打的,近战要在Boss身边,然后法师和治疗牧师如果移动会降低伤害和治疗能力。
游戏的得分就是Boss掉的血。
不过这个游戏并不是给你玩的啦,是让机器玩的。有了Gym环境,你就可以套用各种强化学习算法来训练出一个玩这个游戏的AI。
比如[ https://arxiv.org/abs/1509.02971
此网页不属于本网站,不保证其安全性
继续访问       取消
Continuous control with deep reinforcement learning]介绍的DDPG算法就可以套用上来。
env = gym.make("Hyrja-v0")
observation = env.reset()
for _ in range(15000):
env.render()
action = env.action_space.sample() # your agent here (this takes random actions)
observation, reward, done, info = env.step(action)
if done:
env.reset()