使用Q学习的Python实现强化学习算法
添加时间:2020-10-22 09:50:16
来源:
强化学习是一种机器学习范式,其中的学习算法不是基于预设数据而是基于反馈系统进行训练的。这些算法被吹捧为机器学习的未来,因为它们消除了收集和清理数据的成本。
在本文中,我们将演示如何实现一种称为Q学习技术的基本强化学习算法。在此演示中,我们尝试使用Q-Learning技术教导机器人到达目的地。
因例子涉及代码,无法显示,请在线咨询
上面的例子是一个非常基础的例子,许多实际的例子,如“自驾车”都涉及博弈论的概念。