W3Cschool
恭喜您成为首批注册用户
获得88经验值奖励
在本章中,您将详细学习使用 Python 进行 AI 强化学习的概念。
这种类型的学习被用来加强或加强基于评论者信息的网络。 也就是说,在强化学习下训练的网络从环境中获得一些反馈。 但是,反馈是评价性的,并且不像监督式学习的情况那样具有启发性。 基于这种反馈,网络将对权重进行调整以获得更好的评论信息。
这个学习过程类似于监督学习,但我们可能拥有的信息非常少。 下图给出了强化学习的框图 -
Copyright©2021 w3cschool编程狮|闽ICP备15016281号-3|闽公网安备35020302033924号
违法和不良信息举报电话:173-0602-2364|举报邮箱:[email protected]
扫描二维码
下载编程狮App
编程狮公众号
联系方式:
更多建议: