下列关于强化学习的说法不正确的是APolicybased的强化学习类型要明显优于Valuebased和Actionbased的方法B强化学习中的Agent有明确的目标用于指导自己的行为CAgent的模型参数是根据环境的反馈来更新D强化学习被广泛应用在自动驾驶

  尔雅 智慧树 mooc


+
账户
更新
搜索
帮助
主页