下列说法错误的是A强化学习与监督学习没有区别B强化学习认为,计算机单纯通过感知环境,与环境交互,并且从交互中获得评价反馈,就可以适应所处的环境C强化学习的整个过程形成一个“闭环”D与无监督学习相比,强化学习中环境所提供的“奖励”实际上就是监督信号

  尔雅 智慧树 mooc


+
账户
更新
搜索
帮助
主页