首页 试题详情
判断题

强化学习的目标是希望个体从环境中获得的总奖励最小

A正确

B错误

正确答案:A (备注:此答案有误)

相似试题

  • 判断题

    强化学习目标希望个体环境获得奖励最小

    答案解析

  • 判断题

    强化学习基本模型就是个体-环境交互。个体/智能体(agent)就是能够采取一系列行动并且期望获得较高收益或者达到某一目标部分,

    答案解析

  • 单选题

    个体倾向于确立表现目标希望学习证明自己高能或避免表现低能属于( )

    答案解析

  • 单选题

    强化学习在每个时刻环境个体都会产生相应交互。个体可以采取一定(),这样行动施加在环境中的。

    答案解析

  • 判断题

    强化学习最终目标不是短期某一步行动之后获得最大奖励,而是希望长期地获得更多奖励。

    答案解析

热门题库