Julgue os itens a seguir, a respeito de inteligência artificial (IA) e machine learning.
Nos algoritmos de aprendizado por reforço, o agente recebe uma recompensa atrasada na próxima etapa de tempo para avaliar sua ação anterior; seu objetivo, então, é maximizar a recompensa.
Certo
Errado