Disciplinas

Ensino e materiais

Aprendizado por Reforço

Pós-graduação · 2026/2

Fundamentos de processos de decisão de Markov, métodos tabulares, aproximação de função, DQN, policy gradient, actor-critic e aplicações em controle.