Aprendizado por Reforço
Pós-graduação · 2026/2
Fundamentos de processos de decisão de Markov, métodos tabulares, aproximação de função, DQN, policy gradient, actor-critic e aplicações em controle.
Disciplinas
Pós-graduação · 2026/2
Fundamentos de processos de decisão de Markov, métodos tabulares, aproximação de função, DQN, policy gradient, actor-critic e aplicações em controle.