32 lines (21 loc) · 1.07 KB

Deep Reinforcement Learning

Policy gradient methods

Explorations in DRL

Incentivizing Exploration In Reinforcement Learning With Deep Predictive Models

Actor-Critic methods

Connection with other methods

Connecting Generative Adversarial Networks and Actor-Critic Methods

Connecting value and policy methods

Unifying

Multi-step Reinforcement Learning: A Unifying Algorithm

Faster DRL

Neural Episodic Control