Reinforcement Learning im Cournot Duopol pocketTyska, 2007