Q-learning - Document - PDFSEARCH.IO - Document Search Engine

First Page		Document Content
Date: 2011-12-02 21:34:52 Multi-armed bandit Stochastic optimization Reinforcement learning SARSA Normal distribution Temporal difference learning Q-learning Statistics Computational neuroscience Machine learning		Add to Reading List Source URL: www.tokic.com Download Document from Source Website File Size: 426,05 KB Share Document on Facebook

	REINFORCEMENT LEARNING FOR LIVE MUSICAL AGENTS Nick Collins University of Sussex ABSTRACT Current research programmes in computer music may DocID: 1q53K - View Document
	Experiments with SARSA Eric B Baum Dennis Horte Chick Markley Azure Sky Research Inc DocID: 1m1N0 - View Document
	Frequency Adjusted Multi-agent Q-learning Michael Kaisers and Karl Tuyls Maastricht University Maastricht, The Netherlands {michael.kaisers, k.tuyls} @maastrichtuniversity.nl DocID: 19XZj - View Document
	Playing Atari with Deep Reinforcement Learning Volodymyr Mnih Koray Kavukcuoglu DocID: 19Byv - View Document
	Multi-Agent, Reward Shaping for RoboCup KeepAway (Extended Abstract) Sam Devlin Marek Grze´s DocID: 15DqP - View Document