TD(λ) + バックプロパゲーション, λ = 0.5, ε グリーディー方策, ε = 0.01, FeedForwardNetwork; input: 192, hidden: 128: output 2, alpha: 0.1