強化学習

強化学習2日目

強化学習

昨日の振り返り倒立振り子課題を強化学習で実装してみるローカルの環境構築メモ連続値の状態を表形式表現するには？ Q学習で実装昨日の振り返り・強化学習のやり方には方策反復法と価値反復法がある・方策反復法は結果から動き方を変え、価値反復法は…

強化学習

強化学習ってなに強化学習とは状態の縮約表現深層学習の導入強化学習ってなに強化学習とはある動作に対して望ましい結果を得られた場合、報酬を与えることでその動作を強化していく学習方法のこと →時間変化を伴う場合でも最適な制御方法を取得できる …