pinesの日記

気ままに書くブログです

強化学習

強化学習2日目

昨日の振り返り 倒立振り子課題を強化学習で実装してみる ローカルの環境構築メモ 連続値の状態を表形式表現するには? Q学習で実装 昨日の振り返り ・強化学習のやり方には方策反復法と価値反復法がある ・方策反復法は結果から動き方を変え、価値反復法は…

強化学習1日目

強化学習ってなに 強化学習とは 状態の縮約表現 深層学習の導入 強化学習ってなに 強化学習とは ある動作に対して望ましい結果を得られた場合、報酬を与えることでその動作を強化していく学習方法のこと →時間変化を伴う場合でも最適な制御方法を取得できる …