pinesの日記

気ままに書くブログです

強化学習1日目

強化学習ってなに

強化学習とは

ある動作に対して望ましい結果を得られた場合、報酬を与えることでその動作を強化していく学習方法のこと

→時間変化を伴う場合でも最適な制御方法を取得できる

ニューロンレベルで脳の学習メカニズムと似ているため、ディープラーニング(深層学習)と相性〇

状態の縮約表現

状態:ある時刻での制御対象の様子

縮約表現:状態から重要な情報だけを取り出したもの→ロボットなど状態が連続するものはこの表現がやりにくい

では、どうするか

深層学習の導入

DNNは、多くの隠れ層を有することで画像データなどの複雑な入力データの状態の縮約が容易にできる →深層強化学習で状態の縮約を達成でき、学習可能になった