強化学習1日目
強化学習ってなに
強化学習とは
ある動作に対して望ましい結果を得られた場合、報酬を与えることでその動作を強化していく学習方法のこと
→時間変化を伴う場合でも最適な制御方法を取得できる
ニューロンレベルで脳の学習メカニズムと似ているため、ディープラーニング(深層学習)と相性〇
状態の縮約表現
状態:ある時刻での制御対象の様子
縮約表現:状態から重要な情報だけを取り出したもの→ロボットなど状態が連続するものはこの表現がやりにくい
では、どうするか
深層学習の導入
DNNは、多くの隠れ層を有することで画像データなどの複雑な入力データの状態の縮約が容易にできる →深層強化学習で状態の縮約を達成でき、学習可能になった