pinesの日記

気ままに書くブログです

2021-07-01から1ヶ月間の記事一覧

強化学習2日目

昨日の振り返り 倒立振り子課題を強化学習で実装してみる ローカルの環境構築メモ 連続値の状態を表形式表現するには? Q学習で実装 昨日の振り返り ・強化学習のやり方には方策反復法と価値反復法がある ・方策反復法は結果から動き方を変え、価値反復法は…

応用情報技術者試験1日目

目標 10/10の試験に合格する 勉強法 目標 10/10の試験に合格する 勉強法 ・7月:1日1章ずつ参考書を読んで、何が得意で何が分かりにくいかをつかむ ・8月:サイトで問題を解く ・9月:過去問演習(直近10年分、かつここ2年分は除く) ・10月:進捗を優先させつつ調…

強化学習1日目

強化学習ってなに 強化学習とは 状態の縮約表現 深層学習の導入 強化学習ってなに 強化学習とは ある動作に対して望ましい結果を得られた場合、報酬を与えることでその動作を強化していく学習方法のこと →時間変化を伴う場合でも最適な制御方法を取得できる …