yomitech
Qiitaで紹介された技術書を、毎週月曜日にメールでお届けします。
登録確認メールをお送りします。いつでも配信停止できます。
バックナンバー
「強化学習アルゴリズム入門」の検索結果: 1冊
強化学習アルゴリズム入門
「平均」の観点から強化学習の原理がわかる! AlphaGoがプロ棋士を破った2016年以降、さまざまな分野から注目されている深層強化学習ですが、専門書は非常に難解でわかりづらい傾向にあります。 そこで本書は、初歩的な数学を使って原理をわかりやすく解説します。価値・探索・マルコフ決定過程・動的計画法・モンテカルロ法・TD法といった強化学習の諸要素を、中高生にもなじみ深い平均値の計算から説明し、...
Awesome Backgammon AI
バックギャモン AI 開発で調べたことをまとめるページ。 TD-Gammon 実装 - Implementing TD-Gammon with Keras ( 2021年 - レポジトリ( - Before AlphaGo there was TD-Gammon(