yomitech

yomitech

Qiitaで紹介された技術書を、毎週月曜日にメールでお届けします。

登録確認メールをお送りします。いつでも配信停止できます。

バックナンバー

「強化学習アルゴリズム入門」の検索結果: 1冊

強化学習アルゴリズム入門の表紙

強化学習アルゴリズム入門

曽我部 東馬 ・オーム社

「平均」の観点から強化学習の原理がわかる! AlphaGoがプロ棋士を破った2016年以降、さまざまな分野から注目されている深層強化学習ですが、専門書は非常に難解でわかりづらい傾向にあります。 そこで本書は、初歩的な数学を使って原理をわかりやすく解説します。価値・探索・マルコフ決定過程・動的計画法・モンテカルロ法・TD法といった強化学習の諸要素を、中高生にもなじみ深い平均値の計算から説明し、...

Awesome Backgammon AI

バックギャモン AI 開発で調べたことをまとめるページ。 TD-Gammon 実装 - Implementing TD-Gammon with Keras ( 2021年 - レポジトリ( - Before AlphaGo there was TD-Gammon(

yomitechをシェア

X LINE Facebook はてブ