読者です 読者をやめる 読者になる 読者になる

神野さんに言われました。

AIの勉強をしています @sesenosannko

Model-basedの強化学習について学ぶ

前回の記事で紹介したDavid Silverのスライドの後半の部分で、model-based RLという話が出ていました。 僕は聞いたことがなかったので、model-based RLについて少し調べてみたいと思います。 sesenosannko.hatenablog.com ちょうど良さそうな資料があったの…

Google DeepMindの深層強化学習についての記事を読む

深層強化学習について調べていたら、DeepMindのDavid SilverがICLR 2015で使用した資料(多分)を見つけました。非常に参考になったので少しまとめておきたいと思います。http://www0.cs.ucl.ac.uk/staff/d.silver/web/Resources_files/deep_rl.pdfまぁ前半…

深層強化学習について理解する③マルコフ決定過程

続きですsesenosannko.hatenablog.com

深層強化学習について理解する②(補記)確率の基礎知識(確率空間)

「深層強化学習について理解する②マルコフ決定過程のその前に」がぐちゃぐちゃになったので、脇道について記事をわけました。 sesenosannko.hatenablog.com 確率空間とは。 以下[1]よりです。 最初に用語を定義しましょう。 標本空間 確率が定義されるための…

深層強化学習について理解する②マルコフ決定過程のその前に

続きです。sesenosannko.hatenablog.com マルコフ性っていうのは嫌っていうくらい聞く言葉ですよね。確認という意味で、マルコフ性から一つ一つ書いていきます。 マルコフ決定過程のその前に、という名前通り今回はマルコフ決定過程に達しません。 書いてた…

深層強化学習について理解する①強化学習

サークルのメンバーに「深層強化学習による東方AI」という同人誌を貸してもらいました 第13回 博麗神社例大祭で頒布した『深層強化学習による東方AI』のダウンロード版をBooth https://t.co/ZysBlu7LY4 およびGumroad https://t.co/HtgRa44sr6 にて販売して…