神野さんに言われました。

神野さんに言われました。

AIの勉強をしています @sesenosannko

深層強化学習について理解する②(補記)確率の基礎知識(確率空間)

「深層強化学習について理解する②マルコフ決定過程のその前に」がぐちゃぐちゃになったので、脇道について記事をわけました。


sesenosannko.hatenablog.com


確率空間とは。
以下[1]よりです。
最初に用語を定義しましょう。

  • 標本空間

確率が定義されるための試行の全集合 \Omega
試行のことを「標本点」と呼ぶこともあるらしい
 \Omegaの部分集合が「事象」となる。

コイン投げを二回行い、表裏を観測する場合の標本空間は
 \Omega = \{表表、表裏、裏表、裏裏\}

事象のあつまりのこと。 R

コイン投げを二回行い、表裏を観測する場合の事象の族は
 R = \{表表、表裏、裏表、裏裏、1回目表、1回目裏、2回目表、2回目裏、\Omega \}

ちょっとよく分からないですね。
 Rの任意の二つの事象の和集合や積集合も Rに属するという条件があるそうです。
これを事象の族は集合演算によって閉じている、という表現をするようです。
つまり、{1回目表、1回目裏、2回目表、2回目裏}というのが事象として考えられますが、これを事象とした瞬間に{表表、表裏、裏表、裏裏}が Rに入るということはわかります。
 \Omegaについてはどう考えればいいんでしょうか。

[2]によると \Omegaが有限集合のときは \Omegaの全ての部分集合の確率が測れるとしても問題がないそうです。
つまり、コイン投げを二回行う場合について、 2^6 = 16個の集合を含む集合族とのことです。
{表表、表裏}とか{表裏、裏表、裏裏}も含む集合族ということですね。
ちなみに、族というのは集合の集まりを表現しているだけらしいです。

[1]は \Omegaに{表表、表裏}とか{表表、表裏、裏表}とかも含まれてる(もしくは省略している?)ということなのかな?
正直、コイツの存在意義はよくわかりませんでした。
もう少し確率の基礎的なところを勉強してわかったら追記します・・・

まぁ確率はわかると思います。

コイン投げを二回行い、表裏を観測する場合の事象の確率 Pはそれぞれ
(0, 1/4, 1/4, 1/4, 1/4, 1/2, 1/2, 1/2, 1/2, 1)
となりますね。
ここでもやはり{表表、表裏、裏表}とかは省略されていますが、
 P\left( \{{表表、表裏、裏表}\} \right) = 3/4
となりますね。
これも含んだ 2^6 = 16と0を含んだのが集合が事象の確率ということでいいと思います。

ただ、[2]ではこれを確率測度PとしていてRの元(測れる集合,事象)を入れたら0以上1以下の値を返してくれる関数としています。
まぁ、その結果の集合が事象の確率ということにできるので、有限集合ではそれほど意味は変わらないのかな。
無限集合では必然的に[2]の定義になってしまうと思いますが。


さて、やっと用語が揃いました。
ここで確率空間とは、標本空間 \Omega事象の族 R事象の確率 Pの三つ組 \left( \Omega, R, P \right)のことです。これによって確率が定義されます。


[1]
Amazon CAPTCHA

[2]
mathtrain.jp