PRML1.24~1.26(確率密度) – PRMLで出てくる数式を掘り下げる

機械学習

本シリーズの一覧はこちら
前回はこちら

確率密度

さて、前回までは離散型確率分布について見てきましが、
ここからは連続型確率分布について見ていきます。

こちらが確率分布の式です。

$$ p(x \in (a,b)) = \int_a^bp(x)dx \tag{1.24} $$

なんかいきなりむずい。

まず左辺ですが、\( \in \)は帰属関係を表します。
言い換えると\( p(a\leq x\leq b) \)ということで、区間ab間にxが存在する確率ということになります。

右辺は定積分ですね。
xは連続的な分布であるため、「x=1である確率」を求めるのではなく、
上記のように「\( a\leq x\leq b \)である確率」を求めていきます。

\( xとx+\delta x(\delta x \rightarrow 0) \)間という微小な間にxが存在する確率を\( p(x)\delta x \)とした場合、p(x)を確率密度といいます。

決まりごととして、確率は負の値であってはならないので

$$ p(x) \geq 0 \tag{1.25} $$

また、xは実数上のどこかの値を取らなければならず、p(x)の総和は1であるため、

$$ \int_\infty^\infty p(x)dx = 1 \tag{1.26} $$

となります。

コメント

タイトルとURLをコピーしました