まず「確率変数」について説明しよう。
サイコロの例がスタンダードだが、どの目も当確率で出るのでちょっと面白くない。
そこで1等(100万円)、2等(1万円)、3等(100円)、4等(はずれ、0円)の宝くじを考える。
ここで何等が出るかを、確率変数Xとすると、確率変数Xの取りうる値(これを実現値という)は1 or 2 or 3 or 4だ。
(豆知識1:確率変数はアルファベットの大文字、特にX、Y、Zなどで表されることが多い。複数の確率変数を扱う文脈では\( X_1, X_2 \)のように下付き文字を付けていく。またZについては平均0、分散1に標準化された確率変数を表す場合が多いが、必ずしも確率変数Zが標準化された確率変数であるという訳ではない。そう使用される場合が多いだけ。)
普通の変数xなどの場合、仮に1~10までの自然数しか取らないとしても、1~10のどの数字を取りやすいかについては考えない。実現値のどの値を取りやすいか、それを確率で表した変数が確率変数である。
実現値のどの値を取りやすいか、それを確率で表したものが下のような表である。
実現値x | 1 | 2 | 3 | 4 |
実現値xを取る確率 P(X=x) | 1/100 | 3/100 | 20/100 | 76/100 |
(豆知識2:確率変数の実現値はアルファベットの小文字で表されることが多い。確率変数Xの実現値はx、確率変数Yの実現値はyなど)
確率変数Xが実現値\( x \)を取る確率は、記号で下のように書かれる。
$$
P(X = x)
$$
同じことを表す表記で、稀に下のような書き方も見かける。PrはProbability(確率)の略。
$$
Pr(X = x)
$$
実現値\( x \)を具体的な数に置き換えて、例えば確率変数Xが実現値4を取る確率が76/100であることを次のように表す。
$$
P(X=4) = \frac{76}{100}
$$
統計学のオススメの本
↑この本はとっかかり易いので、入門にオススメ。
↑通称「赤本」と呼ばれている有名な本。本格的に学ぶのにオススメ。
コメント