二項分布の使い方(具体例で解説)

二項分布の使い方 数学

この記事では「二項分布」について、その有用性を2つの具体例を用いて紹介したいと思います。

この記事の解説に間違いや、分かりにくい点があれば、コメントで教えて頂けると幸いです。

二項分布の基礎知識

二項分布」は確率分布の1つです。確率分布には、離散型分布連続型分布がありますが、二項分布は離散型確率分布です。

二項分布は、確率pで成功、確率1-pで失敗する、2つの結果しか出ない試行(これをベルヌーイ試行と呼ぶ)をn回繰り返した時に、成功する回数Xが従う確率分布である。

確率変数Xが試行回数n成功確率pの二項分布に従うことを以下のように書く。

$$
X \sim Bin(n,p)
$$

試行回数n成功確率pの二項分布に従う確率変数Xの実現値は0〜nまでの整数である。下限が0である点と、上限がnで定まっている点が重要である。

0以上の整数値を取るので、カウントデータ(何かの回数を記録したデータ)をモデル化するのに使えるが、同様に0以上の整数値を取り、カウントデータのモデル化に使えるポアソン分布と比較すると、ポアソン分布には上限が無いので、上限がないカウントデータのモデル化にはポアソン分布、上限があるカウントデータのモデル化には二項分布を使うと良い。

二項分布の確率関数

二項分布Bin(n, p)の確率関数は以下のようになる。Xを二項分布Bin(n, p)に従う確率変数として

$$
P(X=x) = {}_n \mathrm{C}_x p^x (1-p)^{n-x}
$$

$$
(x=0,1,2, \ldots, n)
$$

n回の試行のうちx回成功する確率P(X=x)は、x回成功し、n-x回失敗する確率\( p^x(1-p)^{n-x} \)を、その組み合わせの数\( {}_n \mathrm{C}_x \)だけ足したものである。

※ 組み合わせCについては高校数学のテキストを参照してください。

具体例1(営業件数と成約数)

ここから「二項分布」という知識が日常で役立つことを2つの具体例で紹介したいと思います。

まず1つ目は「営業件数と成約数」です。

営業件数をn、成約率(成約数ではない)をpとすると、その日の成約数Xは二項分布Bin(n, p)に従います。

よって、仮に営業件数が10件(n=10)、成約率が30%(p=0.30)とすると、以下のように成約数Xの確率分布が計算できます。

この表を見れば、成約数が3になる確率が26.7%みたいなことが分かります。

※ この表はスプレッドシートで作っています。二項分布の計算はBINOMDIST関数を使うと出来ます。この表では一番上の2.8%のセルに「=BINOMDIST(C6,$D$2,$D$3,false)」と入力し、下にオートフィルしています。

1日に1件以上成約する確率の計算も簡単で、1 – P(X=0)と余事象の確率を計算するだけです。
この場合、1 – 0.028 = 0.972となり、1件以上成約する確率は97.2%と計算できます。

1日におおよそ何件成約するかの確率が二項分布を使うと丸わかりになります。

具体例2(商品リンクのクリック数と注文数)

例えば、あるブログで商品リンクのクリックされる回数が20回で、そのうち注文される割合がp=0.1(10%)だとします。(クリックに対する注文数の割合をコンバージョン率と言い、実際は3%程度です)

この場合、ある日の注文数Xは二項分布Bin(20, 0.1)に従います。

先ほどと同様にスプレッドシートで計算すると以下のようになります。

注文数Xが2になる確率P(X=2)が28.5%と一番高いことが分かります。

まとめ

このように二項分布を使うと、ビジネスに関する確率を簡単に計算出来たりします。

もちろん、ビジネスだけに限らないのですが、二項分布のような思考のための道具をいつでも使えるようにしておくと、良い判断がしやすくなると思います。

コメント

タイトルとURLをコピーしました