個人的に離散型の確率分布で一番重要なのは「二項分布」だと思っているが、二番目に重要なのが「ポアソン分布」だと思っている。
ポアソン分布に従う確率変数\( X \)の取り得る値は0以上の整数だから、カウントデータ(アイスが何個売れたか等)を表すのに最も適している。
カウントデータを正規分布に従う確率変数で表すと、例えば-3個などのマイナスの実現値に対応する確率密度の値がよく分からないものになるし、1.5個などの非整数値に対応する確率密度の意味もよく分からない。
その点、ポアソン分布ならば負の値を取らないし、非整数値も取らない。
カウントデータを表すのに適した確率分布と言える。
コメント