Follow @data_no_memo

メモ

個人的なメモです。他者にわかりやすく書くよりも未来の自分にわかりやすく書いています。なお、記事内容の正確さは保証できません。勉強中の身ですので、間違い等ご指摘頂けたら幸いです。

ポワソン分布

ポワソン分布は、1単位時間あたり平均λ回生じるこ事象が、ある期間にちょうどk回生じる確率の分布である。

 

例えば、ある売店で1日あたり平均5(=λ)本の水が売れるとした場合、1ヶ月間(30日間)でちょうどk個売れる確率の分布はポワソン分布に従うと仮定できる。

なお、その定義式は以下の通り。

  

実際に、λ=5として100万個の乱数を発生させ、ヒストグラムを描いたのが以下の図。

f:id:abcxyzonetwothree:20181008094240p:plain

 なお、コードは以下の通り。


set.seed(1234)
n<-1000000
lamda<-5
k<-rpois(n,lamda)

library(ggplot2)
g<-ggplot()+geom_histogram(mapping=aes(x=k),binwidth = 0.5)
print(g)

 

また、λ=5のとき、k=1~k=15までとなる確率を求めると、以下の表の通りになる。

 

k

probability

1

0.0336897350

2

0.0842243375

3

0.1403738958

4

0.1754673698

5

0.1754673698

6

0.1462228081

7

0.1044448630

8

0.0652780393

9

0.0362655774

10

0.0181327887

11

0.0082421767

12

0.0034342403

13

0.0013208616

14

0.0004717363

15

0.0001572454

 

これをみると、上記の例で(他の条件は一定のもと)次の日に5個売れる確率はおおよそ17.5%となることがわかる。

 

なお、この確率を求めたコードは以下の通り。 


rec<-numeric(15)
for(i in 1:15){
  rec[i]<-dpois(i,lamda)
}
data<-data.frame(cbind(1:15,rec))