計量的手法② ポアソンの確率分布(ビジネスへの適用)
ポアソンの確率分布をビジネスに適用できないかと考え、議論したことを記載しています。
注)本稿ではポアソンの確率分布を適用しているが、適用時にはかなりの前提が必要になることに注意(次記事参照)
1. Web広告価格の決定支援
インターネット広告事業において、広告クライアントに提示する広告販売価格は該当Webサイトの訪問者数に比例するのだが(他の場合もあるがここはそう仮定する)、当然訪問者数にはバラツキがあるため、実際の訪問者数の平均値よりもだいぶ低めの数値を使って価格を設定している。 ここにポアソンの確率分布を用いれば、広告価格を無駄に引き下げることなく設定できるのでは、と思う。
例えば、 月平均1万人訪れるWebサイトにポアソンの確率分布を適用すると、以下となる。
- 月の訪問者が9900人以下である確率:
16.3%15.9% - 月の訪問者が9800人以下である確率: 2.3%
- 月の訪問者が9700人以下である確率: 0.1%
分母にある「xの階乗」に10000という数字を代入することの危険性を指摘された。そのため、以下を用いて再計算した(これも教えて頂いたのだが・・・)
----------
一般に,ポワソン分布を「(μ^x)e^(-μ)/x!」と書くとき,μが十分大きければ(μ が 1000 以上程度),このポワソン分布は平均μ,標準偏差が√μの正規分布で十分近似できることが知られています.この近似した正規分布をさらに標準正規分布に変換して,数表をみれば,求める確率を得ることができるはずです.
----------
以上から、訪問者数を9700人と仮定して広告価格の設定しておけば99.9%はクライアントの期待を裏切らない、ということになる(実際はもし外れても翌月再掲載などでカバーできるので大きな問題とはならないのだが)。 ただし、上記には市場環境に変化が無いという仮定の元で成り立つので、急成長・縮小している市場には適用する際は別のファクターも検討する必要がある。
上記の適用は要注意(次記事参照)
2. サーバ構成の決定支援
Webサービスを提供する際、サーバ構成において重要となるのがサーバー負荷を決定する同時アクセス数である。一度にどのくらいサーバに負荷がかかるかを試算し、その負荷に耐えうるサーバを用意しておかないと、サービスが停止してしまう事態にもなりうる。
では、例えば、1分あたりの同時アクセス数が平均100くらいだろうと見積もるサービスに対して、どのくらいの同時アクセスを想定してサーバ構成を設計しておけばよいのだろうか。
ポアソンの確率分布を適用すると以下となる。
- 1分間に同時120アクセス以上が起こる確率:2.267%
- 1分間に同時130アクセス以上が起こる確率:0.171%
- 1分間に同時140アクセス以上が起こる確率:
0.00006%0.006%
140アクセス以上同時に起こるのは、1000万分10万分に6回、つまり約3年70日に1回だけ。さすがにここまでのスペックを準備すればいいでしょう、と判断できることになる。うちの会社も何かしらこういう試算を行って判断しているのだろうと信じたい…
ポアソン分布に従うと仮定して本計算を行ったが、実際のアクセス数がこの確率に従わない場合は、そもそもの仮定を見直す必要がある。つまりアクセスが起こる確率pが他の1分間でも同じであるという仮定を疑う必要がある。うーん、実際は難しそうだな。時間帯によって、土日よって、サービスコンテンツの追加などによって変動があるので・・・ご指摘ありがとう
その他、月あたりのクレーム数平均に適用して、サポート人員の設計を行ったりもできそう。いやぁ面白い!(でしょ?)
以下もご参考