二項分布を説明する前に、ベルヌーイ試行を説明します。
ベルヌーイ試行でよく使われる例として、コインの表がどれくらいの確率で出るかどうかがあります。二項分布は、このベルヌーイ試行を1回あたりの成功確率pとしてn回行った際に成功する確率分布です。コインの表が出る確率が50%だとしたとき、10回投げたときに(1回,2回,…,9回,10回)表が出る確率を表すと二項分布になります。
二項分布を表す統計量は確率になり、結果は期待値となります。確率50%のコインを10回投げたとき、期待値は5回となります。
ウェブ解析で、あるバナーのCTRが0.5%とわかっているときに1,000人ランダムに集客できたとしたら、5人クリックしてくれる率はどの程度かを想定する際に使います。3人しか取れない確率や7人取れる確率が計算できるので、リスク把握をしながら施策を回せます。
ただしこの計算では、CTRが仮定の数字であることを忘れてはいけません。まれにしか起きないことが何度も起きる場合、CTRが間違っているという仮説を立てられます。
binomial distribution
Before explaining the binomial distribution, we will explain the Bernoulli trial.
A commonly used example of Bernoulli trials is determining the probability of a coin coming up heads. The binomial distribution is the probability distribution of success when performing this Bernoulli trial n times, with the probability of success per trial being p. If the probability of a coin coming up heads is 50%, then the probability of getting heads when tossing 10 times (1st, 2nd,…, 9th, 10th) is expressed by the binomial distribution.
The statistic representing the binomial distribution becomes a probability, and the result is an expected value. If you toss a coin 10 times with a probability of 50%, the expected value is 5 times.
This is used to estimate the rate at which 5 people will click on a banner if you can randomly attract 1,000 customers when you know through web analysis that the CTR for a certain banner is 0.5%. You can calculate the probability of only getting 3 people or the probability of getting 7 people, so you can implement measures while understanding the risks.
However, in this calculation, keep in mind that CTR is a hypothetical number. If something that rarely happens happens over and over again, you can hypothesize that your CTR is wrong.