データを収集するときには、外れ値や異常値はデータの精度を下げ、問題になると一般的には考えられています。データから法則を作るときも、その法則を覆すような外れ値や異常値は取り除いたデータから、法則を見出すことが重要だと考えられています。
しかし、現実世界は外れ値や異常値だらけです。特にデジタルマーケティングの世界は、外的および内的要因が大きく影響し、状態は常に変動するため、法則を見出すことが非常に困難です。外れ値や異常値を外したデータから法則を見つける、という活動自体が有効にならないケースが多いといえます。
それより、外れ値や異常値を見つけたら、その原因を突き詰めることで、今まで考えつかなかった発見をもたらすことがあります。仮説にはなかった意外な変化から、新たな仮説や法則を発見できることがあります。
problem discovery
When collecting data, outliers and outliers are generally considered to be a problem as they reduce the accuracy of the data. When creating a law from data, it is considered important to find the law from the data by removing outliers and abnormal values that would overturn the law.
However, the real world is full of outliers and anomalies. Especially in the world of digital marketing, external and internal factors have a large influence and conditions are constantly changing, making it extremely difficult to find rules. In many cases, the activity of finding rules from data that excludes outliers and abnormal values is not effective.
Rather, if you find an outlier or abnormal value, investigating the cause may lead to discoveries that you had not thought of before. New hypotheses and laws may be discovered from unexpected changes that were not previously hypothesized.