相関と因果のエラー


統計分析やデータマイニングという便利な道具も、迂闊な使い方をすると大きな間違いを引き起こす可能性がある。


身も蓋もない言い方をすれば世の中のすべては繋がっているのであるが、その中でもより『関係性の強いAとBとCはなにか?』的な『相関と因果の網の目』を見つけ出すことが、データ解析の中心となることが多い。


「見えない物が見えてくる」ことの多くは、この「関係性の発見」に基づいているのだが、そこで本来は無関係な物に「誤った関係性」を見いだしてしまうこともあるだろう。

それをきちんと防がなければ、「存在しない因果関係」に振り回されて、むしろ、なにも考えない方が良かった、という結果にさえなりかねない。


人間の認識力では、「単なる相関を因果関係だと思い込む」などの誤った関係性を見つけ出す可能性が高いので、その篩い分けの手法が分析結果の良否を左右すると言うこともできる。



中でも、とても簡単なエラーは、単に傾向が似ているだけのグラフに勝手な意味を見いだして関連付ける発想だ。


例えば、20世紀の人口の増加と食料生産の増加は関連があるだろう。

人口が増えたから必要な食料が増産されたし、食料生産性の向上で個人の栄養状態が改善したから人口を増加させることができた。(もちろんそれだけではないが)


だが仮に誰かが、肉食率の増加と犯罪発生率の増加を並べたグラフを持ち出してきて、「この両者には因果関係がある。肉食傾向が犯罪精神を助長しているのだ!」と主張したとする。


これが事実であれば、肉好きな私にとって大変困った事態であるが、恐らく実際は、単に人口密度が高まって都市の犯罪率が増加したことと、経済的なゆとりが増えて肉食傾向が強まったことが「同時に発生」しているだけだろう。

そもそも肉食率の増加は経済的余裕の増大に基づく物であり、その経済的余裕から発生する「増加したもの」は肉の摂取量に限らず、ありとあらゆる分野にわたるはずだ。

むしろ、犯罪率の増加を生み出した要因としては、肉食の増加を生み出した経済的余裕の増加から発生した「格差の増大」に目を向けた方が納得できる。


だから、もしも肉食傾向が犯罪精神を助長すると考えるのなら、二つのグラフを並べて結論にするのではなく、「食事の内容が精神状態にどんな影響を与えるのか?」を詳しく調査しなければならない。


もちろん、「犯罪率の増加」を生み出した原因が何かは存在はする。

それが人口密度なのか、法制度なのか、文化的変容なのか、etc. etc. ...本当の原因がどれであるかを確定するためには、詳細な分析を重ねた傍証が必要だ。


むしろ、ほとんどの人は「数字そのもの」を生で解釈できないので、グラフにする『必要』があるとも言える。


グラフにして視覚的にインプットしなければ傾向を理解できないということだが、今度は、グラフは大抵二次元の図形(最近は3Dモデルも使いやすくなってきたが)として描かれるので、その『視点』はそのグラフを作成した人物が選んだフォーカスに固定されてしまう。

うがった見方をすれば、少なくとも紙にプリントしたグラフは、「発見のための素材」というよりも「説得のための制作物」である場合がほとんどだ。


なんであれ、「グラフの相似」は証拠ではない。


だが、それを取り違えたり、(意図的にかも知れないが)省略してしまう人は多い。



また、良くある統計的な誤解だが、ある時期を境にして急に特定の犯罪行為が増加したように思えるのは、単にそれが社会的に注目されたり、犯罪と見なす「閾値が下がった」ことによって報告される件数が増えただけ、というものがある。


つまり、これまでは存在していてもスルーされていた物が、新たにカウントされるようになっただけだった、というパターンで、事象の「発生」と事象の「認識」がイコールであると思い込んでしまうことから生まれるエラーだ。


というわけで、単に「グラフの形が似ている」とか「急に増えたように思える」というだけで因果関係があると決めつけてしまうと、結果として酷い目にあうか、あるいは他者に酷い影響を与えてしまう。

そうでなくても、犯罪率の増加と相似する上昇率を見せる要因など、ちょっと数字をいじれば容易に生み出せるだろう。


統計分析は、多くの人が思っているよりも恣意的に「印象を操作」することができるものなので注意が必要だと思う。


人間の情報分析力は、たいていの人が自分で思っているよりも_ずっとずっと_低いのだから。


 - - - - - - - - - - - - - - - - - - - - - - - - 


< 人々が「相関と因果を取り違えている」ケースは、驚くほど多い。これは、本能的に『パターンを見つけ出そうとする』人間の認識力が悪い方へ影響している例だと思う。この点では、AIによる分析は(設定さえ間違わなければ)冷静かつ公平だと言える。>


< 「相関と因果の網の目」と書いたが、因果関係はまさに無数の節点で繋げられた網の目のように、三次元的な構造を持っている。事象は基本的には時系列に沿って発生し、波及していくのだが、フィードバックループを形成することも多い。>

  • Twitterで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る