
End-Cretaceous Tsunami Deposit and K-Pg Boundary
National Museum of Nature and Science, Tokyo
Leica M10P, 1.4/50 Summilux ASPH, RAW
先日、僕の研究会と共同研究している企業の方が、学生の発表を聞いてこう言った。
「相関ばかり出てくるが、因果の視点が足りないのではないか」
そのとき僕はこう答えた。
「いまやろうとしているのは、『顧客体験の質』*1そのものをデータから定義することです。定義できれば、条件による差分として因果は自然に見えるようになります」
-
多くの人は、「因果こそが科学だ」と考えている。論理的に考えるとは、原因と結果をつなぐことだ、と。
しかしこの姿勢には、少しリスクがある。
確かに、ライフサイエンスのように条件を厳密に制御し、薬剤の有無や濃度、遺伝子の有無による差を大量に比較する領域では、因果の推定は重要だ。RCT(ランダム化比較試験)や、いわゆるABテストのような設計をしなければ、大きなことは言えない。
だがそれは、サイエンスの「一部」にすぎない。
物理学における力は、質量と加速度の積として定義される。
そこに「原因」という言葉は登場しない。
自然法則の多くは、出来事同士の関数関係、すなわち強い相関の構造として書き下されている。
実際、バートランド・ラッセルは1913年の論文 "On the Notion of Cause" で、科学から「因果」という言葉を取り除くべきだと述べた*2。自然法則とは出来事の恒常的な連関の記述であって、「原因」という形而上学的概念は余計だ、と。
データから数学的モデルを作るとき、本当に必要なのは「強い相関」であって、因果ではない。予測に必要なのは、入力と出力の安定した対応関係、すなわち相関構造だ。モデルとは、その対応関係を数式で表したものであり、予測とは、それを用いて未来を計算することだ。相関を精緻に捉えられなければ、因果を議論する土台すら立たない。
機械学習も同じである。深層学習も、巨大な相関構造の抽出にすぎない。そこに「因果」は明示的には存在しない。
しかし、それで十分に強い力を持つ。
むしろ、因果にこだわりすぎると、逆に何も生み出せないことがある。厳密なRCTを組まないと何も言えない、という思考に閉じてしまうからだ。条件を完全に制御できない現実世界では、その瞬間に議論は止まる。
このデータとAIが社会を大きく動かす時代において、我々の思考はまだ十分にアップデートされていないのではないか。
「因果を示せ」と求めるのは、ある意味で安全だ。しかしそれは、問いを前に進める態度とは限らない。その前に問うべきことがある。対象の構造を定義できているか。モデルを持てているか。予測できているか。
誤解のないように言っておくが、因果を軽視しているわけではない。介入や政策判断には因果推論が不可欠だ。しかし、因果を問う前提として、対象の構造的定義とモデル化が必要なのだ。多くの場合、順序が逆になっている。
Judea Pearlの因果推論も、背後にある構造モデル(causal graph)を前提としている。因果とは、構造を明示した上で初めて意味を持つ概念だ。
科学の本質は、世界の構造を定義し、モデル化し、予測可能にすることにある。因果はその一部であって、すべてではない。
相関は、単なる偶然ではない。世界の構造の痕跡である。
私たちはそろそろ思考の順序をアップデートする必要がある。
因果より先に、構造を見る。
*1:具体例は説明のための仮名である。実際には別の対象を扱っているが、議論したいのは対象そのものではなく、「潜在構造をどう定義するか」という思考順序である。
*2:"The law of causality, I believe, like much that passes muster among philosophers, is a relic of a bygone age, surviving, like the monarchy, only because it is erroneously supposed to do no harm." (Bertrand Russell, 1913, On the Notion of Cause, Proceedings of the Aristotelian Society)