パンの木を植えて

主として数学の話をするブログ

シンプソンのパラドックス

\[ %%% 黒板太字 %%% \newcommand{\A}{\mathbb{A}} %アフィン空間 \newcommand{\C}{\mathbb{C}} %複素数 \newcommand{\F}{\mathbb{F}} %有限体 \newcommand{\N}{\mathbb{N}} %自然数 \newcommand{\Q}{\mathbb{Q}} %有理数 \newcommand{\R}{\mathbb{R}} %実数 \newcommand{\Z}{\mathbb{Z}} %整数 %%% 2項演算 %%% \newcommand{\f}[2]{ \frac{#1}{#2} } \]

おはようございます.

f:id:seasawher:20220212153200j:plain

バレンタインなのでお高いチョコを買ってきました.

バレンタインのときに百貨店のてっぺん辺りで売ってるチョコってキラキラつるつるで素敵な形に固められてるやつが多いんですが,そういうおしゃれなやつじゃなくて,泥団子みたいなやつにしました.

おいしかったです!


それはそうと3月に邦訳が出る DeGroot, Schervish の原著を手に入れましたので,前回に続いて中身を少し紹介していきます.

ちなみに前回はこちらです.

今回は,シンプソンのパラドックスという話です.(10.5 節)


問題編

ほげほげ熱という病気があるとして,それに対する新開発の薬Aの効果を測ろうとしています.それまでの薬はBとします.

80人の患者を集めて治験を行いました.うち半分の40人は男性で,もう半分の40人は女性です.

そして80人のうちの40人には新薬を,もう半分の40人には従来の薬を投与します.その結果が次の通りだったとしましょう.

f:id:seasawher:20220212142710j:plain
10.5 Simpson's Paradox - p.654 - Table 10.30

右端の Percent improved(治癒した人の割合) というところを見てください.

新薬(new treatment) の方が治癒したひとの割合が多いですね.

よかった,新たに開発しただけの価値はあったようですね.


しかしながらここで問題が発生します.

いまの図では男性と女性を分けていましたが,ここで男性患者と女性患者をまとめてひとつの表にしてみると,次のようになります.

f:id:seasawher:20220212142724j:plain
10.5 Simpson's Paradox - p.654 - Table 10.29

なんの変哲もない表に見えますが.

もう一度右端の Percent improved のところをよく見てください.

今度は従来の薬(standard treatment) の治癒率の方が高くなっています!

これはちょっと驚きですね.

さあ果たしてどちらの結論が正しいのでしょうか?

新薬は,本当に開発した甲斐があったのでしょうか?


解答編

謎をとく鍵は,そもそもどちらの薬を投与されるかによらず女性の方が治癒率が高いということです.

ほげほげ熱は,どうやら女性より男性の方が重症化しやすいようですね.

新薬の方が効果が高いだろうことは前もって予想されていたことなので,重症化しやすい男性の方に優先的に新薬を割り当てようという配慮がなされたようです.たいへん人道的ですね.

その結果,何が起こったか?

  1. 重症化しやすい男性に新薬が多く投与され,

  2. 耐性のある女性に従来薬が多く投与される

という配分になりました.その結果,あたかも新薬を投与されたことが原因で治癒率が落ちたかのように見えたのです.本当の原因は,もともと重症化しやすいひとに新薬が投与されていたからでした.

図にまとめるとこんな感じです.

f:id:seasawher:20220212142731j:plain
因果関係と共変関係の図

重要な変数である「男か女か」を図から消すと,あたかも新薬を投与されたことが治癒しなかった原因であるように見えるというわけです.

こわいですね.

患者が新薬を投与されるか,それとも従来薬を投与されるかがランダムに決定されているのであれば,問題はなかったのですが…….どちらの薬を投与されるかと,治るかどうかの両方の原因になる交絡変数(男か女か)が存在しているのに,その変数が表から外されてしまったことによって実態とは真逆の結果が出てしまった,というお話でした.


まとめと感想

直感に反する確率統計の話シリーズは、忘れてましたがこういう記事もありましたね. まあ今回は統計というより因果推論に近い話でしたが.

今回は新刊紹介枠で記事を出しましたが,「直感に反する確率」でシリーズ化してもおもしろいかもしれません.


医療統計の分野では有名なシンプソンのパラドックスですが,意外と普通の確率・統計の本には載ってなかったりします.

説明されれば明快で,とくに謎でもなんでもないのですが,初見だと結構不思議に見えるんじゃないかと思います.

面白い例なので,こういう例もちゃんと載ってる本書は良い本だなあと思いました.

邦訳も紹介しておきますね.