第257回 確率の冒険:《命》に関わる確率(前編)

「もしかすると、確率というのは《命》に関わってくるんじゃないでしょうか?」と言い出した後輩のテトラちゃん。あなたなら何と答える? いっしょに《数学トーク》を楽しもう!

登場人物紹介

:数学が好きな高校生。

テトラちゃんの後輩。 好奇心旺盛で根気強い《元気少女》。言葉が大好き。

$ \newcommand{\KATSU}{\mathrel{\text{かつ}}} \newcommand{\MATAWA}{\mathrel{\text{または}}} \newcommand{\NEQ}{\neq} \newcommand{\ABS}[1]{\left|\mathstrut #1\right|} \newcommand{\REMTEXT}[1]{\textbf{#1}} \newcommand{\SETM}{\,|\,} \newcommand{\EMPTYSET}{\{\,\}} \newcommand{\UNDERCOND}{\mathrel{|}} $

図書室にて

は後輩のテトラちゃんと確率についてのおしゃべりを続けている(第256回参照)。

「じゃあね、テトラちゃんに確率のクイズだよ」

テトラ「あ、あたしでも解ける問題でしょうか?」

架空の細菌《○○菌》に関する問題」

問題(○○菌に感染しているか否か)

《○○菌》に感染している人は《全人口の$1$%》である。

○○菌に感染しているか否かを調べる《判定キット》がある。

判定キットは感染しているか否かを《$90$%の確率》で正しく判定する。

  • 《感染している》という判定のことを《陽性》と呼ぶ。
  • 《感染していない》という判定のことを《陰性》と呼ぶ。

ある人を判定キットで調べたら《陽性》だった。

この人が○○菌に実際に感染している確率を求めよ。

※注意:○○菌ならびに各数値はすべて架空のものです。

テトラ「それほど難しくはないですね。答えもすぐにわかります!」

「それはすごいな。答えは?」

テトラ「陽性だったんですから、感染している確率は$90$%です」

「うん、そう思いたくなるけれど、それは非常によくあるまちがいなんだ」

テトラ「えっ! $90$%じゃないんですか?」

「ちがうよ。この人が実際に感染している確率は$90$%じゃない」

テトラちゃんの解答

実際に感染している確率は$90$%です。(←この答えは誤り)

テトラ「$90$%じゃない……」

テトラちゃんは爪を噛みながら考え始めた。

「……」

テトラ「先輩? いろいろ確認してもいいでしょうか。あたし、どうしても、$90$%に思えるんです。 だから、あたしの考えのどこが間違っているかを確かめたいので……」

「もちろん、いいよ。どうぞ」

テトラ「ここでいうパーセント(%)というのは、普通のパーセントですよね?」

「そうだよ。パーセントはパーセント。百分率。特殊なパーセントじゃない」

テトラ「ということは$90$%というのは、$0.9$と置き換えてもいいですよね」

「もちろん。$90$%は$0.9$と置き換えてもいいし、$90/100$としてもいい」

テトラ「そうですか……この問題に出てくる《ある人》というのは、何か特別な人じゃないですよね」

「特別な人って?」

テトラ「たとえば、判定キットがうまく効かない特異体質……みたいな」

「そんな引っ掛け問題じゃないよ。これは純粋に確率の問題なんだから。《ある人》はランダムに選ばれた人。 ○○菌に感染しているかもしれないし、感染していないかもしれない。 そして判定キットを使うと《陽性》か《陰性》のどちらかが必ずわかる」

テトラ「そうですか……この判定キットは本当に$90$%で正しく判定できるんですよね?」

「うん。問題にある通りだね」

テトラ「そうですか……」

「テトラちゃんはどんなふうに考えたの?」

テトラ「単純です。あたしの考えはこうです」

  • (1)判定キットは$90$%で正しく判定できます。
  • (2)《陽性》という判定が出たらそれは$90$%の確率で正しい判定です。
  • (3)《陽性》というのは○○菌に感染しているという意味です。
  • (4)《陽性》という判定が$90$%の確率で正しいんですから、《陽性》の判定が出たら$90$%の確率で○○菌に感染しているといえます。

「なるほど。いかにも正しそうに聞こえるけれど、(1)(2)(3)(4)の中にはまちがいが含まれているんだ」

テトラ「不思議です! 不思議です! あたしにはこの(1)(2)(3)(4)の考えの進め方は《一点の曇りもない》ように見えるんですけどっ!」

「テトラちゃんがそう誤解するということは、世の中の人の多くもそう誤解するんだろうね」

テトラ「理解できません……」

「テトラちゃんの答えが何だか怪しいことはすぐにわかるよ」

テトラ「どうしてでしょう」

《条件をすべて使ったか》というポリアの問いかけをするとわかる」

テトラ「条件をすべて……使ってませんか?」

「テトラちゃんは、○○菌に感染している確率$1$%という情報をぜんぜん使ってないよね」

テトラ「ははあ……あっ、じゃあ、正解は$90$%の$1$%ですね。ええと、確率は$0.9$%ですか?」

「それも違うよ。テトラちゃん、いまのはかなり行き当たりばったりに答えちゃったね」

テトラ「は、はい……そうですね。ちゃんと考えませんでした。$1$%という数値が出て来たから機械的に掛けてしまいました。テトラは反省しています。 先輩、どこがおかしいか、教えていただけませんか?」

「うん。順序立てて説明するね」

テトラ「いま、考えずに答えてしまったの、ものすごく恥ずかしいです……」

《正しく判定する》とはどういう意味か

「うん。じっくり行くことにしよう。まず、判定キットは、$90$%で正しく判定できるよね」

テトラ「そうですね」

「では、その《正しく判定する》というのはどういう意味だろう」

テトラ「《正しく判定する》というのは『《感染している》人に対して《陽性》を示す』ことです」

  • 《感染している》人に対して《陽性》を示す

「いや、それだけじゃまずいんだよ」

テトラ「ええっ!」

「だって……もしもだよ、もしも、判定キットがすべての人に対して《陽性》を示すとしたら?」

テトラ「え……《感染している》人も《感染していない》人も《陽性》にしちゃうんですか? それは何も判定してないですよね」

「うん。それじゃ何も判定しない。それでも、テトラちゃんがいま言った『《感染している》人に対して《陽性》を示す』という振る舞いになってる」

テトラ「あっ、それは……確かにそうですね。誰にでも《陽性》を示しちゃうから、《感染している》人に対しても《陽性》を示します……」

「だから、テトラちゃんの《正しく判定する》という理解には欠けているところがある。こんなふうに、もっと精密にいわないといけない」

  • (ア)《感染している》人に対して《陽性》を示す
  • (イ)《感染していない》人に対して《陰性》を示す

テトラ「《正しく判定する》というのは、この(ア)と(イ)の両方を合わせた主張なんですね」

「そうだね。それが《正しく判定する》という意味」

テトラ「あの……これは言い訳に聞こえるかもしれませんが、あたしは心の中ではちゃんとこの(ア)と(イ)の両方を考えていたんです。 でも(ア)を言うだけで(イ)も言ったことになると勘違いしていました」

「そうだね。これは確率とは関係なく、よく起きる勘違いだよ。《感染している》人に対して《陽性》を示すと言っただけでは、《感染していない》人については何も言ったことにならないんだ」

テトラ「ところで、あたしが○○菌の問題をまちがえたのはこれが関係しているんでしょうか。いえ、まだ、どこが間違ったのかわかっていないんですが……」

「関係しているよ。《全体は何か》に関わってくるからね」

全体は何か

テトラ「全体は……何か?」

「判定キットは、$90$%で正しく判定できるよね。さっきは《正しく判定する》を調べたけど、 今度は$90$%という数を調べてみよう。$90$%というのは何だろう」

テトラ「$90$%とは何か……はい、$90$%というのは、全体を$100$としたとき$90$になる割合という意味です」

「そうだね。全体を$1$としたときに$0.9$といっても同じことだけど、ともかくパーセントや割合を考えるときには必ず、必ず、必ず《全体は何か》と問わなくちゃいけない。 さもないと話は大きく変わってくるから」

テトラ「はい……それはテトラも理解しているつもりです。学校で割合を学んだとき、先生からもそれはくどいほど言われました。 たとえば《$3$割引き》や《$10$%値上げ》や《半額セール》というときに、 何を$10$割と見なしているか、どの時点の値段を$100$%と見なしているか、半額にするもとの値段はいくらか……」

「何気に全部値段だね」

テトラ「あっ、た、たとえばです……」

「茶化してごめん。ともかく《全体は何か》を問わなくちゃいけない」

テトラ「でも今回の○○菌のとき《全体は何か》に誤解はないと思うんですが……だって、判定キットは$90$%の確率で正しく判定するんですよ。 全体は……全体です。そしてそのうちの$90$%が正しい判定になります。違うんでしょうか?」

「その《全体》を吟味する必要があるんだよ。さっき《正しく判定する》をこんなふうに表現したよね」

  • (ア)《感染している》人に対して《陽性》を示す
  • (イ)《感染していない》人に対して《陰性》を示す

テトラ「はい」

「だから、これをベースにしてきちんと書いてみると、$90$%の意味が明確になる」

  • (あ)判定キットは、《感染している》人に対して$90$%の確率で《陽性》を示す
  • (い)判定キットは、《感染していない》人に対して$90$%の確率で《陰性》を示す

テトラ「はい、わかります」

「ここまでの話で、テトラちゃんは自分の考えとのズレにまだ気付かない?」

テトラ「は、はい……気が付きません。あたしはこの(あ)も(い)も、その通りだと思います。 そして、あたしの理解とまったくズレていないと思うんですが……」

「テトラちゃんがそう思うとしたら、世の中のほとんどの人が誤解するんだろうな……」

テトラちゃんは不安げな表情になり、ゆっくり両手を上げて頭を抱えた。

テトラ「う、うう……あたしの思考にはどこか大きな《盲点》があるんでしょうか。先輩のお話には難しいところがありません。シンプルですし、わかりやすいですし、 そして、あたしの考えとズレてないように思います。 でも、あたしは大きな間違いをしている……」

「ここまでの話をまとめてみるよ。《全体は何か》に誤解があるんだ」

テトラちゃんの考え(間違いが含まれている)

  • (1)判定キットは$90$%で正しく判定できます。
  • (2)《陽性》という判定が出たらそれは$90$%の確率で正しい判定です。
  • (3)《陽性》というのは○○菌に感染しているという意味です。
  • (4)《陽性》という判定が$90$%の確率で正しいんですから、《陽性》の判定が出たら$90$%の確率で○○菌に感染しているといえます。

判定キットの性質(間違いは含まれていない)

  • (あ)判定キットは、《感染している》人に対して$90$%の確率で《陽性》を示す
  • (い)判定キットは、《感染していない》人に対して$90$%の確率で《陰性》を示す

テトラ「……もしかして、あたしは(2)を勘違いしているんでしょうか」

「(2)のどこがおかしいと思う?」

テトラ「《陽性》という判定が出たらそれは$90$%の確率で正しい判定ですが、《陽性》という判定が正しい判定であるというのは、《感染している》人が全体のとき……ですよね」

「そう、そこだね」

テトラ「いまここに《感染している》人だけが集まっているとします。そこから一人を選んで判定キットを使うと、$90$%の確率で《陽性》を示します。 なぜなら、《感染している》人に対して、$90$%の確率で《正しい判定》を示すからですっ!」

「そういうこと」

テトラ「わかりましたっ! 確かに《全体とは何か》を誤解していました。○○菌の問題では《感染している》人と《感染していない》人が混ざっているのが《全体》ですね。 その《全体》からランダムに選んだ人が《陽性》を示したということだけがわかっている」

「テトラちゃんは、次の二つの状況を混同したんだね」

  • (カ)《感染している》人と《感染していない》人が混じった集団から選んだ人が《陽性》だった
  • (キ)《感染している》人だけが集まった集団から選んだ人が《陽性》だった

テトラ「はわわ……(カ)と(キ)はまったく違う状況ですね!」

「判定キットが$90$%で《陽性》を示すのは、あくまで(キ)の状況なんだ」

テトラ「……あらら? ○○菌の問題では(キ)じゃなくて(カ)のときに、実際に《感染している》確率を求めるんですよね。 この(カ)の状況での《感染している》確率なんて、求められるんですか?」

「いまのテトラちゃんなら、一つのヒントで求められると思うよ」

テトラ「ヒント?」

この続きは有料会員登録をすると
読むことができます。
cakes会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

21世紀のリテラシー《統計》の基本はここから学ぼう!

ケイクス

この連載について

初回を読む
数学ガールの秘密ノート

結城浩

数学青春物語「数学ガール」の女子高生たちが数学トークをする楽しい読み物です。中学生や高校生の数学を題材に、 数学のおもしろさと学ぶよろこびを味わってください。本シリーズはすでに11巻も書籍化されている大人気連載です。 (毎週金曜日更新)

この連載の人気記事

関連記事

関連キーワード

コメント

yusugomori 結城先生のこの問題設定は、機械学習の評価指標についての考察にも非常に関連が深いので、ぜひデータ分析に携わる方々も読んでみて下さい。 https://t.co/D2DpHFJtvy 4ヶ月前 replyretweetfavorite

xi_124C41 病気の診断で一番勘違いしやすい確率の問題をここまで丁寧に説明したものをいままでみたことがありません。 https://t.co/6hqPotJcOo 4ヶ月前 replyretweetfavorite

hikosaburou 計算の方法はあってたけど暗算がボロボロだった。定式化も式展開も曖昧だったから復習しよ https://t.co/fJVlNgq9rm 4ヶ月前 replyretweetfavorite

grahamian2317 数学ガールの確率の話を社内で展開したら暗算で解ける人がいたりテトラちゃんと同じ間違いをする人がいたりと面白かった。 モンティーホール問題とかも扱ってくれたらいいなあ。 https://t.co/qnrNIlX3zz 4ヶ月前 replyretweetfavorite