僕:数学が好きな高校生。
ユーリ:僕のいとこの中学生。僕のことを《お兄ちゃん》と呼ぶ。 論理的な話は好きだけれど飽きっぽい。
$ \newcommand{\ABS}[1]{|#1|} $
僕の部屋
(第121回の続き)- 最大値 $10$ 点
- 最小値 $0$ 点
- 平均値 $3.1$ 点
- 最頻値 $4$ 点
- 中央値 $2.5$ 点
ユーリ「あれ? ……でも、わかんなくなってきた。グラフで平均値ってどこになるの?」
僕「え? 『平均値がどこになる』ってどういう意味?」
ユーリ「さっきのこれ、グラフ描くとするじゃん?」
僕「うん。ヒストグラムだね。こんなふうに」
ユーリ「それそれ。お兄ちゃんがいってた代表値って、ぜんぶグラフでわかるじゃん? たとえば、 最小値と最大値はここでしょ?」
僕「ああ、そういうことか」
ユーリ「それから最頻値は、人数がいちばん多い点数でしょ?」
僕「そうだね。そして中央値は……」
ユーリ「わかってるよん。中央値は、ちょうど左右の面積が等しくなるところ!」
僕「そうそう! よくわかっているなあ」
ユーリ「中央値が $2.5$ で、それは、左側にちょうど $5$ 人いて、右側もちょうど $5$ 人いるところ」
僕「その通りだね。中央値でヒストグラムを左右にわけるとちょうど左右の面積が等しくなる」
ユーリ「それはいーんだけど、平均値は? 平均値はグラフのどこになるの? 一番わかってると思ってた平均値がわかんなくなった」
僕「なるほどなあ。この場合は平均値が $3.1$ だから、線を引くとしたらここだね。中央値よりも平均値は右にきた。これは、 $10$ 点の一人が、平均点を引き上げたんだ」
ユーリ「違うの。平均値がそこになるのはわかっているの。そーじゃなくて、なんてゆーか……わかんない?」
僕「わかるよ。中央値 $2.5$ は『グラフの面積をちょうど $\frac12$ にする位置』といえるけど、それと同じように平均値 $3.1$ はグラフ上でどういう位置なのか、 その位置にどういう意味があるのか……って言いたいんだろ」
ユーリ「そーなの。どーゆー意味があるの?」
僕「確かにこれはちょっと難しい問題だな」
ユーリ「えー、お兄ちゃんにもわかんないの?」
僕「いや、わかるよ」
ユーリ「早く教えてよ」
僕「ではここで問題です」
平均値 $3.1$ はこのヒストグラムでどういう意味を持つ位置か。
ユーリ「いやいやいや、問題形式にしなくていいから!」
僕「平均値の計算方法を思い出してみるとわかるよ」
ユーリ「掛けて割った」
僕「……何と何を掛けて、何で割ったの?」
ユーリ「点数と人数を掛けて、ぜんぶ足してから、ぜんぶの人数で割った」
$$ \dfrac{0\times\text{《 $0$ 点の人数》} + 1 \times \text{《 $1$ 点の人数》} + \cdots + 10 \times \text{《 $10$ 点の人数》}}{\text{人数}} $$
僕「そうだね。言い換えると、それぞれの点数に、人数を使って《重み》をつけたといえる」
ユーリ「重み……わかった! バランスするところなんだ!」
僕「そうだね。大正解だ。ヒストグラムの高さ分だけ《重み》があると考えたとき、平均値はちょうど横軸の重心になるんだよ」
平均値の位置は横軸の重心になる。
ユーリ「なーるほどね。そんならナットク。 $10$ 点くんは、遠くに離れているから、一人でも効くんだ」
僕「そういうことになるね。だから、外れ値があるときは、平均値だけじゃなくて中央値も確かめるほうがいい」
ユーリ「ふんふん……」
最頻値
僕「代表値にはそれぞれ使いどころがあるわけだよ」
ユーリ「あれ、でも、たとえば最頻値なんかはいつでも便利だよ。だって、最頻値って一番大きいとこでしょ? 一番大きいところは調べる価値あるじゃん?」
僕「調べる価値はあるけれど、代表値としては適切じゃない場合もあるよ」
ユーリ「え? そーかなー」
僕「じゃあ、クイズにしてみよう」
最頻値が代表値として不適切な場合はどんなときか。
ユーリ「最頻値が不適切な場合なんて、思いつかにゃい……」
僕「そうかな?」
ユーリ「……ばかばかしい答えは思いつくよ。たとえば、全員が同点の場合! 全員が同点だったら、最頻値は決まらないもん」
僕「いや、全員が同点だったら最頻値は決まるよ。その点数が最頻値になる。ユーリがいいたいのは《すべての点数が同じ人数になる場合》じゃないの?」
ユーリ「あ、そーだった」
僕「すべての点数が同じ人数……つまり一様分布の場合には、最頻値は決まらない」
ユーリ「これが答えなの?」
僕「これだけじゃないよ。ヒストグラムがこんな形になる場合でも、最頻値は決まらない」
ユーリ「そだね」
僕「もしも、人数がぴったり同じでなければ最頻値は決まることは決まるけど、その場合でも、差が小さければあまり意味はない。 だって、ほんのちょっとしたことで最頻値が大きく変化してしまうから。 最頻値が代表値として意味を持つのは、はっきりした山が一つあるときだね」
ユーリ「なるほど!……むむ! 《代表値攻撃法》を思いついた!」
僕「なんだそりゃ」
代表値攻撃法
ユーリ「ほら、お兄ちゃんがいま言ってるのは《最頻値が代表値として意味を持たない場合》って話じゃん?」
僕「そうだね」
ユーリ「それって、最頻値を《攻撃》してたわけ。でね、ユーリが考えたのは《代表値がぜんぶ意味を持たない場合》を見つけるの! じゃじゃん!」
僕「いや『じゃじゃん!』じゃないよ。平均値はいつでも計算できるし」
ユーリ「平均値はいつでも計算できるけど、ほら、大きな外れ値があると平均値だけじゃだめで、中央値も合わせて調べるっていったじゃん」
僕「いったけど……?」
ユーリ「ユーリが考えた代表値攻撃法はこれ! じゃじゃん!」
B
僕「ほほー?」
ユーリ「ね? AとBは《最大値、最小値、最頻値、中央値、平均値》のどれを使っても区別できない! でも、このAとBは同じとはいえないよねー。 さてさて、この攻撃に代表値くんはどう反撃するかね?」
僕「ユーリは何と戦っているんだ」
ユーリ「お兄ちゃんと」
僕「確かにAとBのどちらも、
- 最大値 $10$ 点
- 最小値 $0$ 点
- 平均値 $5$ 点
- 最頻値 $5$ 点
- 中央値 $5$ 点
になっているな。両方おなじだ。でも、ねえ、ユーリ。 代表値は一つの数にすぎないんだから、 分布をいつも区別できるわけじゃないよ……いや、この場合にはアレが使えるな」
ユーリ「アレ?」
僕「こんなふうに反撃してみよう」
以下のAとBを区別できるような代表値を作ってみよ。
A
この連載について
数学ガールの秘密ノート
数学青春物語「数学ガール」の中高生たちが数学トークをする楽しい読み物です。中学生や高校生の数学を題材に、 数学のおもしろさと学ぶよろこびを味わいましょう。本シリーズはすでに14巻以上も書籍化されている大人気連載です。 (毎週金曜日更新)