数学科講師の井上です。
今回は、私が応援するプロ野球・ヤクルトスワローズの村上宗隆選手を題材に、「外れ値」についてお話ししたいと思います。
プロ野球が好きな方も、そうでない方も、是非読んでいただきたいと思います。
外れ値とは?
いきなりですが、皆さんは「外れ値」について、ご存知でしょうか。
数学Ⅰの「データの分析」で登場する用語で、今年度からの新課程において、教科書にも新たに取り上げられています。
「外れ値」を簡単に説明すると、以下のようになります。
いくつかの数値(変量)の中で、他と比べて極端に大きい・もしくは小さい値の事。
この「外れ値」があると、平均値が代表値(データ全体を象徴する値)として機能しない事があります。
そのため、この「外れ値」を除外して平均値を計算したり、別の代表値として「中央値」を用いたりする事があります。
※統計の計算においては、計測に誤りがある(これを異常値と言います)という可能性を考える事もあります。
まずは、以下の例で考えてみます。
例
非常に難しいテストを実施した。
受験した10人のうち9人は0点だったが、天才のA君が100点を取ったおかげで、平均点は10点になった。
A君以外の人からすると、「あなたは平均以下です。良くない成績ですね」と言われるのは納得できませんよね。
このように、ずば抜けた成績を収めている人がいると、その他の人の評価が低く見られてしまうという現象が起こってしまいます。
このため、A君は「外れ値」と言えます。
※本来は外れ値にもきちんとした定義があったりしますが、ここでは極端な例を用いてわかりやすく説明しています。
このような極端な仮定はともかくとして、現在プロ野球で現実に起こっている事例で見てみましょう。
東京ヤクルトスワローズ 村上宗隆選手
プロ野球・東京ヤクルトスワローズに所属する村上選手の8/28時点の成績は、以下の通りです。
打率 .340
ホームラン49本
打点120
すべての部門でリーグトップ、それも他の打者を引き離して独走状態です。
約20年ぶりの「三冠王」も現実味が出ており、話題になっています。
野球の成績を統計的に分析する「セイバーメトリクス」という分析手法における選手の評価指標の一つに、「wRAA」というものがあります。
この指標は、「平均的な打者と比べてどのくらい得点を生み出したか」という数値を計算しています。
村上選手のポジション、三塁手の「wRAA」は、以下のようになります。
2022年 セ・リーグポジション別wRAA【三塁手】 8/28時点
ヤクルト:60.8
読売:-6.3
DeNA:-7.9
広島:-13.6
中日:-15.3
阪神:-16.0
この数値が表す意味は、以下のようになります。
「ヤクルトの三塁手は、セ・リーグの平均的な三塁手と比べると60点以上得点を増やしたことになる」
「他球団の三塁手は、セ・リーグの平均的な三塁手と比べると得点を減らしている」
村上選手のように桁外れの成績を残している選手がいると、「平均値って、意味ないんじゃないか」となってしまうわけです。
まとめ
いかがでしたでしょうか。
「とにかく平均値を取ればよい」というだけではない、という事がお分かりいただけたでしょうか。
皆さんの「外れ値」についての理解が少しでも深まれば幸いです。