学習教室講師の世界(その3)…偏差値の意味と求め方

画像の説明

 2020年度から大学の入試方法がこれまでの共通一次センター試験方法から大学一次共通テストに大きく変わりました。これにともない、これまでの出題方式が大きく変わることになり、新しい共通テストでは、これまでの大学入試センター試験以上に「思考力・判断力・表現力」が問われる内容になったと言われています。講師にとっても、逸早くこの変化に対応できるかどうかが問われることになりました。

 2020年度の数学のテストを見てみますと、早速、「思考力・判断力・表現力」が試されるデータ分析と正規分布に関する統計学の問題も出題されました。データ分析では、データの中心の位置を示すものとしての平均値や中央値、最頻値などが、一方、分布の広がりの程度を示す散布度では、範囲、四分偏差、分散、標準偏差の理解力が求められています。また、正規分布への応用関連では、二項分布や推定の問題が出されています。現代はAIやITの時代であり、統計学が重要な役割を持つことの現れであるように思います。ビックデータとも呼ばれる多くのデータを如何に精度よく処理し、そのデータの持つ意味を分析するのかを問われているわけです。

画像の説明

 通常、多くの受験生は全国的な模擬テストに参加して、その得点と偏差値から希望する大学に入学できるのかどうかを判断します。講師の側としては、この偏差値はデータ分析と正規分布の問題でもあることから、偏差値がどの様な意味を持ち、どの様に求められているかを正しく理解しておくことは非常に重要と考えています。

 今回少し詳細に偏差値について調べてみましたので、その結果を紹介します。

1. 連続型確率変数

(1) 事象が起こる割合のことを離散型確率と呼びます。
(2) この確率が連続した値を取る場合を連続型確率変数と呼びます。
(3) 確率変数をX、これに分布曲線 y=f(x) を対応させたときy=f(x)をXの分布曲線、
  f(x)を確率密度関数と呼びます。
(4) 要はここで言いたいのは、個々のデータがある分布曲線上にあるならば、統計処理が非常に
  やりやすくなるということです。

2. 正規分布

(1) 上に述べた分布曲線が                
           画像の説明

   に従うとき、これを正規分布といい、XはN(m, σ2)に従うと表記します。
   その時の期待値mと標準偏差σは下記となります。

          期待値  m=E(X)
          標準偏差 σ=σ(X)

画像の説明

(2) 標準化

 期待値  m=E(X)   標準偏差 σ=σ(X) である確率変数Xを
        CENTER:画像の説明
で変換すると、

画像の説明

となります。これは、期待値が0、標準偏差1であることを示しています。正規分布に従う確率変数に関する確率の計算には、標準正規分布に直し、正規分分布表を用いると、効率良く処理することができます。

これを正規分布の標準化といいN(0、1)と表わし、下記正規分布表から数値を求めます。

画像の説明

(3) 偏差値への応用

 同様にして、期待値50、標準偏差10の確立変数Zに変換することを考えます。

画像の説明

 これを用いると、模擬テストなどの得点を平均点50点、標準偏差10の一律モデル上に表示できます。なお、Xは模擬試験での得点、mは模擬試験での平均点、σは模擬試験での標準偏差を意味します。

 具体的には、

(1) 模擬試験を受けて、自分の偏差値を出してもらいます。ですから自分の偏差値を知るために
  模擬試験を受けるのです。
(2) 得た偏差値を各大学の偏差値に当てはめてみると、自分がどの大学であればどうなのかは直ぐ
  に見付かります。
(3) ただ、偏差値は限られたデータで、これの正規分布に従っていると考えて出したものですか
  ら、目安としてしか使えません。

 通常、標準偏差σについては、
    自分の得点が平均値より1s以内であればレベルは低く、
    自分の得点が平均値より2sの外側にあればレベルは並で
    自分の得点が平均値より3sの外側にあればレベルは上位
という様な使われ方もします。

画像の説明

偏差値の求め方

 偏差値はどのような計算をして求めるのかを、例をあげて説明しようと思います。ただし、小学生にもわかるように、マイナスになる計算をしないように工夫してあります。

 計算がしやすいように、10人の生徒が100点満点のテストを受けたことにします。

画像の説明

 偏差値を求めるためには、平均点・分散・標準偏差を求める必要があります。

 平均点の求め方については良く知っていますが、分散・標準偏差というのは、聴き慣れないことばだと思います。ただ、理解すれば求め方はそれほどむずかしくありません。

1.平均点を求める

 平均点は、得点をすべて足して、人数で割れば求められます。本例では、

( 50+90+60+60+40+100+40+40+50+70 )÷ 10 = 60

となるので、平均点は60点です。

画像の説明

2.平均点との差を求める

 例えばAさんの場合は、得点が50点ですから、平均点である60点との差は、60-50=10点です。Bさんの場合は、得点が90点ですから、平均点である60点との差は、90-60=30点です。このように計算すると、次の様な表ができ上がります。

画像の説明

3.平均点との差の平方数を求める

 平方数というのは、たとえば7の平方数なら、7×7=49、12の平方数なら、12×12=144です。このように、同じ数×同じ数、の計算をしたのが、平方数です。

 たとえばAさんの場合は、平均点との差は10点ですから、その平方数は、10×10=100です。Bさんの場合は、平均点との差は30点ですから、その平方数は、30×30=900です。このように計算すると、上のような表ができます。

画像の説明

4.分散を求める

 「分散」というと、何やらむずかしい計算が必要というイメージを持つかも知れません。しかし、実際は簡単です。先程「平均点との差の平方数」を求めました。「分散」とは、この平方数の平均を求めるだけです。

 ( 100+900+0+0+400+1600+400+400+100+100 ) ÷ 10 = 400
「分散」は、400になります。

画像の説明

5.標準偏差を求める

 標準偏差を計算できるようにするためには、「平方根」の考え方を理解する必要があります。平方根は、先ほど出てきた「平方数」の逆です。たとえば7の平方数は、7×7=49でした。よって、49の平方根は7になります。同じようにして、144の平方根は、144=12×12ですから、12になります。

 では、標準偏差について説明しましょう。標準偏差は、分散の平方根です。先ほど、分散は400であることがわかりました。400=20×20ですから、標準偏差は20になります。

画像の説明

 標準偏差は、得点の散らばり具合を表す数値です。もしみんなが全く同じ得点だったら、たとえば10人がすべて50点だったら、平均点はもちろん50点で、標準偏差は0です。

 ところが10人のうち5人が0点、5人が100点だったら、平均点はやはり50点ですが、標準偏差は50になってしまいます。

 分散 (2500+2500+2500+2500+2500+2500+2500+2500+2500+2500)÷10
    =2500

 標準偏差=√2500=50

6.偏差値を求める前準備

 偏差値を求めるために平均点との差に10をかけ標準偏差で割ります。

 たとえばAは平均点との差は10でした。これに10をかけ、標準偏差である20で割ると、10×10÷20=5となります。

 Bは平均点との差は30でした。これに10をかけ、標準偏差である20でわると、30×10÷20=15となります。

画像の説明

7.偏差値を求める

 最後に偏差値を計算します。先ほど、「平均点との差に10をかけ、標準偏差で割る」ことをしました。偏差値は次のステップで求めて行きます。

Step1. 得点が平均点より高ければ、50にこの数を足す。

 Bは得点が90点で、平均点よりも高いです。よって、50に15を加えて、50+15=65となります。

Step2. 得点が平均点と同じであれば、偏差値は50である。

Step3. 得点が平均点よりも低ければ、50からこの数をひく。

 例えばAは得点が50点で、平均点よりも低いです。よって、50から5を引いて、50-5=45となります。

 以上で偏差値の求め方は終わりです。

8.偏差値はアテになるか

 偏差値とは、その集団の中でどれくらいの位置にいるかを表した数値です。偏差値の利用価値が高いのは、その集団の数値分布が正規分布に近い状態のときです。正規分布の場合だと、偏差値60以上の生徒は全体の16%ぐらい、偏差値40以下も全体の16%くらいとなります。

 偏差値70以上の生徒は全体の2%ぐらい。偏差値30以下も、全体の2%ぐらいです。偏差値80以上の生徒は全体の0.13%(700人中1人)ぐらい。偏差値20以下も、全体の0.13%ぐらいです。

 入学試験や模擬試験は、正規分布とはかけ離れた分布になっていることが多いので、偏差値を何ら疑わず信じてはいけません。集団の中での位置が、ある程度わかるものとして利用すべきですから、偏差値が1上がった・1下がったからといって、一喜一憂するのは無意味です。

9.偏差値でだいたいの順位がわかる

 成績が正規分布であると仮定すると、理論的には偏差値がわかれば順位を計算することができます。下の表は、偏差値によって、上位何%の成績なのかがわかります。

 もし8000人が受けたテストの場合ならば、順位が8000×0.16=1280位、ということになります。表を見ると、偏差値60から偏差値70に上げることが大変むずかしいことがわかります。なんせ上位100人中16位の成績だったのを、100人中2位の成績にしなければならないのです。

 因みに、京都大学は偏差値が67.5~62.5、東京大学は67.5、首都大学東京は60.0~52.5で、16%から42%です。

画像の説明

 ある学習塾が宣伝文句として、偏差値30台・E判定からの奇跡の逆転合格!をアピールしてましたが、30点だいは86%~98%の大部分の受験生を網羅していますので、これを60点台の上位16%~3%まで持って行くのは至難の業であることが分かります。

 長い間、偏差値はどの様にして求めるのか疑問でしたが、ようやく解り易い回答見付けることができました。また、模擬試験を受けることの重要性もわかりました。皆さんどう思われますか。



コーディネーター's BLOG 目次