TOEICスコア、サイコロで250点未満を取れる確率は? 統計学を使って計算してみた

ランダムにTOEICの回答を選択したときの点数として、よく言われるのが「250点」という数字です。1000(およその満点)に1/4をかけた数字ですから、一見正しそうに見えます。

しかし本当なのでしょうか。TOEICには、4択式の設問だけではなく3択式の設問もあります。それに250点未満や250点を超える点数を取る確率も0ではないはずです。その確率は一体どれくらいなのでしょう?

この記事では、それらの疑問を統計学の力を使って解決していきます。

難しい数式は出てきません。四則演算さえ出来れば十分です。数学が苦手な方でも、読み進められるようになっています。

注意!

三択式30問・四択式170問の設問形式だったのは、2016年5月のTOEICまでです。 それ以降は三択式25問・四択式175問の設問形式になっています。

本記事では、2016年5月以前のTOEICでの確率を計算しています。ですが、旧設問形における計算結果と新設問形式における計算結果 には差はほぼありません。(誤差最大1%程度)

したがって新設問形式のTOEICであっても、本記事の内容をそのまま適用できます。

詳細な導出過程

この記事で解説している導出手順は、大まかなものです。厳密な導出過程が知りたい方は、下のPDFをダウンロードしてご覧ください。

PDFダウンロード先

ゴール

ランダムにTOEICの解答を選択したとき

  • 100点以上150点未満の点数を取る確率
  • 400点以上450点未満の点数を取る確率

といった値を求めることを目標とします。

注意事項

TOEICでは、問題の正答数から得点を厳密に求めることができません。よって誤解を避けるため

  • 100点以上150点未満の点数を取る確率

ではなく

  • 20問以上30問未満正解する確率

のように結果を表記します。

TOEICの設問形式

話を進める前に、TOEICの設問形式について触れておきます。 TOEICは、三択式の問題30問と四択式の問題170問で構成されています。 ランダムに回答を選択した場合、ある一問を正答する確率は三択式では1/3、四択式では1/4になります。

素直に確率を求めてみる

確率を求める

三択式と四択式を二つ同時に考えるのは難しいため、先に三択式の確率について考えていきます。

三択式において、〇問以上×問未満正解する確率を求めるには、まず〇問中×問正解する確率を求める必要があります。例えば、三択式で10問以上15問未満正解する確率は

  1. 30問中10問正解する確率
  2. 30問中11問正解する確率
  3. 30問中12問正解する確率
  4. 30問中13問正解する確率
  5. 30問中14問正解する確率

をそれぞれ求めて、足し合わせた値になります。

四択式の確率も、三択式の確率と同じように求めることが出来ます。四択式で5問以上10問未満正解する確率は

  1. 170問中5問正解する確率
  2. 170問中6問正解する確率
  3. 170問中7問正解する確率
  4. 170問中8問正解する確率
  5. 170問中9問正解する確率

をそれぞれ求めて、足し合わせた値になります。

この方法の問題点

ですがこの求め方には、致命的な問題点があります。それは計算量が非常に大きくなるという点です。 一体どういうことなのでしょう。TOEICの問題全体で10問正解する確率を、この方法で求めてみることで問題点を明らかにしていきます。

TOEICの問題全体での正答数は、三択式での正答数と四択式での正答数を足し合わせた値になります。そのため、TOEIC問題全体での正答数が10問になる確率を求めたい場合

  1. 三択式の正答数が0問になる確率×四択式の正答数が10問になる確率
  2. 三択式の正答数が1問になる確率×四択式の正答数が9問になる確率
  3. 三択式の正答数が2問になる確率×四択式の正答数が8問になる確率
  4. 三択式の正答数が3問になる確率×四択式の正答数が7問になる確率
  5. 三択式の正答数が4問になる確率×四択式の正答数が6問になる確率
  6. 三択式の正答数が5問になる確率×四択式の正答数が5問になる確率
  7. 三択式の正答数が6問になる確率×四択式の正答数が4問になる確率
  8. 三択式の正答数が7問になる確率×四択式の正答数が3問になる確率
  9. 三択式の正答数が8問になる確率×四択式の正答数が2問になる確率
  10. 三択式の正答数が9問になる確率×四択式の正答数が1問になる確率
  11. 三択式の正答数が10問になる確率×四択式の正答数が0問になる確率

の11個の式を計算し、求めた11個の値を全て足す必要があります。今回は10問でしたが、20問、30問……と問題数が増えていけば、パターンの数も増えていきます。

更なる問題点

さらに「三択式の正答数が0,1,2,3……問になる確率」と「四択式の正答数が0,1,2,3……問になる確率」を求める計算の計算量も、非常に大きいのです。 下の式は「四択式の正答数が10問になる確率」を求める式です。式の意味を理解する必要はありません。

四択式の正答数が10問になる確率を求める式

式の意味はわからなくとも、複雑な形をした式であることは見た目で分かると思います。実際この式の計算は複雑であり、問題数が多くなればコンピュータであっても早く計算することは難しくなります。

正規分布に近似して計算する

この方法では、計算量が膨大になってしまうことが分かりました。では、確率を計算することは出来ないのでしょうか。

いえ、そんなことはありません。正確な値ではありませんが、高い精度で確率を求める方法が存在します。次からはその方法について見ていきましょう。

正規分布へと近づくグラフ

Pが1/3,Nが5のヒストグラム

上のグラフは、ある一問を正答する確率が1/3のとき、5問中0問正解する確率、1問正解する確率……5問正解する確率を棒グラフにして並べたものです。 棒グラフの形に特に変わったところは見られません。

Pが1/3,Nが10のヒストグラム

先ほどの例から、ある一問を正答する確率を変化させずに、10問中0問正解する確率、1問正解する確率……10問正解する確率を棒グラフにして並べました。 うっすらと、左右対称で山なりのグラフが見えてきました。

Pが1/3,Nが30のヒストグラム

先ほどと同様に確率を変化させず、30問中0問正解する確率、1問正解する確率……30問正解する確率を棒グラフにして並べました。

左右対称の山なりのグラフが現れています。

Pが1/3,Nが30のヒストグラムコメント付き

3つのグラフの変化から分かるように、〇問中0問正解する確率、1問正解する確率……〇問正解する確率を並べた棒グラフがあったとき、〇をどんどん大きくしていくとその棒グラフの形は、左右対称の山なりのグラフに近づきます。

この「左右対称の山なりのグラフ」のことを正規分布と呼びます。1 正規分布のグラフ

上の図が正規分布を表すグラフです。

正規分布の面積と確率

棒グラフに近似させた正規分布から、〇問以上×問以下正解する確率を求めることが出来ます。例として、こんな正規分布を考えてみます。 こんな正規分布のグラフ

このとき〇問以上×問以下正解する確率は、二つの縦線に囲まれた部分の面積と等しくなります。2

このように、正規分布を使えば面積を求めるだけで確率を求めることが出来ます。具体的な面積の値は、この後紹介するツールや、数表(ふつう正規分布表と呼ばれる)を使って求めます。

正規分布の形を決める二つのパラメータ

正規分布のグラフは様々な形をとります。下の3つのグラフは、形こそ違いますが全て正規分布です。

3つの正規分布

そのため正規分布と分かっていたとしても、どんな形の正規分布なのかを知る必要があります。そして正規分布の形は平均分散という二つの値を使って表すことができます。

ここでは、平均や分散といった用語の意味を理解する必要はありません。二つのパラメータさえ分かれば、正規分布の形を描けることだけ理解してください。

三択式と四択式の平均と分散を計算する

これまでの話より、三択式の正答数が〇問以上×問未満になる確率・四択式の正答数が〇問以上×問未満になる確率を求めるには、三択式と四択式の平均と分散を計算しなくてはなりません。

本当は平均と分散を求める公式がある3のですが、省略して値だけを示します。

  • 三択式

    • 平均:10
    • 分散:20/3
  • 四択式

    • 平均:42.5
    • 分散:255/8

二つの正規分布をまとめる

本文の初めに挙げた確率を求めるためには、三択式の正解数+四択式の正解数が〇問以上×問未満になる確率を求める必要があります。 理由は省略しますが、三択式の正解数+四択式の正解数が1問になる確率、2問になる確率……200問になる確率を棒グラフにして並べたとき、その形は正規分布とほぼ同じ形になります。

またその正規分布の平均と分散は、三択式と四択式の平均と分散をそれぞれ足したものになります。

  1. 平均:52.5
  2. 分散:925/24

実際に確率を計算する

確率を求めるための準備は全て整いました。あとはこちらのツールを使って、平均52.5 分散925/24の正規分布の面積を求めるだけです。

ツールスクリーンショット

例として、40問以上50問未満正解する確率を求めてみます。 ツール上のパーセント点x1と、パーセント点x2には求めたい確率の問題の範囲を指定します。 今回は、x1に39.5(40から0.5引いた数値)、x2に49.5(49に0.5足した数値)4を入力します。 さらに平均には52.5を、標準偏差には分散の正の平方根である6.208193511を入力します。

計算ボタンを押すと、正規分布の面積計算が行われます。

計算結果

図の下に表示されている「内側累積確率」に100をかけたものが、求めたい確率になります。今回は0.29633569739658と表示されているため、これに100をかけた29.633569739658%(およそ29.5%)が答えです。

結果

以上の手順で計算した結果が、次の表とグラフになります。

結果表

結果グラフ

考察

250点未満(50問未満)を取る確率は、30%以上あることが分かります。250点以上取る確率(50問以上)の方が30%以上高いとはいえ、直感よりも大きい確率だと思います。とはいえ、仮に250点未満だったとしても250点付近の点数になるのが大半です。これは、200点以上250点未満(40問以上50問未満)の確率が29.63%であることから分かります。

今度は2ケタの点数や、400点以上の点数を取れる確率を見ていきます。 2ケタの点数(20問未満)を取る確率はおよそ二千万分の一であり、年末ジャンボ宝くじ1等の当選確率に当たります。2020年度のTOEIC L&Rの受験者数が150万人であることからも、この確率の低さが分かります。

続いて400点以上の確率です。2ケタの確率よりはマシですが、それでも二十万分の一しかありません。2020年度のTOEIC L&Rの受験者数が全員サイコロでTOEICに挑んでも、この点数を出せる人は10人もいない計算になります。

結論

  1. 250点未満(正答数50問未満)を取る確率は、30%以上と意外に高い。
    1. とはいえ大半の場合は250点付近の点数を取る。
  2. 200点台の点数を取る確率は80%以上。
  3. 100点未満の点数や、400点以上の点数をランダムで取るのは奇跡でも起きないかぎり無理。

最後に

最初にも言いましたが、これは目安の点数です。TOEICは、正答数だけでスコアを決めているわけではありません。参考程度にしてください。

参考文献

統計学入門

下のサイトから無料でダウンロードできます。

konamih.sakura.ne.jp

新版数学シリーズ 新版確率統計

www.jikkyo.co.jp

正規分布の再生性

http://www.sguc.ac.jp/i/st/learning/statistics/hosoku/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83%E3%81%AE%E5%86%8D%E7%94%9F%E6%80%A7.pdfwww.sguc.ac.jp


  1. 厳密な定義はWikipedia:正規分布参照。

  2. 「近似」であるため厳密には等しくない。

  3. 一問正解する確率がpであるような問題がn問あるとする。このとき平均=n×p、分散=n×p×(1-p)である。

  4. こうすると正規分布による近似の精度がよくなります。詳しくは、半整数補正で検索してください。