米国の言語学者 George Kingsley Zipfは英単語の頻出する単語を調べ、1番頻出する単語は2番目に頻出する単語の約2倍、3番目に頻出する単語の約3倍であることを発見しました。
この分布に従うと、英語の聖書でも新聞でも、上位100単語で全体の単語の半分を構成できることになります。
上位に来る単語としては上位からthe、be、to、of、and、aあたりになります。
テストで1単語を空欄に埋める問題が出たときに、確率的にはtheを入れておけば当たる可能性が高いことになります。
Most common words in English
https://en.wikipedia.org/wiki/Most_common_words_in_English
ただし、文書で使われる単語と、会話で頻出する単語は微妙に違ってきます。私が分析した会話で頻出する単語は
1位 the
2位 to
3位 a
4位 and
5位 you
6位 I
ではフレーズはどうなのか? 例えば私が分析した3語で構成されるフレーズで頻出するのは
1位 I don’t know
2位 a lot of
3位 out of the
4位 going to be
5位 what do you
もしテストで3単語を入れる空欄があればI don’t knowと入れれば確率的には高い選択肢でしょう。