ジップの法則
余談ですが、
「n番目に多く現れる単語は、1番多く現れる単語のn分の1の確率で現れる」
ことが知られています。これは「ジップ(Zipf)の法則」というもので、1949年に発見されました。これはあらゆる言語について成立する経験則だそうです。
例えば、英語でよく出る単語は順に
THE OF AND TO ….
のようになりますが、ジップの法則によれば
THEの1/2の確率でOFが、また1/3の確率でANDが文章中に出てくる
ということが分かります。普段、無意識に言葉を話したり書いたりしているつもりでも、このようなきちんとした法則が成り立つのは、とても不思議ですね。
ちなみに、世の中には変わった人がいるもので、英語で最も多く現れるEを一つも使わないで書かれた小説が知られています。それは、アーネスト・ヴィンセント・ライトという人の書いた「Gadsby(ギャズビー)」という小説です。これがどれほどスゴイことかは、
THE HE SHE WE ME ----ED(動詞の過去形)
などはすべて使えないことから容易に想像がつくでしょう。