kで始まる単語の数

心理学の教科書を見ると、推論のバイアスを示すものとして次の例が出ている。

「kではじまる英単語と3文字目がkの英単語はどちらが多いか?」
実際は後者が前者の3倍であるのに、「kではじまるのが多い」と(実験では)答えた。
正しい比率を被験者が知らないために、自分の知っている単語をいくつか思い出して、たまたま思い出せた単語の数の比率から判断したのである。
(鹿取廣人他編『心理学』[第4版](東京大学出版会、2011)p. 185より)

質問「英語には、kで始まる単語と、kが3番目にくる単語ではどちらが多いか」に対して、大多数の参加者が「kで始まる単語」の方が多いと答える。
しかし、実際は「kが3番目にくる単語」は「kで始まる単語」の約2倍もある。
この問題の回答者は、「kで始まる単語」と「kが3番目にくる単語」を思い出そうとしたが、特定の文字で始まる単語を想起する方が容易であるため、「kで始まる単語」の方が多いという印象を持ったと解釈できる。
(箱田裕司他編『認知心理学』(有斐閣、2010)より)

二つの教科書で、2倍と3倍と分かれているのが不思議だが、実際はどうなのか。

上の質問文を率直に読むと、英単語を全て収録した辞書(そんなものがあるとして)の中で、収録されている単語のうちkで始まる単語の数とkが3番目にくる単語の数を比較しているように思える。

問 この場合それぞれの数はどうなるか、辞書web2を使って調べよ。

しかし、『認知心理学』で引用されている文献

Amos Tversky, Daniel Kahneman, "Availability: A heuristic for judging frequency and probability," Cognitive Psychology, Vol. 5 (1973) pp. 207--232

では、文章中の単語の出現頻度を問題にしているようである。ただこの論文にある以下の記述はどちらか判定しづらい。

In fact, a typical text contains twice as many words in which K is in the third position than words that start with K.

単語の出現頻度についてはさらに以下の文献が引用されているが、これは東大を含む日本の大学にはないしオンラインにもなっていないようである。

MAYZNER, M. S., & TRESSELT, M. E. Tables of single-letter and bigram frequency counts for various word-length and letter-position combinations. Psychonomic Monograph Supplements, 1965, 1(2), 1332.

問 英文(例えば Project Gutenberg で得られるような長いプレーンテキストが適している)を単語に分解し、kで始まる単語とkが3番目にくる単語の出現頻度を比較せよ。
研究課題 英文コーパス(例えば American National Corpus, http://www.anc.org/)を使い、同様の作業を行ってみよ。
Comments