Какие слова должен в первую очередь усвоить человек, мучающий неродной язык? Какие слова надо включить в словарь переводящей машины? Очевидно, и в одном и в другом случае это должны быть наиболее употребительные в языке слова. Нецелесообразно ведь загружать память человека или машинную память словом, которое очень редко встречается в речи.
Проблема отбора наиболее употребительных слов возникает и при первоначальном обучении неродному языку, и при передаче сообщений - такие слова можно закодировать условными сокращениями, и при составлении одноязычных и двуязычных словарей-минимумов, и при создании словаря для машинного перевода, и при теоретическом исследовании словарного состава языка.
Объективно решить названные задачи помогает частотный словарь, т.е. словарь, в котором при каждом слове указывается частота его употребления. Составитель такого словаря отбирает определенное количество текстов, извлекает из них все слова и регистрирует, сколько раз встретилось каждое слово в обследованном материале и в каком количестве текстов оно встретилось. Полученные данные и служат базой для создания словаря, который включает, с указанием количества употреблений, или все найденные в текстах слова, или слова, у которых частота не меньше какой-нибудь заданной величины.
Данный словарь содержит 2500 наиболее употребительных слов.
Какие слова должен в первую очередь усвоить человек, мучающий неродной язык? Какие слова надо включить в словарь переводящей машины? Очевидно, и в одном и в другом случае это…