§ библиотека мастерская Помощь Контакты Вход —

Фрумкина Р.М. Психолингвистика: Учеб. пособие для студ. высш. учеб. заведений

В каталоге: Психология
Прислано в библиотеку: NAMaksimova
Стр. 208

Если взять классический текст на русском языке, допустим текст «Капитанской дочки» Пушкина, и, руководствуясь частотным словарем языка Пушкина, 50 самых частых слов в этом тексте пометить, то окажется, что мы тем самым пометили почти половину всех словоупотреблений (а если точно – 42,5%).

Конечно, иностранец, выучивший эти 50 самых частых слов, понять текст «Капитанской дочки» не сможет. Потому что вот какие слова в среднем в текстах Пушкина входят в первые 50 самых частых:

и, в, я, он, не, быть, на, с, что (союз, местоимение, частица), ты, мои, она, свой, но, к, весь, они, как (наречие, союз), тот, мы, о (предлог), вы, а, за, это, из, от, по, же (частица, союз), у, ли, один, который, бы, сказать, мочь (глагол), наш, твой, ни, для, так (частица, наречие, союз), себя, или, ваш, день, знать (глагол), еще, где, да, то (частица, союз, наречие).

И все же один вывод даже из этого списка можно сделать: по крайней мере, эти слова иностранцу имеет смысл просто выучить, чтобы не открывать так часто двуязычный словарь.

Среди следующих 50 слов, расположенных по убыванию частоты употребления, полнозначных слов будет больше. Но, поскольку полнозначные слова повторяются во много раз реже, нежели служебные, по мере продвижения от более частых слов к менее частым «покрытие» текста, т.е. число помеченных слов, будет расти все медленнее и медленнее.

Например, если рассмотреть все тексты Пушкина, вместе взятые, то, чтобы пометить в качестве «известных» около 60% всех словоупотреблений, придется взять уже 460 самых частых слов, а чтобы пометить как якобы «известные» около 70% словоупотреблений, потребуется уже 1022 самых частых слова.

Приведенные данные не являются феноменом именно пушкинских текстов. В среднем в любом языке, независимо от характера текста, сравнительно небольшая группа наиболее частых слов соответствует очень значительному числу словоупотреблений. Знание примерно 2500 наиболее частых слов позволяет считать «известными» примерно 70-80% всех словоупотреблений.

из 364
Предыдущая    Следующая
 
Реклама
Авторизуйтесь