Сколько английских слов надо знать?

Именно такой вопрос задают студенты, особенно те, кто только начинает учить английский. Еще чаще его можно услышать от тех, кто только собирается взяться за это неподъемное дело – чтобы рассчитать силы, видимо. С загадочным числом “слов, которые нужно знать” много чего связано – как шарлатанства, так и вполне разумных мыслей. Попытаемся разобраться, что этим всем стоит и чему же это волшебное число равно. А заодно поговорим о сложностях, связанных с оценкой словарного запаса, о тестах, которые есть в сети, о списках слов и о процентах знакомых слов.

Но прежде всего давайте развеем сам миф о необходимости знать Х слов, для того, чтобы “знать английский” (чувствовать себя уверено, читать книжки в оригинале, смотреть фильмы без перевода, свободно выражаться – нужное подчеркнуть). Язык – это вовсе не набор слов, которые надо зазубрить. И это относится не только к словам: язык это не набор грамматических правил, которые надо выучиить, это не набор звуков, которые надо научиться произносить. “Быть музыкантом” не сводится к знанию нот и аккордов, а “Быть здоровым” не сводится к возможности толкнуть определенное количество килограммов от груди. Хотя определенная связь между этими вещами, конечно, есть.

Однако вернемся к словам – просто знание Х слов не даст вам ни уверенности в общении, ни удовольствия от прочтения английских книг в оригинале. Связь между уровнем знания языка и словарным запасом и есть, но работает она в другую сторону. Когда вы знаете язык на определенном уровне , ваш словарный запас, скорее всего, состоит из примерно Х слов. Если вы просто возьмете и выучите все эти слова – это не поднимет ваш уровень знания языка на соответствующий уровень.

Итак, понимая, что количество слов – это не самоцель, а полезный индикатор вашего прогресса, давайте посмотрим, как этот индикатор работает.

Пассивный и активный словарный запас и другие проблемы с подсчетом

В первую очередь, давайте разберемся, какие именно слова мы считаем. Слова, которые вы понимаете – во время чтения или в речи другого человека – составляют ваш пассивный словарный запас. Слова которые вы сами используете в речи – устной или письменной – это ваш активный словарный запас. Когда кто-то говорит о том, сколько слов надо знать – имеется в виду пассивный словарный запас. Именно его можно, с той или иной точностью, измерить (как именно – поговорим ниже).

А вот измерить активный словарный запас намного сложнее, если вообще возможно. И действительно – как узнать, какие слова вы “могли бы” использовать? Конечно, теоретически можно, наверное, просканировать все когда-либо написанные вами тексты и пересчитать слова в них, но это тоже не идеальный метод. Может быть вы, как мальчик из анекдота, который не говорил, что суп несоленый, потому, что до сих пор суп был посолен нормально…

Для многих языков, в том числе и английского, нет особенной необходимости разделять письменный и устный словарный запас. За редкими исключениями, если вы можете прочитать слово, вы сможете его и понять на слух (вынесем за скобки акценты, эмоции, скорость или дефекты речи – все то, что делает восприятие на слух не таким уж простым). И наоборот, если вы “слышите” иностранное слово, вы практически наверняка узнаете его и в написанном тексте. Очевидный пример, где это не работает – китайский язык. Вы можете знать иероглиф и его значения, но не знать, как он звучит. Возможно и обратное – можно шустро общаться, но не знать ни одного иероглифа, за исключением самых базовых.

Возвращаясь к пассивному словарному запасу, еще одно отступление. С ним тоже все не так просто. Во-первых, как считать слова. Walk (гулять) – слово. Walked (гулял) прошедшая форма, образованная по элементарному правилу – пожалуй, не стоит его считать за отдельное слово. А если глагол неправильный? Чтобы выучить eat-ate-eaten нужно явно больше усилий, чем на какой-нибудь правильный глагол. А если это вообще другая часть речи – walk (гулять) и walk (прогулка), то наверное, стоит каждое посчитать за отдельное слово. Похожий вопрос с суффиксами и приставками – считать ли образованные с ними слова за отдельные слова. Дальше – сочетания слов: если вы знаете слово last (последний) и name (имя), то надо ли считать отдельным словом last name (фамилия)? А что с именами собственными, например Moscow (Москва)? Пожалуй, не стоит их считать. Но что тогда с January – строго говоря названия месяцев в английском языке – имена собственные. Ну и последнее: редко когда слово имеет ровно одно значение. Часто это целый “букет”, который раскрывается перед студентом по мере освоения языка. Если для начинающего fire – это “огонь”, то для продолжающего – это “уволить” или даже “стрелять” – должны ли все эти значения все равно считаться за одно слово?

У меня нет ответа на все эти вопросы. Да и вряд ли у кого-то есть, за исключением разве что профессиональных составителей словарей. Что я хочу этим всем показать. Само число слов, цифра, которую вы получили – едва ли имеет какую-то ценность. Есть смысл лишь сравнивать объемы словарного запаса, посчитанные примерно одинаковыми методами.

Так сколько слов надо знать?

Хорошо, скажет читатель. Я осознал всю эфемерную природу объема словарного запаса. И то, что гнаться за цифрами не имеет смысла – тоже, допустим, осознал. Но все-таки, давайте увидим хоть какие-то цифры – сколько слов знают ученики разных уровней, сколько знают носители языка, сколько знают дети носителей языка? И сколько надо знать, чтобы “знать английский”.

Начнем с объема словарного запаса для разных уровней изучения английского языка. Надеюсь, вы помните шкалу уровней знания языка CEFR – она как раз и была создана для того, чтобы унифицировать оценку языковых знаний и большинство курсов, учебников, экзаменов, так или иначе, ориентируются на шкалу CEFR. Несмотря на то, что CEFR – не про знание слов, а про то, что вы можете сделать, примерно оценить объем словарного запаса на каждом уровне всее-таки можно.

Вот такую таблицу я встретил на одном из сайтов – полностью согласен с этими оценками. Все здесь прекрасно – и как каждая следующая ступень вдвое выше предыдущей, и как волшебное число 3000 (о нем поговорим чуть позже) попадает прямо между B1 и B2. На всякий случай повторюсь: количество слов здесь – это лишь примерная оценка того словарного запаса, которым обладает студент каждого из уровней. К каждой цифре можете смело приписать “плюс-минус 25%”. В случае, если вы слишком увлеклись заучиванием списков слов – ваш словарный запас будет больше, чем в среднем для вашего уровня. Если же, наоборот, вы освоили искусство пантомимы, телепатии, лингвистической догадки и объяснения сложных слов через простые – вы можете быть на сравнительно высоком уровне, несмотря на не такой большой словарный запас.

Уровень CEFR Количество слов
A1 500
A2 1000
B1 2000
B2 4000
C1 8000
C2 16000

Что же касатся носителей языка, их словарный запас, как правило, составляет от 20 до 35 тысяч слов – это зависит и от возраста, и от образования, и от привычек читать книги в ранние годы жизни. Средний ребенок в четыре года будет знать 5000 слов, в восемь лет – 10.000 слов.

Предвижу следующий вопрос: раз есть цифра, то должен быть и список слов. Где он?

Где взять списки слов? И надо ли?

Список слов по уровням вам, скорее всего, не нужен. Дело в том, что слова, нужные на ранних уровнях, встречаются в языке чаще, на более высоких – реже. То, что встречается вам в процессе изучения английского – то вам и нужно; что запоминается – то и нужно было запомнить. Без всяких списков.

Нет – говорит настойчивый читатель, так не пойдет. Может очень нужное слово возьмет, и не встретится. Или, еще хуже – встретится, да не запомнится. Лучше иметь такой список под рукой, чтобы всегда иметь возможнность проверить, не пропустил ли я чего-нибудь важного.

Хорошо, согласен. В определенных ситуациях список может пригодиться. В первую очередь – если вы control freak, то есть одержимы чувством контроля над ситуацией, и спать не будете, зная, что популярное, но неизвестное вам слово может повстречаться вам на пути. Проверьте все по списку, и спите спокойно. Еще один вариант – если вам надо “запихнуть” в голову какой-то определенный объем знаний за короткое время – при этом вас не смущает ни то, что такие знания в голове не задержатся, ни то, что удовольствия в этом никакого нет. Ну или вы автор учебников и пишете уроки для определенного уровня. Если один из этих случаев – ваш, тогда вот, пожалуйста, списки:

wordfrequency.info

Список из 5000 английских слов, отсортированных по частоте их использования в современном американском английском. Используя этот список, вы сможете вырезать из него любой набор – самые популярные 100, 500, 1000 и т.д. слов – в соответствии с вашими потребностями. Кстати, в списке указана и речи – так что вы можете собрать себе список самых популярных глаголов, местоимений или междометий, если в этом есть необходимость.
https://www.wordfrequency.info/free.asp?s=y

“Специальный английский” голоса Америки

“Голос Америки”, один из самых известных “вражеских голосов”, который через все глушилки слушали жители Советского Союза. В своей английской версии легендарная станция использует “специальную” версию английского языка – дикторы говорят медленнее, избегают использования идиом и используют словарь в 1500 слов. Слова, которые выходят за рамки этого списка, но без которых нельзя обойтись, отдельно объясняются. Существует и словарь тех самых 1500 слов. Именно англо-английский словарь, а не список – так что если вы пытаетесь начать пользоваться англо-английским словарем, но “взрослая” версия пока тяжеловата – попробуйте словарь “голоса Америки”.
https://docs.voanews.eu/en-US-LEARN/2014/02/15/7f8de955-596b-437c-ba40-a68ed754c348.pdf

Список слов “Проекта Гутенберг”

Проект Гутенберг” – самая старая цифровая библиотека в мире, огромное собрание самых разных электронных изданий, находящихся в свободном доступе. На текущий момент (2018) в библиотеке более 57.000 книг. Список 40.000 слов из книг проекта можно найти в википедии. Вот первые 10.000 из них: https://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/PG/2006/04/1-10000

Список слов из фильмов и сериалов

Список слов, основанный на книгах, многие из которых написаны в прошлом и позапрошлом веке – возможно, не самый полезный список для изучения современного английского языка. Следующий список – противоположная крайность. Это список, составленный на основе текстов из фильмов и сериалов (всего в исходном материале было 30 миллионов слов – по моим подсчетам, это около 4000 часов видео, то есть около 50 сериалов “Друзья”). Вот первая тысяча слов: https://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/TV/2006/1-1000

Список слов из сериала “Симпсоны”

Завершая этот обзор списков слов – самый забавный экземпляр. 5000 слов из всех серий сериала “Симпсоны”, отсортированные по частоте: https://pastebin.com/anKcMdvk. Очевидно, в списке на высоких местах вы найдете “Homer” и “Bart“, а чего вы ожидали?

На этом закончим говорить про списки слов. Их много – каждый со своими достоинствами и недостатками. Проблема не в том, чтобы найти такой список: ищите “список самых нужных английских слов” в Яндексе или “list of vocabulary words for english learners” в Гугле – и вы найдете десятки таких списков. Проблема в том, что делать дальше. Об этом мы уже немного говорили в статье “Как учить английские слова“, а пока давайте вернемся к разговору о размере словарного запаса.

Как померить свой словарный запас

Следующий вопрос, который неизбежно у вас возникнет. А сколько слов я уже знаю? Теоретически, можно взять какой-либо из списков, отметить галочками знакомые слова и посчитать, сколько получилось галочек. Практически такой способ едва ли подходит, если вы знаете больше нескольких десятков слов (т.е. почти всегда). Что же делать?

В интернете есть десятки сайтов, предлагающих самые разные тесты, чтобы оценить словарный запас. К сожалению, большая часть из них – развлекательные тесты, в которых надо угадать значение тех или иных очень редких слов. Что, наверное интересно для носителей (и может быть студентов очень высокого уровня), но никакой практической пользы не несет. Если вы начали тест, и с самого начала пять-шесть раз нажали “не знаю” – похоже, вы встретили один из таких тестов. К счастью, не все тесты одинаково бесполезны: вот список ресурсов, на которые стоит обратить внимание:

Тест Лингва Лео

Среди огромного количества контента сервиса изучения английского Линва Лео есть и тест на объем словарного запаса. Вам будет показано 20-40 английских слов, глядя на которые надо ответить “знаю” или “не знаю”. Тест будет адаптироваться под ваши знания, показывая более сложные или более простые слова в зависимости от ваших ответов. В результате вы получите объем своего словарного запаса, посчитанный с точностью до одного слова (!).
Этот тест все же маркетинговая игрушка, но сделанная со знанием дела и основанная на правильных принципах.
https://lingualeo.com/ru/lexictest

vocabularysize.com

Следующий тест, вместо того, чтобы полагаться на вашу честность, показывает вам слова и предлагает выбрать определение. Определения будут на русском, так что такой подход подойдет и для начинающих. Тест сам по себе достаточно длинный (140 вопросов), но зато вы получаете объективную, подкрепленную состоятельной методологией, оценку своего словарного запаса. Из недостатков могу отметить лишь немного корявый перевод на русский, но на результат это никак не влияет.
https://my.vocabularysize.com

Тест Гентского университета (Бельгия)

Как так получилось, что один из тестов разработан в Бельгии – не спрашивайте, не знаю. Но тест у них получился интересный и вот почему. Как и в тесте Лингва Лео, вам будут показаны слова, на которые надо отвечать “знаю” и “не знаю”. А теперь подвох: если вы решили смухлевать, тест будет вас ловить. Часть из слов – ненастоящиее.  Если вы укажете, что такое слово вам знакомо – минус к вашему финальному результату. Очень интересная идея. Впрочем, результат разочаровал – вместо объема словарного запаса тест сообщит вам процент слов, который вы знаете. Процент от чего?
http://vocabulary.ugent.be/wordtest/start

Test your vocab

Последний, и, на мой взгляд, самый лучший тест – Test your vocab. Он тоже рассчитывает на вашу честность – вы просто ставите галочки напротив тех слов, которые знаете. А вот что отличает его от других: в тесте две части. Сначала вы указываете знакомые слова из общего списка из 40 слов, а затем уже из более длинного списка (около 100 слов), но специально сгенерированных так, чтобы слова оказались ровно на границе вашего словарного запаса.
http://testyourvocab.com

Сколько слов нужно для “свободного” английского

Итак, вы узнали объем своего словарного запаса. Дальше что? К какому значения нужно стремиться? На каком уровне наступит та самая “свобода”? Давайте разбираться.

Одна из самых низких оценок, которые я встречал – это 850 слов. Я согласен, что, обладая таким словарным запасом, плюс находчивость и стремление к достижению цели, можно решить любую проблему. Но комфортным назвать такое общение вряд ли возможно.

Следующая популярная оценка – 3000 слов, которые, согласно ее авторам, покроют 95% того, что может встретиться в английском языке. Вот это уже на что-то похоже. С таким словарным запасом вы действительно не будете испытывать затруднений в повседневных ситуациях. Но полностью с такой оценкой я согласиться не могу.

Дело в том, что в раных случаях “комфортный” словарный запас тоже разный. Если вы общаетесь с иностранцем один на один, если он, понимая, что английский для вас не родной, говорит медленно и разборчиво, фильтруя сложные слова – с запасом в 3000 слов вы действительно будете себя чувствовть увереннно. Если английский для вашего собеседника не родной – это еще больше снижает требования к словарному запасу. А вот если вы пытаетесь вклиниться в разговор носителей языка, вставить умное замечание, рассказать что-то интересное, посмеяться их шуткам, рассказать свою и, вообще, оказаться лингвистически “своим” – это уже совсем другое.

Интересная ситуация с фильмами и сериалами. С одной стороны, герои в них постоянно то шепчут, то орут, то вещают загробным голосом – и это совсем не помогает понимать их речь на слух. С другой стороны, в фильмах, как правило, достаточно контекста, чтобы догадаться об содержании разговоров. В случае, если это какой-нибудь боевичок, да еще если вы смотрите фильм в домашней обстановке, то перематывая и переслушивая ключевые непонятные места, можно успешно посмотреть фильм и с 3000 словами. А если с таким словарным запасом вы попытаетесь посмотреть разговорную драму в кинотеатре, то скорее всего выйдете с сеанса разочарованным.

Последнее, чтение. Сколько слов надо знать, чтобы без проблем читать художественную литературу? По интернету ходит “волшебный” список из тех самых 3000 слов, которые покроют 95% английской речи. Выучив его, говорят его создатели, вы сможете читать большинство английских текстов. Давайте попробуем разобраться, что здесь так, а что не совсем. В следующей табличке показано, сколько в среднем слов будет для вас непонятно в известных произведениях, если ваш словарный запас составляет одну, три или пять тысяч слов.

Книга Всего слов Уникальных слов % знакомых слов, если ваш словарь
1000 3000 5000
The Wonderful Wizard of Oz, L. Frank Baum 39582 2390 95% 100% 100%
Harry Potter and the Philosopher’s Stone, J. K. Rowling 77880 4744 88% 98% 100%
Harry Potter and the Order of the Phoenix, J. K. Rowling 264546 9248 86% 95% 98%
A Game of Thrones, George R. R. Martin 300622 8877 86% 96% 98%
The Martian, Andy Weir 104285 6091 87% 97% 99%
A Tale of Two Cities, Charles Dickens 137611 7950 85% 95% 98%
Ulysses, James Joyce 254415 11416 77% 89% 94%

Для тех, кто хочет поспорить с цифрами, вот как они получены: 1. Попытался объединить все словоформы, убрав окончания -ed, -ing, -s и так далее. 2. Прогнал тексты через анализатор текстов https://www.online-utility.org/text/analyzer.jsp. 3. Суммировал вхождения всех самых верхних 1, 3, 5 тысяч слов и поделил их на общее количество слов в произведении. Такой метод оценки совсем не идеален. Слова в произведении совершенно не обязательно будут встречаться в книге с той же частотой, что и во всем остальном языке. Но для приблизительной оценки должно хватить.

Оказывается, авторы списков top-3000 не обманули. 3000 самых популярных слов действительно покрывают 95% слов большинства литературных произведений. Но не спешите радоваться, подвох все-таки есть, но он в другом.

Есть такой лингвист Пол Нейшн, который как раз занимается вопросами объемов словарей при изучении иностранных языков. Он выяснил, что если в тексте есть 95% знакомых слов (т.е. в среднем незнакомо одно из 20 слов), лишь незначительное меньшинство способно достаточно хорошо понять его содержание. А когда знакомых слов становится 98% (то есть одно из 50) достаточное понимание текста происходит уже практически у всех.

Вот вв этом и подвох: 3000 слов – это уровень, на котором читать в оригинале книжки уже можно, но “комфортным” или “свободным” такое чтение назвать нельзя. Словарь по-прежнему придется все время держать под рукой, а некоторые фразы и даже предложения будут непонятны, даже когда вы посмотрели значение всех слов. С другой стороны, есть надежда, что вы понимаете достаточно для того, чтобы дочитать до конца. Особенно если книжка интересная. В большинстве же случаев заветные 98% достигаются, когда ваш словарь вырастет до 5000 слов. Хотя и тут не забывайте, что 98% – это не 100%. Одно слово из пятидесяти – а это пара слов на среднего размера абзац – будут по-прежнему незнакомы. Конечно, есть “лингвистическая догадка”, есть словари, есть специальные программы, выдающие перевод по одному клику, но все же усилий потребуется заметно больше, чем если бы вы читали текст на родном языке.

Зависит ваш уровень комфорта и от книги, которую вы выберете. Давайте посмотрим на примеры:

Wizard of Oz, классический пример детской литературы. Вы, возможно знакомы с книгой “Волшебник изумрудного города”, написаной “по мотивам” американской классики. Эта и подобные детские книжки не должны вызвать проблем при словаре в 3000 слов. Можно попробовать ее в качестве материала для чтения, даже если ваш словарь в районе 1000 слов. Да, будет не просто – но знакомый сюжет добавит шансов добраться до конца.

Harry Potter. Для многих книги о Гарри Поттере являются неким эталоном нужного уровня английского. Родители покупают детям книги о приключениях юного волшебника в оригинале, чтобы хоть как-то заставить их читать на английском; дети сами берутся за них, чтобы прикоснуться к волшебной вселенной самим, не через переводчика. На самом деле серия очень неоднородна – первые книги о Гарри Поттере – самые детские, со словарем в 4-5 тысяч слов. Это как раз комфортный уровень, если ваш словарный запас около 3000 слов. А вот к середине серии, когда события начинают принимать совсем мрачный оборот, усложняется и язык книги – здесь уже с таким словарем придется непросто.

Последние книги о Гарри Поттере по уровню сложности совсем не уступают следующим “взрослым” книгам, которые я выбрал для примера – Game of Thrones и The Martian. Обратите внимание,  в каждой книги вас ждут дополнительные сложности: “Игра Престолов” содержит много средневековых реалий и стилизаций под средневековую речь, а в “Марсианине” вас ждет немало научных и технических терминов. Но справившись с ними, и ту, и другую книгу будет относительно комфортно читать со словарем от 5000 слов.

Последние два примера – из классической английской литературы. Как типичный пример я выбрал A Tale of Two Cities, “Повесть о двух городах” Диккенса. И здесь 5000 слов – достаточный запас, чтобы замахнуться на хрестоматийное произведение. Последняя же книга – Ulysses, “Улис” Джойса, это, уж простите мне такую оценку, курьез. Эта зубодробительное классика будет не очень-то по силам не только тому, кто знает 5000 английских слов: с этим монументом англоязычной литературы испытывают сложности и многие образованные носители.

Вот пожалуй и все. Подводя итог: не нужно учить списки слов, пытаясь нарастить себе словарный запас – само по себе знание слов не достаточно для прогресса. Впрочем, это работает в обратную сторону – достигув определенного уровня, по дороге вы набираете словарь определенного размера. Специальные программы в интернете позволяют померить его сравнить с носителями – которые, как правило, знают от 20 до 35 тысяч слов. В повседневной жизни, как правило, достаточно намного меньшего словарного запаса. Здесь вы можете ориентироваться на объем в 3000 слов, хотя их будет недостаточно, чтобы с комфортом читать то, что вы обычно читаете в переводе.