Русский национальный

Ирина Левонтина
Ирина Левонтина

А вот и нет, совсем не про политику. Речь о том, что 29 апреля 2014 года исполнилось 10 лет Национальному корпусу русского языка. Я, кстати, и сама не знала, что день рождения у НКРЯ в один день с замечательнейшим лингвистом А.А.Зализняком. НКРЯ — «это информационно-справочная система, основанная на собрании русских текстов в электронной форме». Сейчас общий объем Корпуса — более 500 млн слов. Делает его блестящая команда лингвистов — специалистов по так называемой корпусной лингвистике, при участии разных организаций, прежде всего Яндекса и Института русского языка им. В.В.Вино­градова РАН. Отметим, что в мире корпусная лингвистика вообще сейчас бурно разви­вается, ср., например, один из образцовых корпусов — Британский национальный кор­пус (BNC) (www.natcorp.ox.ac.uk).

Корпус — это не просто большое собрание текстов. Это собрание сбалансированное (тексты разного типа отобраны в определенной пропорции). При этом для конкретной задачи можно выбрать тексты того или иного жанра, времени и т.п. Например, можно за­дать такой подкорпус: поэтические тексты с автором — женщиной до 1950 года рожде­ния. Искать по массиву текстов можно определенную словоформу или сочетание слов, а также два или более слов, находящихся в тексте на указанном расстоянии друг от дру­га, а также можно задать не слово, а грамматическую форму (например, чтобы изучить модель управления глагола). И много еще чего можно делать. И разумеется, со всяче­ской статистикой.

Например, недавно я пыталась выяснить, как за последние 100 лет изменилось произ­ношение слова артель, и воспользовалась, в частности, МУРКО — мультимедийным кор­пусом, входящим в НКРЯ. Как же было здорово, нажав кнопку, моментально получить 17 отрывочков из фильмов, где это слово произносят! Замечательно, что Корпус все рас­тет и растет, а его поисковые инструменты все изощряются и изощряются. Собственно, все можно посмотреть на сайте НКРЯ — www.ruscorpora.ru.

С появлением НКРЯ жизнь лингвистов-русистов очень украсилась. То, на что у нас рань­ше уходили годы (выискивание примеров по текстам, сортировка пыльных карточек с вы­писанными контекстами), теперь достигается за несколько секунд и в гораздо большем объ­еме. А для лексикографов настала просто райская жизнь! Правда, замечу, что это привело и к появлению большого количества лингвистических работ, выполненных по принципу «на­ливай и пей»: прогоняешь какое-нибудь слово через Корпус — и готово дело. А там есть еще такая чудная кнопочка — «Показать распределение по годам». Нажимаешь — и выскакива­ет красивый график. И пожалуйста — научная статья: вот, мол, такое-то слово, в такие-то годы столько-то, вот столько-то процентов во множественном числе, а в таком-то жанре столько-то. Хочется спросить: «И?». В молодом поколении лингвистов многие убеждены, что это-то и есть настоящая наука, а, скажем, проводимый вручную тонкий семантический анализ — это так, пережитки прошлого. Ну да ничего, будем надеяться, что это детская болезнь и она пройдет.

Помимо собственно научной работы, Корпус еще изумителен тем, что теперь можно получать какие-то предварительные ответы на возникающие в ходе жизни лингвисти­ческие вопросы. Дело в том, что наш индивидуальный языковой опыт очень ограничен и обычно слабо отрефлектирован. И Корпус позволяет нам выйти за его пределы. При­веду несколько примеров из последнего времени.

Подруга-редактор спросила меня, насколько вообще допустимо тавтологическое со­четание денежные купюры. Этот очень легкий вопрос для Корпуса (денежный + купюра на расстоянии 1). Оказывается, такое встречается нечасто (48 вхождений при том, что само слово купюра зафиксировано 1430 раз), но в том числе и у хороших авторов: С.Довлатова, И.Грековой, В.Дудинцева, А.Азольского, Д.Рубиной и др. Ну а дальше — дальше каж­дый сам решает, достаточные ли это для него авторитеты.

Или вот в последнее время многие заметили, что помимо нормативного варианта в Дон­бассе и из Донбасса в литературной речи начал распространяться вариант на Донбассе и с Донбасса (понятное дело, региональное влияние). Тут надо заметить, что как раз в данном случае провести серьезное социолингвистическое исследование с привязкой к террито­риям НКРЯ (пока) возможности не дает. В прошлой колонке про поребрик я упоминала не­которые другие инструменты, которые можно тут использовать. Но Корпус позволяет бы­стро прикинуть, действительно ли раньше в литературной речи такого не встречалось. Как выражался В.С. Черномырдин, Сроду такого не было, и вот опять то же самое. Вообще-то этот вариант и раньше встречался — и у приличных авторов: Мои родители, которые всю жизнь зачем-то колесили по всем доступным им пространствам, привезли меня из Таджи­кистана в город Первомайск на Донбассе [Владимир Войнович. Замысел (1999)]; Бабка моя даже завидовала, что сестра успела походить в мехах и бриллиантах, пока она с мужем ра­ботала то в Карелии, то на Донбассе [Валентин Курбатов. Дорога в объезд (1999)]; Так на Донбассе и остался на эту зиму: что-то там с железными дорогами [Ирина Ратушинская. Одесситы (1998)]. Но, конечно, довольно редко, в Донбассе во много раз чаще.

Интересно, что аналогичное с Донбасса попадается почаще, причем есть и довольно ста­рые примеры: Я вот мастер коксовых печей, с Донбасса, а приехал сюда — печей-то еще не построили, послали меня на работу в профорганизацию [А.Г. Малышкин. Люди из захолустья (1938)]; Я еще мог бы понять, если наша армия послана для демонстрации, чтобы любой це­ной оттянуть силы белых с Донбасса.. [А.Н. Толстой. Хождение по мукам/ Книга третья. Хму­рое утро (1941). Но вот у Лимонова, например, более стандартно: Маленький гениальный еврей, недоучившийся в Горном институте, бежал в Харьков из Донбасса, где он вот уже несколько лет работал мастером на шахте [Эдуард Лимонов. Молодой негодяй (1985)]

Я очень люблю пользоваться поэтическим корпусом НКРЯ для уточнения вопросов, связанных с ударением (слава русской силлабо-тонике!). Вот недавно по понятному по­воду в сети обсуждали стихотворение Демьяна Бедного 1923 года «Социал-траурным предателям»: В бессильном трауре немецкая столица, / Повсюду траурные лица. / Что ни процессия, то — вот она, гляди! / Колонна социал-прохвостов впереди, / Предате­ли! Трусы! Забейте ватой уши / И трауром густым закройте зеркала: / Вы обнажили до­гола / Свой развращенный ум и слякотные души!

Многие обратили внимание на странное ударение трусы́ вместо тру́сы. Народ очень ве­селился, шутил, что, мол, с бельем все очень логично выходит трусы́ обнажили догола свой развращенный ум. В общем, поэта каждый может обидеть, но Корпус говорит нам, что та­кой вариант был: Фелицы слава, слава Бога, / Который брани усмирил, / <...> Который оком лучезарным / Шутам, труса́м, неблагодарным / И праведным свой свет дарит; [Г.Р. Держа­вин. Фелица (1782)]; Что забывших про долг и про честь / Беглецов и предателей много / У несчастной их родины есть; / Что трусо́в малодушных не счесть; / Но что больше всего равнодушных, / Беззаботно насилью послушных [М. О. Цетлин (Амари). Аист (1906)].

Разумеется, это не ответ на вопрос, почему у Демьяна Бедного такое ударение: тут надо было бы подробнее смотреть диалекты, исследовать его язык, надо изучить исто­рию этого слова. Но мы можем сразу сказать, что не то чтобы тут поэт переставил уда­рение, чтобы слово влезло в стих, не станем дразнить его, как у Горького Настя Барона: «Не было этого! Ничего не было!» Я ужасно не люблю, когда в сети такие Насти авто­ритетно заявляют: так, мол, никогда не говорили, такого не бывает, да еще и объясняют почему. У меня всегда в таких случаях рука сама так и тянется к закладке «НКРЯ». Хо­рошо, что она есть. В общем, Happy birthday!

6 комментариев

  1. Почему-то мне кажется, что это совсем новое явление (вероятно, следствие того, что в информационной войне начали принимать участие широкие массы) — множество слов и выражений употребляются только одной стороной и не употребляются другой. Просто навскидку: на Украине, в Донбассе, майдауны, бандеровцы, бандерлоги, хунта. С другой стороны: в Украине, на Донбассе, титушки, террористы, ватники, шашлык по-колорадски.

    1. Это явление всеобщее и всегдашнее. Например, тексты на русском языке, публиковавшиеся «Правдой» и «Голосом Америки» в 1975 году, очень легко отличить по одной лишь лексике, даже не вдумываясь в смысл. Вероятно, то же относится и, например, к текстам на английском языке от 1780 года происхождением из Лондона и Бостона.

  2. Кстати, рекомендую НКРЯ всем литераторам, пишущим исторические романы. Можно в минуту проверить, употреблялось это слово в описываемую эпоху или нет (чтобы не лажануться). Из своего опыта: оказалось, что выражение «крыша поехала» фиксируется только после 1950-х годов, поэтому в речи персонажа 1910-х годов, даже в стельку пьяного, его использовать не стоит.

Добавить комментарий

Ваш адрес email не будет опубликован.

Оценить: