Рукопись Войнича — давняя лингвистическая загадка. Никому пока не удалось догадаться, на каком языке написан этот текст. Сколько ни пытались ее разгадать, рукопись не поддавалась. В мае этого года появилась информация о новой попытке дешифровки рукописи Войнича, однако довольно быстро стало ясно, что и на этот раз, увы, решения нет. Лингвист Максим Руссо разбирает, почему новый вариант никуда не годится, а заодно рассказывает о том, что же такое прароманский язык.
В 1912 году Григорианский университет в Ватикане испытывал денежные затруднения, и управляющий университетом орден иезуитов решил исправить положение, продав негласно некоторое количество старинных книг. Покупателем стал живущий в Лондоне библиофил польского происхождения Вильфрид Войнич (Wilfrid Voynich). Отправляясь в Италию, он, несомненно, рассчитывал на интересные приобретения, но не догадывался, что один из выбранных им манускриптов так и останется навсегда связанным с его именем.
Открыв знаменитый кодекс, мы увидим множество непонятных рисунков: растения, обнаженные женщины в ваннах, звезды, непонятные диаграммы, сосуды. Рядом с ними располагается текст (более 170 тыс. знаков, около 35 тыс. слов), но он не внесет ясность. Использованный в рукописи алфавит («шрифт Войнича») не встречается больше ни в одном документе, и мы до сих пор не знаем, на каком языке написана рукопись Войнича и о чем в ней говорится. За сто с лишним лет десятки людей, от любителей до специалистов Агентства национальной безопасности США, безуспешно пытались прочесть этот текст.
Утро 15 мая началось для меня с известия, что рукопись Войнича наконец-то расшифрована. Увы, довольно быстро стало понятно, что сенсация не состоялась. Предложенная гипотеза мало чем отличалась от вариантов прочтений рукописи Войнича, появляющихся примерно раз в год. Но новому варианту удалось получить куда более широкую известность, поскольку автор сумел опубликовать свою работу в научном журнале, а Бристольский университет выпустил по этому поводу пресс-релиз. Пресс-релиз попал в ведущие агрегаторы научных новостей (Eurekalert.org, Phys.org и т. д.), откуда берут материал для своих текстов крупные медиа. Публикации в СМИ стали материалом для новостей в других изданиях, и волна сообщений успешно распространилась по всему миру.
Нынешняя гипотеза достойна подробного рассмотрения именно как типичная попытка прочтения рукописи Войнича. Ее автор — Джерард Чешир (Gerard Cheshire), биолог и автор большого количества научно-популярных книг на самые разные темы, от эволюционной теории до истории почты. Свою статью о рукописи Войнича Чешир опубликовал в журнале Romance Studies [1], специализирующемся на исследованиях в области культуры и литературы романских народов. Лингвистические работы в этом журнале появляются редко. Ранее Чешир выложил две статьи о рукописи Войнича на сайте лингвистических препринтов [2, 3].
Чеширский подход
Биолог утверждает, что сумел установить значения букв рукописи Войнича и прочитал ряд фрагментов текста. Язык этого текста Чешир определил как «прароманский», то есть язык-предок для современных языков романской группы: испанского, французского, итальянского и других. Основываясь на прочтении подписи к одному из рисунков, Чешир пришел к выводу, что он изображает карту Неаполитанского залива и извержение вулкана, случившееся там 4 февраля 1444 года. Далее он делает вывод, что рукопись была написана на острове Искья для королевы Марии Кастильской (1401–1448), жены Альфонсо V Великодушного (1396–1458), короля Арагона и Неаполитанского королевства. Резиденция королевской четы — так называемый Арагонский замок — располагалась на небольшом островке рядом с Искьей. Рукопись Войнича, по мнению Джерарда Чешира, представляет собой нечто вроде справочника, составленного для королевы монахинями и посвященного преимущественно медицине. Это хорошо согласуется с полученной ранее радиоуглеродной датировкой пергамена — 1404–1438 годы [4].
Подход Джерарда Чешира к переводу текста заключается в том, что он ищет для каждого слова какой-либо сходно звучащий аналог в одном из романских языков, а потом из последовательности таких слов строит осмысленное предложение или словосочетание. При этом в одном предложении могут идти друг за другом каталонское, старофранцузское, испанское, румынское, снова каталонское и португальское слова. Никаких попыток осмыслить реконструируемый текст как грамматическую структуру не делается. «Прароманский язык» в понимании Чешира предстает набором слов романского происхождения, без каких-либо грамматических показателей, аналитических форм глаголов, правил порядка слов в предложении и тому подобного.
Аналогичным образом можно было бы объявить язык рукописи Войнича, например, пратюркским и подобрать чтения букв так, чтобы у идущих подряд слов нашлись соответствия то в чувашском, то в башкирском, то в якутском, то в тувинском языке. Но как пратюркский язык не был смесью слов разных тюркских языков, так и прароманский — смесью слов своих языков-потомков. Напротив, сильное сходство со словами из поздней эпохи должно вызывать скептическое отношение к тексту на «праязыке»: чтобы получить свой нынешний облик, слова праязыка должны были пройти длительную эволюцию. И в каждом языке-потомке изменения происходили по собственным законам.
Наиболее разительным примером стало словосочетание, которое Чешир транслитерирует как omor néna и переводит как «мертвый ребенок», связывая с румынским глаголом omor «убивать» и испанским niña ‘девочка’. При этом румынское слово omorî «убивать»; (omor — форма первого лица единственного числа) на самом деле является славянским заимствованием (уморити) [5] и никак не могло попасть в язык документа, написанного в XV веке далеко от Румынии.
Сейчас эта рукопись хранится в Библиотеке редких книг и рукописей Бейнеке Йельского университета. Она невелика — формат 23,5х16,2 см, толщина 5 см. Рукопись написана на пергамене, сшитом в 18 тетрадей, которые в общей сложности насчитывают около 240 страниц (точное количество зависит от того, как считать некоторые страницы, сложенные дополнительно по горизонтали). Кто-то из владельцев книги проставил номера страниц, и благодаря этому ясно, что ранее в рукописи было не менее 20 тетрадей и 272 страниц.
Иногда для достижения осмысленного перевода приходится использовать неочевидные значения романских слов. На листе 53 одно из слов Чешир читает как lanasa. Ему известно итальянское lanoso («покрытый шерстью, пушистый»), но данное значение не подходит для общего контекста. Поэтому он вспоминает слово испанское lanas (множественное число от lana, «шерсть»), которое на жаргоне обозначает деньги, и использует для перевода именно его. Разумеется, нет никаких доказательств, что такое обозначение денег существовало за пределами Испании в XV веке и могло быть использовано в книге, предназначенной для королевы.
Помимо сомнительности метода, которым Чешир пытается читать рукопись Войнича, составляя предложения из наборов слов на разных романских языках, в его работе есть и серьезный изъян общего порядка. Чешир называет язык рукописи прароманским. Ссылки на три работы, которые он приводит при первом упоминании этого языка, не оставляют сомнения, что имеется в виду именно язык-предок всех романских языков. В таком случае получается удивительный факт: текст на прароманском языке, по утверждению Чешира, был написан в XV веке.
Хромой на хронологическую ногу
Прароманский язык действительно существовал. Чаще всего для его обозначения используется термин «народная латынь». Разговорные формы классического латинского языка, существовавшие в разных провинциях Римской империи, со временем накопили местные особенности и постепенно обрели письменную форму, а затем развились в полноценные языки.
Хронологию этого процесса оценивают по-разному. Большинство ученых склонны считать, что серьезные диалектные отличия имелись в региональных вариантах народной речи уже в Римской империи, а к VI–VII векам уже можно было говорить о существовании отдельных романских языков и диалектов. Существует другой взгляд, принадлежащий Г. Ф. Маллеру [6] и его последователям, согласно которому единство разговорного романского языка сохранялось до конца VIII века благодаря активной коммуникации между разными регионами, а расхождение романских языков началось только после распада державы Карла Великого. Но даже при таком подходе считается, что к IX веку романские языки уже были самостоятельны.
Напомним, что и Чешир, и другие исследователи рукописи Войнича согласны в том, что текст написан не ранее XV века. К тому времени история основных романских языков насчитывала уже несколько столетий. В XI веке уже существовала обширная литература на старофранцузском. Лишь немногим позже развитые литературные традиции возникли на провансальском, испанском (как минимум в четырех центрах: Кастилии, Арагоне, Галисии и Каталонии), на разных вариантах итальянского (в Тоскане, Болонье, Умбрии, на Сицилии). К моменту создания рукописи Войнича уже существовали «Песнь о Роланде», «Песнь о моем Сиде», произведения Бертрана де Борна, Кретьена де Труа, Хуана Руиса, Гвидо Кавальканти, Петрарки, Боккаччо, Данте и сотен менее знаменитых авторов. Романские языки проникали в юридические документы, постепенно вытесняя оттуда классическую латынь.
И вдруг в середине XV века в окрестностях Неаполя, если верить Джерарду Чеширу, кто-то пишет целую книгу на прароманском языке (забудем на секунду, что получающиеся тексты не имеют ничего общего с тем, что нам известно о народной латыни). Появление такой книги настолько же невероятно, как и написание в ту же эпоху книги на праславянском или прагерманском.
Lingua franca Средиземного моря?
Существует, правда, другой вариант, который объяснил бы появление в XV веке текста, похожего сразу на несколько романских языков. Речь идет о сабире, или «средиземноморском лингва-франка», возникшем около XI века и существовавшем несколько столетий. Он представлял собой пиджин на романской (преимущественно итальянской) лексической основе и использовался в качестве языка-посредника при общении европейских моряков и торговцев с арабами и позже турками в Средиземном море.
Об этом языке сохранилось не очень много информации. Элементы сабира использовал Мольер в «Мещанине во дворянстве» (сцена, где герои притворяются восточными купцами) и Гольдони в комедии «Импресарио из Смирны». Дольше всего, примерно до конца XIX века, сабир сохранялся в Северной Африке, в 1830 году был даже издан словарь этого языка для нужд французских военных и администрации в Алжире [7]. Подробные сведения о сабире можно почерпнуть из подборки материалов, составленной профессором Аланом Корре и включающей глоссарий [8], и из статьи Кита Уиннома [9], предложившего оригинальную концепцию развития пиджинов, где сабир играет важную роль.
В одном из мест работы Чешира употребляются слова lingua franca, но до конца неясно, использует ли он их для обозначения средиземноморского средневекового пиджина или в качестве термина, обозначающего язык-посредник, который ни для кого из говорящих не является родным (в этом значении термин «лингва-франка» используется в социолингвистике). Но Чешир в любом случае настаивает на прароманском характере языка рукописи Войнича, а сабир вовсе не был похож на народную латынь. Одна версия исключает другую. Судя по списку использованной им литературы, ни к одному исследованию сабира Чешир не обращался, а предлагаемые им чтения не содержат ничего похожего на сабир.
Среди прочтенных им подписей к рисункам рукописи Войнича Чешир также упоминает названия месяцев, сопровождающие рисунки знаков зодиака. Но это не его достижение. Они, наряду еще с несколькими строчками, записанными не «шрифтом Войнича», а средневековой латиницей, известны уже давно. Правда, до сих пор неясно, были ли они написаны одновременно с основным текстом или добавлены в книгу потом.
Как читали рукопись Войнича
Ранее рукопись Войнича пытались читать на древневаллийском, маньчжурском, «неизвестном северогерманском диалекте», средненемецком, иврите, китайском, староиспанском, старонидерландском, староосманском, арабском, латыни [10], «креольском языке на основе фламандского» [11] и языке науатль [12]. И это не считая совсем уж анекдотических попыток, вроде сообщения, будто в рукописи Войнича искусственным алфавитом записан текст на украинском языке, причем без гласных — такое утверждалось в книге «Письмо к Глазу Бога» Джона Стойко, наделавшей немало шума среди украинской диаспоры в США в конце 1970-х годов [13, 14]. Предыдущая попытка, сделанная в 2016 году и распространившаяся в медиа в начале 2018 года, включала использование искусственного интеллекта и была опубликована в журнале по компьютерной лингвистике (Transactions of the Association for Computational Linguistics, [15]). В том варианте дешифровки точно так же игнорировались законы развития языков и банальная хронология.
Если авторы гипотезы сохраняют здравый смысл и не пускаются в фантазии, то они обычно могут предъявить чтения лишь отдельных слов и фраз из рукописи Войнича. Что неудивительно, ведь объем текста довольно велик, и при известном старании в нем можно подобрать строчку или несколько, идеально ложащихся в текст на выбранном языке. Остается только заменить буквы «шрифта Войнича» на нужные.
Поэтому не надо спешить радоваться, услышав очередное сообщение о расшифровке рукописи. Достойной внимания гипотеза будет только тогда, когда ее автор сможет прочитать хотя бы несколько подряд идущих предложений, и это чтение будет не набором слов, получающим смысл только в устах интерпретатора, а связным текстом на соответствующем языке. Но всё это будет верно при условии, что рукопись Войнича действительно представляет собой текст на естественном языке, а не мистификацию неизвестного нам автора XV века, изобразившего фантастические буквы рядом с не менее фантастическими рисунками.
Максим Руссо,
лингвист, научный журналист
- Cheshire G. The Language and Writing System of MS408 (Voynich) Explained // Romance Studies, DOI: 10.1080/02639904.2019.1599566
- Cheshire G. Linguistic Missing Links
- Cheshire G. Linguistically Dating and Locating Manuscript MS408
- uanews.arizona.edu/story/ua-experts-determine-age-of-book-nobody-can-read
- Ciorănescu A. Dicţionarul etimologic al limbii Române. Bucureşti. 2007. P. 560.
- Muller H. F. A chronology of vulgar Latin. Hildesheim, 1970 (первое издание — Halle, 1929).
- Dictionnaire de la langue franque ou petit Mauresque suivi de quelques dialogues familiers et d’un vocabulaire de mots arabes les plus usuels. A l’usage des français en Afrique. Marseille. 1830
- A Glossary of Lingua Franca. Fifth edition. Ed. Alan D. Corré. 2005
web.archive.org/web/20090203083909/; uwm.edu/~corre/franca/go.html - Whinnom K. Lingua franca. Historical problems // A. Valdman and A. Highfild (eds.) Pidgin and creol linguistics. New York. P. 295–310.
- ciphermysteries.com/the-voynich-manuscript/voynich-theories
- Levitov L. Solution of the Voynich Manuscript: A Liturgical Manual for the Endura Rite of the Cathari Heresy, the Cult of Isis. 1987. Laguna Hills, California: Aegean Park Press.
- Tucker A. O., Talbert R. H. A Preliminary Analysis of the Botany, Zoology, and Mineralogy of the Voynich Manuscript // HerbalGram. The Journal of the American Botanical Council. 2013. 100. P. 70–75
- Stojko J. Letters to God’s Eye: The Voynich Manuscript for the first time deciphered and translated into English. 1978. New York: Vantage Press.
- Русина О. До «неможливих джерел» вітчизняної історії: «Рукопис Войнича» в українському контексті // Harvard Ukrainian Studies. Vol. 32–33 (2011–2014). Part 2. P. 611–618
- Transactions of the Association for Computational Linguistics. Vol. 4. P. 75–86, 2016
У нас даже проект есть на издание перевода) https://planeta.ru/campaigns/113232
«Если авторы гипотезы сохраняют здравый смысл и не пускаются в фантазии, то они обычно могут предъявить чтения лишь отдельных слов и фраз из рукописи Войнича.». Гм, а что, разве неведомый автор имитации мог написать длинный текст не используя, даже и неосознанно, привычные языковые формы? Тогда вопрос — а что это за формы? Может это выход на характеристики автора? А если они не найдены, то такое видимо было бы возможным только для ИИ, работающего в режиме случайного выбора. Такое трудно представить для того времени. Т.е., может попробовать изменить подход — не угадывать исходный язык, а попробовать искать неизбежно долженствующие проявиться привычные автору мистификации языковые формы? Ну и, в конце концов, если вроде есть неизвестно кем-как-когда оставленные развалены сооружений, почему не предположить неведомо как сохранившегося остатка неведомого языка? И тогда попробовать проследить его связи. При этом правда — если рукопись не подделка — возникает проблема рисунков. Если еще можно, с горем пополам, предположить возможность языка некоей сгинувшей цивилизации, то предположить возможность существования страны с неведомыми растениями практически невозможно.