Какой словарный запас был у Льва Николаевича Толстого?

О чем чаще всего думают его герои, когда смотрят на небо? Что значат гиль и фанаберия и сколько раз в «Анне Карениной» встречается слово поезд? Чем занимался Толстой летом 1883 года, когда ему не писалось, и как мотивировал свой отказ от Нобелевской премии? Полная оцифровка литературного наследия с применением разметки TEI позволяет узнать о Толстом почти все, а его произведения — изучить от корки до корки.

В ноябре команда Tolstoy Digital запустила проект «Слово Толстого» — цифровой путеводитель по наследию писателя, созданный на основе 90-томного собрания сочинений. Еще 10 лет назад доступ к полному собранию Льва Толстого был лишь у редких обладателей 90-томника. С 2013 года, после запуска проекта «Весь Толстой в один клик», тексты томов появились в свободном доступе в электронном виде. В 2022 году, после восьми лет работы, команда Tolstoy Digital выпустила семантическое издание собрания сочинений Толстого.

Семантическое издание — это своего рода база данных, в которой тексты писателя размечены метаданными: например, жанры и темы для произведений, адресаты — для писем, даты написания — для дневников. Такая система способна отвечать на сложные поисковые запросы: например, сколько раз в письмах Толстого из Ясной Поляны встречается слово «снег». Цифровой путеводитель позволяет видеть черновики произведений и искать в них отдельные слова и фразы.

Редакторы проекта подбирают их вручную: «Ездил за дровами. Погода гадкая, простудился (Дневник. 10 января 1853 г.)». Тайм-лайн жизни писателя, составленный литературоведом Львом Соболевым и проиллюстрированный праправнучкой писателя Натальей Толстой, выделяет 22 основных события в жизни писателя, одно из которых — отказ от авторских прав на тексты, написанные до 1881 года. Поступить еще радикальнее и вовсе отказаться от собственности ему не позволила семья.

Важнейшая функция «Слова Толстого» — поиск по всему наследию автора. Параметры поиска могут быть самыми простыми — скажем, по времени написания. Посмотрим 1835 год. К нему относятся первые дошедшие до нас тексты Толстого. Для рукописного журнала «Детские забавы», который семилетний Лева издает вместе с братьями, он сочиняет крошечных рассказа "Орел" и "Сокол" за подписью «Граф Ль. Ни. То.»: «Сокол есть очень полезная птица она ловит газелей. Газель есть животное которое бегает очень скоро, что собаки не могут его поймать, то сокол спускаеться и убивает».

А по одному слову — велосипед — можно найти, например, дневниковую запись от 25 апреля 1895 года (даты на сайте указаны по старому стилю): 67-летний Толстой фиксирует свои первые занятии, которое его «ребячески веселит»: «За это время начал учиться в манеже ездить на велосипеде. Очень странно, зачем меня тянет делать это. Е. Иванович отговаривал меня и огорчился, что я езжу, а мне не совестно. Напротив, чувствую, что тут есть естественное юродство, что мне все равно, что думают, да и просто безгрешно, ребячески веселит».

В том же поисковом запросе можно заметить, что велосипед встречается в вариантах «Анны Карениной». Варианты и черновики подробно отражают историю текста: что было зачеркнуто самим Толстым, что написано неразборчиво, а что вставлено, что менялось при корректуре, а что — на стадии наборных рукописей. «Сохранилось очень-очень много черновиков Толстого — это редкость. Так что большая часть его творческой лаборатории представлена в 90-томнике», — говорит руководитель проекта и праправнучка писателя Фекла Толстая. Так, в вариантах «Анны Карениной» можно заметить, что первый набросок романа был назван Толстым "Молодец баба" и начинался не со знаменитой фразы о семейном благополучии, а так: «Гости после оперы съезжались к молодой Княгине Врасской», будущей Бетси Тверской.

У каждого произведения на сайте есть карточка с дополнительными сведениями: кратким описанием, которые Лев Соболев подготовил специально для проекта, черновиками, вариантами, комментариями, а иногда и со списком книг, к которым Толстой обращался во время работы над разными произведениями. Такой метод организации текстов — через их разнообразную связанность друг с другом — создатели проекта называют семьей произведений.

«"Слово Толстого" — проект, где мы реализуем вещи, которые в компьютере можно сделать элегантнее, чем на бумаге. Мы создаем базу, открытую для дополнений информации без разрушения ткани контекста. Еще одна очень важная вещь — digital preservation — сохранение важных знаний в цифровом виде, создание пространства знаний, где на основе собранных данных можно создать новые проекты», — объясняет куратор лингвистической части проекта, специалист по Digital Humanities Анастасия Бонч-Осмоловская.

Для более детализированного поиска можно перейти в режим «Не все так просто» и выбрать дополнительные фильтры: точное вхождение (поиск слова в нужном роде, числе и падеже) или параметры переписки (дата, место написания, имя конкретного адресата и статус письма — отправлено или не отправлено). Кому, например, Толстой писал из Ясной Поляны об анковском пироге (традиционной сласти в доме Толстых, ставшей для писателя символом буржуазного уклада)? Т. А. Кузминской:

«Без тебя был Фрей — ты слышала — он интересен и хорош не одним вегетарианством. <...> Он интересен тем, что от него веет свежим, сильным, молодым, огромным миром американской жизни (несчастной по твоему, потому что она вне Анковского пирога), не только не признающей анковского пирога, но представляющей себе его чем то в роде колец в носу и перьев на голове и пляски диких. Он 17 лет прожил большей частью в русских и американских комунах, где нет ни у кого собственности, где все работают не „головой“, а руками и где многие и мущины, и женщины счастливы очень».

Люди, о которых и к которым писал Толстой, размечены во всем корпусе текстов: при переходе на карточку персоны можно узнать, что Татьяна Андреевна Кузминская была свояченицей Толстого, а Вильям Фрей — писателем, идеологом непротивления и вегетарианства. Всего в справочнике "персоны" появится информация о десяти тысячах человек — искать их можно по алфавиту или по темам. Система прошита внутренними гиперссылками: сейчас из карточки Татьяны Кузминской можно перейти на всех корреспондентов Толстого, а в будущем появится функция перехода на все случаи упоминания Кузминской в корпусе. Корреспондентов у писателя было около трех тысяч: от императора Александра II и знаменитых современников — Ге, Кони, Витте, Чайковского, Герцена, Тургенева, Дюма, Рильке — до крестьянина Петра Куксова из Таврической губернии, просившего Толстого разъяснить непонятный ему смысл нескольких глав из «Откровения» Иоанна Богослова.

В последние годы жизни Толстой вел очень насыщенную переписку: на самые интересные письма отвечал сам, а часть передавал жене и литературным секретарям. Дневники и письма показывают Толстого живым — страдающим, ленивым, нежным, ироничным, любящим. «Душенька дяденька Фетинька. Ей Богу душенька, и я вас ужасно, ужасно люблю. Вот те и всё», — писал Толстой Фету 24 октября 1859 года. 

Редкие и устаревшие слова, возникающие в текстах Толстого, отмечены в корпусе зеленым цветом и кликабельны. В словаре редких слов можно найти их значения, примеры употребления и классификацию, составленную лексикографом Ксенией Костомаровой. Например, ботвинья означает холодное блюдо из кваса, вареной зелени и рыбы и встречается на столе у Вронского во время званого обеда. А свайка — народная игра, за которой Пьер Безухов наблюдает на Бородино: офицеры кидали большой толстый гвоздь в лежащее на земле кольцо. Необычные цвета для Толстого тоже не редкость: от разномастных лошадей — игреневой (рыжей со светлой гривой) в «Войне и мире» и мухортого (гнедой с желтоватыми подпалинами) в «Хозяине и работнике» — до прюнелевых (черных с синим отливом) ботинок и башмачков. «Жасминная помада прекрасная вещь и прюнелевые ботинки тоже, и зонтик тоже, но нейдут как-то они к моим понятиям о Кавказе» — находим мы в неоконченном очерке «Поездка в Мамакай-Юрт».

Многомерная архитектура текстов и поиск с разными фильтрами позволяет исследователям создавать новую систему описания языка, растолковывать тексты, слова и выражения. В планах команды Tolstoy Digital «Словарь языка Толстого», инфографические карты наследия писателя и подкорпус в Национальном корпусе русского языка. Куратор технологической части проекта Борис Орехов предлагает взглянуть на Толстого через призму цифр: «Толстой велик, но насколько он велик?! Теперь мы можем оценить цифрах, что невозможно было сделать до сих пор. Например, мы знаем, сколько именно слов в 90-томнике принадлежат Толстому: если говорить о русских словах, то около 8 миллионов слов». Для сравнения, в романе Гончарова «Обломов» — около 150 тысяч слов, а весь «Тихий Дон» Шолохова — всего лишь 440 тысяч слов. Частотность слов наглядно показывает, что любимое существительное Толстого — «человек», оно встречается 66 493 раза. А полный словарный запас писателя — около 105 тысяч слов. Помните Эллочку Щукину из «Двенадцати стульев»? Она легко и свободно обходилась тридцатью.