Глазарий языка
Если вам предложат прочитать следующие три отрывка и определить, какой написал А. П. Чехов, какой — Л. Н. Толстой, а какой — Ф. М. Достоевский, скорее всего, вы сделаете это без ошибки, даже если не будете смотреть в интернете.
1) «Если бы можно было вернуть прошлые дни и годы, он ложь в них заменил бы правдой, праздность ― трудом, скуку ― радостью, он вернул бы чистоту тем, у кого взял ее, нашел бы бога и справедливость, но это так же невозможно, как закатившуюся звезду вернуть опять на небо».
2) «Любовь к самому себе, горячая, полная надежд, молодая любовь ко всему, что только было хорошего в его душе (а ему казалось теперь, что только одно хорошее было в нем), заставляла его плакать и бормотать несвязные слова».
3) «В его душе будто бы странно сошлись страсть и ненависть, и он хотя и дал наконец, после мучительных колебаний, согласие жениться на "скверной женщине", но сам поклялся в душе горько отмстить ей за это и "доехать" ее потом, как он будто бы сам выразился».
Почему? Дело в том, что мы видим здесь определенные слова-сигналы, которые твердо закреплены в нашем сознании за каждым из этих писателей: Чехов — «скука», Толстой — «любовь», Достоевский — «страсть».
Мы решили статистическим методом проверить эту интуитивную идею, для чего извлекли из представленных в Национальном корпусе русского языка художественных произведений трех писателей все контексты с существительными «скука», «любовь», «страсть».
Результат можно увидеть на прикрепленном графике. Растущие вверх, подобно сталагмитам, столбцы обозначают, что наблюдаемая частота встречаемости слова у данного автора больше ожидаемой. И наоборот, столбцы, растущие, подобно сталактитам, вниз, указывают на то, что наблюдаемая частота меньше ожидаемой. Цветовые выделения (синие для положительных значений и красные для отрицательных) маркируют случаи наиболее существенных расхождений.
Таким образом, наша интуиция нас не обманывает: Чехов — действительно певец скуки, Толстой — любви, а Достоевский — страсти.