07 января 2017

Автор: admin

Писательский дар сквозь призму чисел. Закон Ципфа

Улисс

Математический закон Ципфа чрезвычайно увлекателен: он раскрывает заманчиво простую закономерность, определяющую выбор слов писателем, какой бы текст и на каком бы языке он ни писал. Джордж Кингсли Ципф сделал свое открытие на основе анализа романа Джеймса Джойса «Улисс».

Для Ципфа обнаружение одной и той же элементарной математической закономерности в разных контекстах было равносильно духовному пробуждению. «В явлениях повседневной жизни мы находим единство, упорядоченность и равновесие, внушающие нам веру в высшую разумность всего сущего, целостность которого пребывает за пределами наших полномочий и понимания», писал Ципф.

Алекс Беллос, автор книги "Красота в квадрате"Публикуем отрывок о законе Ципфа из книги Алекса Беллоса «Красота в квадрате. Как цифры отражают жизнь и жизнь отражает цифры», вышедшей впервые на русском языке в 2016 году в издательстве «Манн, Иванов и Фербер». Алекс Беллос британский математик и публицист, автор бестселлера «Алекс в стране чисел. Необычайное путешествие в мир математики».

В 40-х годах XX столетия исследователи Висконсинского университета на протяжении четырнадцати месяцев составляли список слов, которые использовались в книге Джеймса Джойса «Улисс». Они напечатали ее на гуммированной бумаге, вырезали отдельные слова и наклеили их на на тысячах отдельных листков. Затем упорядочили эти слова по убыванию частоты их встречаемости в тексте. Полученные данные представляли интерес не только для студентов, изучающих лингвистику, но и для психологов, работающих с лексическими ассоциациям, а также для таких нестандартно мыслящих ученых, как профессор Гарвардского университета Джордж Кингсли Ципф, который выявил потрясающую закономерность.

СловоРанг (порядковый номер)Частота
I («я»)102653
Say («сказать»)100265
Bag («сумка»)100026
Orangefiery («оранжевопламенный»)100002

Оказалось, что десятое по частоте употребления слово встречается в тексте почти в десять раз чаще, чем сотое, почти в сто раз чаще, чем тысячное, и почти в тысячу раз чаще, чем десятитысячное. Джеймс Джойс не выбирал слова с такой арифметической точностью специально; тем не менее закономерность, которой подчиняется их встречаемость в его книге, очевидна.

Если говорить языком математики, частота встречаемости слов в романе «Улисс» приближенно подчиняется следующему закону:

частота х ранг = 26 500

Эту формулу можно привести к такому виду:

частота = 26 500 / ранг

В общем виде данное уравнение выглядит так:

частота = k / ранг, где k константа.

Следовательно, частотность употребления того или иного слова обратно пропорциональна его рангу (порядковому номеру) в списке, упорядоченном по убыванию частоты. Другими словами, если ранг слова в n раз больше, то частота его использования в n раз меньше.

Изучив другие тексты, Ципф пришел к выводу, что во всех книгах на всех языках частота встречаемости слов и их порядковый номер в частотном списке находятся в обратной зависимости, но с небольшим уточнением:

частота = k / рангa, где k и a константыДжордж Кингсли Ципф

Это уравнение известно как закон Ципфа. Ципф обнаружил, что значение константы a всегда стремится к 1 независимо от того, кто автор книги и каково ее содержание. То есть зависимость между частотой встречаемости слов и их рангом всегда очень близка к обратно пропорциональной зависимости. В случае романа «Улисс» значение a равно 1.

Я решил выяснить, соблюдается ли этот закон в моей книге. Для подсчета частотности слов я воспользовался компьютерной программой, а не гуммированной бумагой и ножницами. Просматривая частотную таблицу, я увидел, что частота встречаемости слов действительно обратно пропорциональна их порядковому номеру в таблице. Самое распространенное слово, употребляемое мною в книге («the»), встречается в десять раз чаще, чем десятое по частоте слово «was», примерно в сто раз чаще, чем тысячное слово «spirals». Значение a в моей книге чуть больше единицы, а это значит, что по сравнению с Джеймсом Джойсом я чаще использую самые распространенные слова и реже наименее распространенные.

Мы сами решаем, где нам жить, на что тратить деньги и как расходовать свое время. Тем не менее, если взглянуть на наше коллективное поведение сквозь призму чисел, становится очевидным, что оно вполне предсказуемо и подчиняется простым, взаимно совместимым математическим законам. Возможно, в чем-то этот мир сложен. Но в чем-то — достаточно прост.

Фото © Gscene, Ruben Alexander

    Присоединяйтесь к нам в Feedly

Теги: Алекс Беллос | Джеймс Джойс | Закон Ципфа | Математика | Лингвистика | Улисс

Комментариев: 1

— Комментарий можно оставить без регистрации, для этого достаточно заполнить одно обязательное поле Текст комментария. Анонимные комментарии проходят модерацию и до момента одобрения видны только в браузере автора

— Комментарии зарегистрированных пользователей публикуются сразу после создания

  1. userpic
    Igor #
    очевидно это происходит потому что для компактности в передачи смысла речь сворачивает словоформы по иерархическому принципу. Приблизительно как масса отделов дерева в одном объеме одинакова

    Ответить на этот комментарий

    Написать новый комментарий

    Спaсибо!




    Больше текстов

    Блоги

    CapCut - инструмент для видеомонтажа

    Блоги

    Открытие духовно-просветительского центра в Колтушах

    Блоги

    О фейс-контроле в клубах в новогоднюю ночь

    Блоги

    Видео-контент

    Блоги

    EverGreen - контент, который будет популярен всегда

    Блоги

    Медитативный японский видеоарт на тему архитектуры будущего

    Блоги

    Цепная линия. Идеальная арка от природы

    Блоги

    В гостях. Остров Реюньон

    Блоги

    «Петербург — город будущего» в фотографиях

    Блоги

    Немецкие художники сняли футуристичный саспенс

    Блоги

    Питер Миллер, новое

    Блоги

    Футуристические открытки Hildebrands 1900 года

    Блоги

    Фоторепортаж с Present Perfect Festival

    Блоги

    Биофутуризм Алёши

    Блоги

    Конференция «Монструозность в культуре: от демонологии к неомифу»

    Блоги

    Меланхолические космонавты в живописи Джереми Геддеса

    Блоги

    Фоторепортаж с фестиваля музыкальных технологий Synthposium

    Блоги

    Заха Хадид — архитектор будущего

    Блоги

    Чат-бот Microsoft с искусственным разумом стал расистом в Твиттере