id: 850
Писательский дар сквозь призму чисел. Закон ЦипфаМатематический закон Ципфа чрезвычайно увлекателен: он раскрывает заманчиво простую закономерность, определяющую выбор слов писателем, какой бы текст и на каком бы языке он ни писал. Для Ципфа обнаружение одной и той же элементарной математической закономерности в разных контекстах было равносильно духовному пробуждению. «В явлениях повседневной жизни мы находим единство, упорядоченность и равновесие, внушающие нам веру в высшую разумность всего сущего, целостность которого пребывает за пределами наших полномочий и понимания», — писал Ципф. Публикуем отрывок о законе Ципфа из книги Алекса Беллоса «Красота в квадрате. Как цифры отражают жизнь и жизнь отражает цифры», вышедшей впервые на русском языке в 2016 году в издательстве «Манн, Иванов и Фербер». Алекс Беллос — британский математик и публицист, автор бестселлера «Алекс в стране чисел. Необычайное путешествие в мир математики». В 40-х годах XX столетия исследователи Висконсинского университета на протяжении четырнадцати месяцев составляли список слов, которые использовались в книге Джеймса Джойса «Улисс». Они напечатали ее на гуммированной бумаге, вырезали отдельные слова и наклеили их на на тысячах отдельных листков. Затем упорядочили эти слова по убыванию частоты их встречаемости в тексте. Полученные данные представляли интерес не только для студентов, изучающих лингвистику, но и для психологов, работающих с лексическими ассоциациям, а также для таких нестандартно мыслящих ученых, как профессор Гарвардского университета Джордж Кингсли Ципф, который выявил потрясающую закономерность.
Оказалось, что десятое по частоте употребления слово встречается в тексте почти в десять раз чаще, чем сотое, почти в сто раз чаще, чем тысячное, и почти в тысячу раз чаще, чем десятитысячное. Джеймс Джойс не выбирал слова с такой арифметической точностью специально; тем не менее закономерность, которой подчиняется их встречаемость в его книге, очевидна. Если говорить языком математики, частота встречаемости слов в романе «Улисс» приближенно подчиняется следующему закону: частота х ранг = 26 500 Эту формулу можно привести к такому виду: частота = 26 500 / ранг В общем виде данное уравнение выглядит так: частота = k / ранг, где k — константа. Следовательно, частотность употребления того или иного слова обратно пропорциональна его рангу (порядковому номеру) в списке, упорядоченном по убыванию частоты. Другими словами, если ранг слова в n раз больше, то частота его использования в n раз меньше. Изучив другие тексты, Ципф пришел к выводу, что во всех книгах на всех языках частота встречаемости слов и их порядковый номер в частотном списке находятся в обратной зависимости, но с небольшим уточнением: частота = k / рангa, где k и a — константы Это уравнение известно как закон Ципфа. Ципф обнаружил, что значение константы a всегда стремится к 1 независимо от того, кто автор книги и каково ее содержание. То есть зависимость между частотой встречаемости слов и их рангом всегда очень близка к обратно пропорциональной зависимости. В случае романа «Улисс» значение a равно 1. Я решил выяснить, соблюдается ли этот закон в моей книге. Для подсчета частотности слов я воспользовался компьютерной программой, а не гуммированной бумагой и ножницами. Просматривая частотную таблицу, я увидел, что частота встречаемости слов действительно обратно пропорциональна их порядковому номеру в таблице. Самое распространенное слово, употребляемое мною в книге («the»), встречается в десять раз чаще, чем десятое по частоте слово «was», примерно в сто раз чаще, чем тысячное слово «spirals». Значение a в моей книге чуть больше единицы, а это значит, что по сравнению с Джеймсом Джойсом я чаще использую самые распространенные слова и реже — наименее распространенные. Мы сами решаем, где нам жить, на что тратить деньги и как расходовать свое время. Тем не менее, если взглянуть на наше коллективное поведение сквозь призму чисел, становится очевидным, что оно вполне предсказуемо и подчиняется простым, взаимно совместимым математическим законам. Возможно, в чем-то этот мир сложен. Но в чем-то — достаточно прост. Фото © Gscene, Ruben Alexander Комментариев: 1
Написать новый комментарий |
|
— Комментарий можно оставить без регистрации, для этого достаточно заполнить одно обязательное поле Текст комментария. Анонимные комментарии проходят модерацию и до момента одобрения видны только в браузере автора
— Комментарии зарегистрированных пользователей публикуются сразу после создания