То же самое произойдет и в любой другой упорядоченной (а стало быть, сохраняющей определенное количество информации) системе: стоит лишить ее этой информации, и она превратится в хаотичную смесь элементов, перестанет существовать как система.
Чтобы еще раз убедиться в том, что одна и та же информация может быть с одной точки зрения избыточной, а с другой точки зрения — крайне необходимой, допустим, что вам пришло такое сообщение: из яйца вылупился птенец, у которого есть крылья и нет плавников. Являются для вас новостью сведения о плавниках и крыльях? Нет, не являются. Для вас это избыточная информация. А для птенца?
Ситуация тут похожа на известный анекдот про сумасшедших: больной после излечения знает, что он не зерно, но знает ли об этом петух, который хочет это зерно склевать?
Так и в нашем примере: мы־то знаем, что петух из яйца должен вылупиться не с плавниками, а с крыльями. Но если лишить петуха (пока существующего в виде зародыша) этой самой избыточной информации о плавниках и крыльях, откуда петух узнает, что он должен родиться на свет не рыбой, а петухом? Не будь в яйцеклетках «избыточной» информации обо всех важных подробностях структуры зарождающихся в них организмов, на свет рождались бы только уродцы точно такие, как в сказке: «Не мышонок, не лягушка, а неведома зверюшка». Какая-нибудь несуразная, фантастическая и, уж конечно же, нежизнеспособная смесь. Значит, живым организмам «избыточная» информация необходима так же, как языку.
В продуктах питания, которые мы употребляем в пищу, помимо перевариваемых и усваиваемых организмом веществ (белков, углеводов, жиров и др.), есть вещества, которые только способствуют процессу пищеварения.
Так вот, если хотите, величина Нр = 1 бит на букву — это и есть та информация текста, которая представляет собой пищу для ума. Соответственно Iп = 4 бита на букву— это та структурная информация, которая помогает «переваривать» новый текст.
Пусть читатель извинит нас за грубость этой «пищеварительной» аналогии, которая дает весьма наглядное представление о роли, которую играют содержащиеся в каждом тексте величины Нр и Iп.
Их присутствие не обнаруживается с первого взгляда. Для выявления соотношения непредсказуемой и избыточной информации, содержащейся в текстах, понадобились годы упорного и кропотливого труда. И даже он не привел бы ни к каким результатам, если бы теория информации не предложила способов измерений информации, позволивших выразить величины Нр и Iп количеством битов.
Веками копил язык информацию, создающую в чередовании звуков и букв определенный сложный порядок. Именно избыточная информация, накапливаемая в совокупности всех грамматических и фонетических правил, собственно, и сделала язык языком. А замечательная функция отразила в себе весь процесс упорядочивания, который описывается лаконичным языком математики как процесс постепенного перехода от равенства всех вероятностей к их существенному различию, когда вероятность буквы «О» возрастает до 0,09, а вероятность буквы «Ф» падает до 0,0002.
Ну а если этот процесс продлится и дальше? Во что в конце концов превратится письменный текст?
Если много раз подряд подбрасывать игральную кость и записывать выпавшие очки, получится случайное чередование чисел: 3, 2, 5, 4, 1, 6, 2, 2, 6, 3 и т. д.
Какова вероятность того, что в следующий раз выпадет грань с пятью точками? Догадаться нетрудно. Если все грани строго симметричны, то с равной вероятностью может выпасть любая из 6 граней, то есть p1= р2 = p3 = р4 = р5 = р6 = 1/6 .
А какова вероятность того, что при очередном броске выпадет любая из 6 граней? Каждый легко догадается, что вероятность такого события равна единице. В самом деле, не может же игральная кость встать на ребро!
На языке теории вероятностей это условие запишется вот в каком виде:
Точно таким же образом на языке теории вероятностей можно сказать, что, закрыв глаза и передвигая кончик карандаша вдоль строки какой-нибудь книги, а затем остановив его наугад, вы обязательно попадете на букву (если считать буквой и интервал). Это условие записывается в виде:
Используя математический знак суммирования