Материал для наблюдения — разный, у каждого оператора своя специфика, но глаз и мозг, как видно, проявляют заложенное от природы постоянство — независимо от того, что перед нами: печатный текст или шкала какого-нибудь измерительного прибора. Объективные данные свидетельствуют, что «непредвиденные ситуации» в печатном слове поддаются упорядочению даже проще, чем в ряде других областей.
На большом лингвистическом материале американский ученый Дж. Г. Ципф доказал, что все естественные языки мира обладают одним универсальным свойством — основная часть любого текста на каком угодно языке составляется из весьма ограниченного числа самых употребительных слов. Десятки же тысяч остальных слов, образующих общий фонд языка, употребляются намного реже и притом в незначительной части печатных текстов. Ципф вычислил, что две трети всех опубликованных текстов (65%) образованы с помощью лишь... 300 различных слов, в 70% текстов использовано не более 500 слов, а 1000 слов достаточно, чтобы написать 80 % разнообразных по жанру произведений от газетной заметки до научной статьи [76, с. 95]. Только взяв все 100 % опубликованных текстов, можно насчитать в них столько слов, сколько примерно входит в наиболее полные словари.
Закон Ципфа и выведенная им математическая формула многократно обсуждались и уточнялись рядом ученых. В частности, А. Уэст, исследовавший при помощи электронно-вычислительной машины словарный состав английского языка, показал, что какой-нибудь бытовой эпизод можно описать, используя всего 450 слов, сказка уложится в 750 слов, для сочинения приключенческого романа достаточно располагать запасом из 1400 слов и лишь для высококачественных образцов беллетристики понадобится 3000 различных слов.
Сформулированный Ципфом «принцип наименьших усилий» нашел широкое применение не только в теории и практике информации, но и в библиографии. Но, насколько известно, не предпринималось попыток направить его на борьбу с опечатками и ошибками в печатном слове. Казалось бы, чем меньше слов в публикуемом тексте, тем меньше возможность их искажения. От словаря трудных для набора слов, предложенного специалистами по инженерной психологии, до словаря опечаток — один шаг!
На самом деле все обстоит гораздо сложнее. Довольствуйся авторы скудным запасом в количестве трехсот наиболее «ходовых» слов, можно было бы добиться высокой точности воспроизведения текстов в печати. Но какой автор согласится наступать на горло... своему словарю.
Работавшие почти одновременно с Ципфом Д. Хоуэс и Р. Соломон (1951) в серии экспериментов показали значение частотных характеристик слов для скорости и точности их распознания. Они пришли к выводу, что наиболее употребительные слова опознаются легче, чем редкие и необычные.
Грузинские психологи ставили опыты, которыми было охвачено до 400 человек, и получили убедительные данные, что в печатных текстах есть и более трудные для восприятия, и более легкие, или «читабельные» слова [55, с. 22]. Исследования Р.М. Фрумкиной и ее сотрудников с предъявлением слов в специальном приборе — тахистоскопе подтвердили, что вероятность появления отдельных слов влияет на скорость их распознавания [117, с. 90–91]. Чем чаще слово попадается наблюдателю на глаза, тем меньше времени уходит на то, чтобы его узнать и — добавим мы от себя — заметить в нем отклонение от привычной орфографической нормы.
Замечаете, что мы все ближе подходим к тому, что нас насущно интересует? Правда, следует помнить, что названные опыты проводились только в лабораторных условиях со специально подобранными наблюдателями, а не в рабочей обстановке с профессиональными читателями.
Но ни математики, ни лингвисты не отрицают, что накопленный исследовательский материал может иметь практическое приложение. Так, лингвист Д.А. Жуков считает, что частотность употребления букв необходимо и полезно знать связистам для более успешной борьбы с помехами [48, с. 62]. А почему это не может пригодиться работникам типографий и издательств? Едва ли находить ошибки в телеграммах труднее, чем опечатки в книгах.
По-видимому, не все из того, о чем мы узнали из опубликованных исследований, удастся так сразу, в один присест, перенести в будничный труд работников печатного слова. Но ряд выводов и наблюдений ученых безусловно придется нам «ко двору». Так, ими выяснено, что наибольшее число отказов (по-нашему, «зевков» или «прохлопов») бывает при распознавании букв в нижней строке. Отсюда для нас вытекает рекомендация особенно внимательно прочитывать последнюю строку на каждой странице.