Выбрать главу

В новой коре человека содержится около полумиллиона кортикальных колонок, каждая из которых составляет около 2 мм в высоту и 0,5 мм в ширину и содержит около 60 тыс. нейронов (таким образом, в сумме в новой коре содержится около 30 млрд нейронов). В общем, каждый распознающий модуль кортикальной колонки содержит около 100 нейронов, а всего в новой коре имеется порядка 300 млн распознающих модулей.

Теперь мы обратимся к рассмотрению механизмов работы распознающих модулей, однако должен заметить, что, честно говоря, совершенно непонятно, с чего же следует начинать. В новой коре все происходит одновременно, так что в этих процессах нет ни начала, ни конца. Мне часто придется упоминать явления, которые я еще не объяснил, а только собираюсь объяснить, так что прошу вас запастись терпением.

Человек лишь в небольшой степени способен к логическим размышлениям, зато прекрасно умеет распознавать образы. Для логического мышления нам приходится использовать новую кору, которая и является большим распознающим модулем. Это далеко не идеальный механизм для осуществления логических преобразований, но другого у нас нет. Сравним, к примеру, как играют в шахматы человек и специальная компьютерная программа. В 1997 г. компьютер DeepBlue, обыгравший чемпиона мира среди людей Гарри Каспарова, был способен за секунду логически анализировать последствия 200 млн комбинаций на доске (то есть последовательностей ходов и ответных ходов). Сейчас на такое способны некоторые персональные компьютеры. Каспаров в ответ на вопрос, сколько комбинаций он может анализировать за секунду, ответил, что менее одной. Как же в таком случае он вообще мог сражаться против DeepBlue? Ответ заключается в исключительной способности человека распознавать образы. Однако эту способность нужно тренировать — вот почему не каждый из нас мастерски играет в шахматы.

Каспаров знал примерно 100 тыс. шахматных комбинаций. Это реальное число — по нашим расчетам, специалист в какой-либо сфере деятельности должен уметь оперировать примерно 100 тыс. «элементами» знаний. В пьесах Шекспира использовано около 100 тыс. предложений (в которых задействовано около 29 тыс. слов, но большинство из них использовано разными способами). Анализ медицинской экспертной системы, созданной для воспроизведения знаний обычного врача, показал, что врач оперирует примерно 100 тыс. понятий в своей области. Распознавание «элемента» знаний из такого хранилища информации является далеко не простой задачей, поскольку все элементы слегка изменяются при каждом новом обращении к ним.

Вооруженный этими знаниями, Каспаров смотрит на шахматную доску и сравнивает каждую конкретную комбинацию со всеми знакомыми ему 100 тыс. комбинаций, причем все 100 тыс. сравнений он производит одновременно. В этом вопросе наблюдается полный консенсус: все наши нейроны одновременно участвуют в обработке изображения. Это не означает, что все они одновременно возбуждаются (в такой ситуации мы, возможно, не могли бы удержаться на ногах), но выполнение их функции подразумевает возможность возбуждения.

Сколько образов может хранить новая кора? Здесь необходимо учесть явление избыточности. Например, лицо любимого человека хранится не в виде единого образа, а записано тысячи раз. Некоторые из этих повторов представляют собой изображения практически одного и того же лица, тогда как другие показывают его в разных ракурсах, при разном освещении, с разным выражением и т. д. Никакие из этих повторяющихся образов не хранятся в виде истинных рисунков (то есть в виде двумерного набора пикселов). Скорее, они хранятся в виде списков признаков, в которых составные элементы образа сами являются образами. Чуть позже мы подробнее поговорим о том, как устроена эта иерархия признаков.

Если принять, что база знаний специалиста в какой-либо области состоит из 100 тыс. «единиц» знания (то есть образов) при избыточности примерно 100:1, получается, что мозг хранит около 10 млн образов. Эти специфические знания основаны на более общих знаниях и дополняются более глубокими и узкоспециальными знаниями, так что общее число образов повышается до 30 или 50 млн. Однако наши «бытовые» знания, которые мы используем в каждодневной жизни, еще шире; знание «законов улицы» требует от нашей новой коры значительно больше, чем «книжное знание». Если учесть эти бытовые знания и упомянутый выше фактор избыточности, мы получим, что общее число образов, хранящихся в нашей новой коре, превышает 100 млн. Отметим, что фактор избыточности не постоянная величина — часто используемые образы могут повторяться тысячи раз, а новые явления имеют фактор избыточности менее десяти.

Как я расскажу позднее, наши действия и навыки также составляют образы и тоже хранятся в отделах коры, так что, по моим оценкам, общий объем информации в человеческой новой коре составляет несколько сотен миллионов образов. Эта приблизительная оценка вполне соответствует числу распознающих элементов коры, которое, как мы уже определили, составляет около 300 млн. Поэтому вполне резонно предположить, что функция каждого распознающего элемента новой коры состоит в обработке одной итерации образа (то есть одной копии среди множества повторяющихся копий образов). Наши оценки числа образов, которые может обрабатывать человеческий мозг (с учетом необходимой избыточности), и числа физических распознающих элементов привели нас к величинам одного порядка. Замечу, что, когда я говорю об «обработке» образа, я имею и виду все процессы, которые мы можем с ним (и его частями) проделать: изучить, предсказать, узнать и использовать (либо путем дальнейшего осмысления, либо путем применения образа физического перемещения).

Процессор, обрабатывающий 300 млн образов, кажется весьма серьезным аппаратом; и действительно, он позволил Homo sapiens создать устную и письменную речь, все наши многочисленные инструменты и творения. Одни изобретения вызывали к жизни другие, что привело к экспоненциальному росту информационного содержания технологий, который я описываю с помощью закона ускорения отдачи. Никакие другие существа не способны на такое. Как я уже говорил, ряд животных, включая шимпанзе, по-видимому, обладают рудиментарными способностями понимать и произносить слова, а также использовать примитивные орудия. У них, вообще говоря, тоже есть новая кора, однако их способности ограничиваются небольшим размером коры, особенно лобных долей. Размер нашей новой коры позволил нам создавать еще более мощные инструменты, включая те, которые теперь помогают нам изучать собственный разум. Когда-нибудь наш мозг вместе с созданными нами технологиями позволит сотворить искусственную новую кору, и которой будет не 300 млн процессоров, а значительно больше. Может быть, миллиард? Или триллион?

Структура образа

Теория мысленного распознавания образов, которую я хочу нам представить, основана на распознавании образов распознающими модулями новой коры. Эти образы (и модули) организованы иерархическим путем. Ниже я расскажу о том, как возникла эта идея, в том числе поведаю о собственных экспериментах 1980–1990-х гг. и о модели коры Джефа Хокинса и Дайлипа Джорджа, созданной в начале 2000-х гг.

Каждый образ (распознаваемый одним из примерно 300 млн распознающих модулей новой коры) состоит из трех элементов. Первый — это входной сигнал из образов низшего порядка, формирующих основной образ. Нет необходимости в повторении описания каждого из этих образов низшего порядка для каждого образа более высокого порядка, в котором они содержатся. Например, многие образы слов содержат букву «А». Нет нужды повторять описание буквы «А» во всех этих образах слов — они используют одно и то же описание. Это можно сравнить со страничкой в Интернете: в Интернете есть одна страница с описанием буквы «А» (один образ), и все страницы для слов (образы слов), содержащих букву «А», связаны с этой страницей (с образом буквы «А»). Вместо ссылок новая кора использует реальные нервные связи. Аксон от модуля, распознающего букву «А», связан с множеством дендритов — по одному для каждого слова с буквой «А». Но не забывайте и об избыточности коры: для распознавания буквы «А» существует несколько модулей. Любой из них может посылать сигнал модулям, распознающим слова с буквой «А».