Читать книгу Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов (Рэй Курцвейл) онлайн бесплатно на Bookz (5-ая страница книги)
bannerbanner
Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов
Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов
Оценить:
Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

5

Полная версия:

Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

На уровне выше ассоциативных зон коры мы можем воспринимать, запоминать и осмысливать еще более сложные абстрактные понятия. На высшем понятийном уровне мы воспринимаем такие образы, как «это хорошо», «она привлекательна», «это забавно» и т. д. Наша память сохраняет эти абстрактные образы наравне с другими. Например, мы можем вспомнить, что говорили с какой-то женщиной, она сказала что-то забавное и мы смеялись, хотя не можем вспомнить, в чем именно заключалась шутка. Память сохранила наше ощущение смешного, но не содержание разговора.

В предыдущей главе я обратил внимание на то, что часто нам удается распознать образ, даже если мы не в состоянии его описать. Например, мне кажется, я смог бы выбрать из набора фотографий разных женщин фотографию той женщины с коляской, которую встретил на прогулке, хотя и не могу ее как следует себе представить или описать. В данном случае моя память о ней представляет собой список некоторых образов высокого уровня иерархии. Эти образы не имеют никаких речевых или зрительных пометок и не выражаются пикселами, поэтому я могу думать о ней, но не могу ее описать. Однако, если мне показать фотографии, мысленная обработка визуальной картинки приведет к узнаванию тех образов высокого уровня иерархии, которые были зарегистрированы при первой встрече. Так я смогу найти совпадение и выбрать ее фотографию среди других.

Даже если я встретил эту женщину на прогулке всего один раз, вполне возможно, что в моей новой коре сохранилось несколько копий ее образа. Однако, если я не думаю о ней какое-то время, соответствующие распознающие модули займутся обработкой других образов. Вот почему со временем воспоминания стираются: избыточность сокращается, и в какой-то момент некоторые воспоминания исчезают. Тот факт, что я написал об этой женщине в книге, скорее всего, позволит мне сохранить более устойчивое воспоминание о ней.

Самоассоциация и инвариантность

В первой главе я уже писал о том, что нам удается распознать образ, даже если он представлен не целиком или в искаженном виде. Первая способность, называемая самоассоциацией, заключается в умении ассоциировать образ и его часть. Структура каждого распознающего модуля позволяет реализовать эту функцию.

В процессе распознавания каждый сигнал поднимается от распознающего модуля более низкого уровня к модулю более высокого уровня, и эта связь имеет определенный «вес», указывающий на важность этого конкретного элемента в общем образе. Более важные элементы имеют больший вес при распознавании образа. Таким образом, бородка Линкольна, бачки Пресли и знаменитый высунутый язык Эйнштейна, по-видимому, имеют большой вес в тех образах, с которыми у нас ассоциируются эти знаменитости. Распознающие модули рассчитывают фактор вероятности, учитывающий параметр значимости элемента. Таким образом, общая вероятность распознавания снижается, если один или несколько элементов отсутствуют, но порог узнавания все же может быть преодолен. Как я уже говорил, расчет общей вероятности присутствия образа сложнее, чем расчет просто взвешенной суммы, в которой величина параметров тоже учитывается.

Если распознающий модуль получил сигнал от модуля более высокого уровня об «ожидании» образа, пороговое значение понижается (то есть его легче достичь). В альтернативном варианте такой сигнал может просто прибавляться к остальным входным сигналам, компенсируя недостающий элемент. Это происходит на всех уровнях, так что такой образ, как лицо, находящийся на несколько уровней выше базового, может быть распознан даже при отсутствии нескольких элементов.

Способность распознавать трансформированные образы называется инвариантностью и реализуется четырьмя способами. Во-первых, важные превращения образа происходят до того, как сигналы попадают в новую кору. О передаче сигнала от кожи, глаз и ушей мы поговорим в разделе «Сенсорное восприятие».

Второй способ основан на избыточности информации, хранящейся в новой коре. Особенно если речь идет о важных или распространенных вещах, мы многократно встречаемся с разными вариантами и ракурсами одного и того же образа. Поэтому в новой коре независимо хранится и обрабатывается множество вариантов таких образов.

Третий и самый мощный способ заключается в способности объединять два списка. В одном может содержаться набор трансформаций, которые способны происходить с определенной категорией образов. Новая кора применит этот список возможных трансформаций к другому образу. Именно так мы понимаем речевые приемы типа метафор и сравнений.

Например, мы постепенно узнаём, что некоторые фонемы в разговорной речи могут выпадать (например, «кода» вместо «когда»). Если затем мы слышим другое слово (например, «всегда»), то узнаём его, даже если в нем отсутствует одна из фонем («вседа»), поскольку уже знакомы с явлением выпадения некоторых фонем. Другой пример. Мы знаем, что какой-то актер любит подчеркивать (увеличивать) размеры части лица (например, носа). Это позволяет нам узнать знакомое лицо, с которым проделан такой же трюк, даже если раньше с этим лицом подобные модификации не производились. Некоторые варианты актерского грима подчеркивают те самые черты, которые распознаются распознающими модулями новой коры. На этом же строится прием карикатуры.

Четвертый метод основан на величине параметров и позволяет одному модулю кодировать множество примеров образа. Например, мы много раз слышали слово steep. Модуль, ответственный за распознавание этого слова в речи, может кодировать множество примеров его произношения с разной длительностью [E]. Если все модули, распознающие слова с [E], обладают этим общим свойством, такая вариабельность должна быть зарегистрирована в самом образе [E]. Однако разные слова с этим звуком (а также со многими другими фонемами) могут различаться по параметру ожидаемой вариабельности. Например, слово peak (читается «пик») не содержит фонемы [E], как в слове steep.

Обучение

Не сами ли мы создаем себе преемников в земном господстве, ежедневно совершенствуя их красоту и утонченность, ежедневно обучая их новым навыкам и постоянно снабжая новыми способностями саморегулирования и автоматизма, которые будут лучше любого интеллекта?

Сэмюэл Батлер[37]

Главная работа мозга заключается в изменении самого себя.

Марвин Минский[38]. Общество разума. 1986

До сих пор мы говорили о том, как мы распознаём (сенсорно-перцептивными методами) образы и вызываем в памяти последовательности образов (наши воспоминания о вещах, людях или событиях). Однако, когда мы родились, ничего этого в нашей новой коре не было. При формировании мозга новая кора девственно чиста. Она обладает способностью учиться и, следовательно, создавать связи между распознающими модулями, но все эти связи появляются только с опытом.

Процесс обучения начинается еще до нашего рождения – одновременно с биологическими процессами в развивающемся мозге. У месячного зародыша уже есть головной мозг, хотя он пока еще напоминает мозг рептилии, поскольку в процессе внутриутробного развития зародыш в ускоренном темпе проходит все этапы эволюции. К третьему триместру беременности мозг плода – уже очевидно человеческий мозг с человеческой новой корой. В этот период плод набирается определенного опыта, и его новая кора обучается. Он слышит звуки, особенно сердцебиение матери, кстати, это одна из возможных причин, объясняющих ритмичность музыки во всех человеческих культурах. Музыка является составной частью культуры всех известных на сегодня человеческих цивилизаций, чего нельзя сказать о других видах искусства, например о живописи. Кроме того, музыкальные ритмы сравнимы с ритмом нашего сердца. Конечно, музыкальные ритмы сильно различаются, иначе было бы неинтересно, но и ритмы сердца тоже различаются. Между прочим, абсолютно регулярное биение сердца является симптомом заболевания. Через 26 недель после зачатия глаза плода начинают открываться, а через 28 недель – практически постоянно открыты. Внутри матки мало интересного, но новая кора плода начинает распознавать образы света и темноты.

Таким образом, опыт новорожденного ребенка весьма ограничен. Новая кора может учиться и у старого мозга (мы поговорим об этом в четвертой главе), но, в общем, ребенку предстоит многое узнать, начиная от распознавания самых примитивных звуков и форм и заканчивая метафорами и сарказмом.

Обучение играет важнейшую роль в формировании человеческого разума. Если бы мы смогли создать идеальную модель человеческой новой коры (что и планируется сделать в рамках проекта Blue Brain) и всех других отделов мозга, которые нужны для его функционирования (таких как гиппокамп и таламус), такой мозг мало на что был бы способен – как и мозг новорожденного ребенка (за исключением того, чтобы делать этого ребенка милым, поскольку это важнейшее условие выживания).

Обучение и распознавание происходят одновременно. Мы начинаем обучаться сразу, и как только мы изучили образ, мы сразу же начинаем его узнавать. Новая кора постоянно пытается определить смысл поступающих в нее сигналов. Если какой-то иерархический уровень не справляется со своей задачей и не может полностью идентифицировать образ, сигналы направляются на уровень более высокого порядка. Если же распознавание не происходит ни на одном из уровней, образ воспринимается как новый. Отнесение образа к категории новых образов не обязательно означает, что новыми являются все его элементы. Если мы смотрим на картину какого-то художника и видим на ней кошачью морду со слоновьим хоботом, мы узнаем все элементы, но понимаем, что этот комбинированный образ является новым, и запоминаем его. На более высоких понятийных уровнях иерархии новой коры, воспринимающих контекст (например, что данная картина является плодом творчества конкретного художника и что мы пришли на новую выставку его работ), будет зарегистрирован необычный комбинированный образ слонокота, а все детали контекста сохранятся в виде дополнительных воспоминаний.

Новые вспоминания вроде морды слонокота записываются в доступном распознающем модуле. В этом процессе задействован гиппокамп, и о том, как все происходит на самом деле, мы поговорим в следующей главе. В рамках обсуждаемой модели новой коры достаточно сказать, что неопознанные образы сохраняются в виде новых образов и связаны с составляющими их образами более низкого уровня. В частности, морда слонокота записывается несколькими способами: регистрируется новое расположение черт, а также имя художника, ситуация, возможно, наше воспоминание о том, как мы смеялись, впервые увидев картину.

Успешно распознанные воспоминания также могут сформировать новый образ, позволяющий дополнительно увеличить избыточность информации. Если же образы распознаны недостаточно хорошо, они, скорее всего, сохраняются как варианты распознанного образа в новом ракурсе.

Каким же методом в целом можно определить, какие образы сохраняются? На языке математики проблема формулируется так: как оптимальным образом представить входные сигналы, которые уже встречались ранее, чтобы не превышать доступной емкости новой коры? Некоторая избыточность необходима, но было бы нерационально заполнять все отпущенное для хранения информации пространство (то есть всю новую кору) повторяющимися образами, поскольку в таком случае сокращается разнообразие запоминаемых образов. Например, образ звука [и] мы встречали бесконечное число раз. Это простой образ звуковой частоты, который, несомненно, представлен в коре с очень большой избыточностью. Мы можем заполнить всю кору повторами образа звука [и], однако полезная избыточность имеет пределы, которые в случае такого распространенного образа, конечно же, были достигнуты.

Подобная математическая проблема оптимизации решается с помощью так называемого линейного программирования, позволяющего наилучшим образом использовать ограниченные ресурсы (в нашем случае – ограниченное число распознающих модулей) для представления всех примеров, на которых отрабатывалась модель. Метод линейного программирования был разработан для систем с одноразмерными входными параметрами, и это еще одна причина, по которой она оптимально подходит для описания линейной последовательности входных сигналов. Мы можем использовать этот математический подход для создания компьютерных программ, и хотя реальный мозг ограничен имеющимися физическими связями, которые он распределяет между распознающими модулями, метод тем не менее очень похожий.

Важным результатом подобной оптимизации является то, что постоянно встречающиеся образы распознаются, но не приводят к возникновению стойких воспоминаний. На утренней прогулке я пережил множество впечатлений, распознаваемых на всех иерархических уровнях, – от простых видимых углов и теней до более сложных объектов, таких как фонарные столбы, почтовые ящики, люди, животные и растения. Скорее всего, ни один из них не был уникален, и распознанные мной образы уже давно достигли оптимального уровня избыточности. В результате у меня не осталось практически никаких воспоминаний об этой прогулке. Те немногие детали, которые я запомнил, по-видимому, были вытеснены записанными поверх них новыми образами, зарегистрированными мозгом во время следующих прогулок, а эту конкретную прогулку я запомнил лишь по той причине, что написал о ней в книге.

Один важный аспект касательно функционирования нашей новой коры и попыток ее моделирования заключается в трудности одновременного постижения образов, относящихся сразу ко многим понятийным уровням. Вообще говоря, мы можем одновременно осваивать один, максимум два уровня. Если процесс обучения проходит стабильно, мы можем переходить на следующий уровень. Мы можем продолжать более тонкую настройку нижних уровней, но сфокусированы на следующем более высоком уровне абстракции. Это справедливо как в самом начале жизни, когда новорожденный ребенок осваивает основные формы и предметы, так и впоследствии, когда мы осваиваем новые материи – один уровень сложности за раз. То же самое можно сказать и о компьютерном моделировании новой коры. Если машине представлять материал в порядке увеличения абстрактности – за один раз один уровень, машины способны обучаться точно так же, как обучается человек (хотя пока не воспринимают такого множества понятийных уровней).

Выходные сигналы от каких-то распознающих модулей могут идти обратно к образам более низкого уровня или возвращаться к тем же самым образам, что объясняет мощную рекурсивную способность человеческого мозга. Отдельный элемент образа может быть точкой принятия решений для другого образа. Это особенно полезно для списков, в состав которых входят действия: например, нужно взять новый тюбик зубной пасты, если закончился старый. Такие условные зависимости существуют на всех уровнях. Каждый, кто пытался создать компьютерную программу, знает, что условные зависимости – обязательный элемент для описания последовательности действий.

Язык мысли

Сны являются предохранительными клапанами перегруженного мозга.

Зигмунд Фрейд. Толкование сновидений. 1911

Головной мозг: мы думаем, что это аппарат, с помощью которого мы думаем.

Амброз Бирс[39]. Словарь Сатаны

Чтобы суммировать все то, что мы узнали о функционировании новой коры, вернитесь, пожалуйста, к диаграмме «Распознающий модуль новой коры» в начале данной главы (см. рис. 8).

А. Дендриты входят в модуль, распознающий конкретный образ. Даже если образы кажутся двумерными или трехмерными, они представляются в виде одномерных последовательностей сигналов. Чтобы произошло распознавание, образ должен быть представлен в виде такой последовательности. Каждый дендрит связывается с одним или несколькими аксонами распознающих модулей более низкого понятийного уровня, распознавших более простые образы, являющиеся частью данного образа. Для каждого входного сигнала может существовать несколько модулей более низкого уровня, способных генерировать сигналы. Необходимое для распознавания образа пороговое значение вероятности может быть достигнуто даже в том случае, если получены не все входные сигналы. Модуль рассчитывает вероятность присутствия образа, за распознавание которого он отвечает. Этот расчет основан на параметрах «значимости» и «величины» сигналов (см. ниже).

Обратите внимание, что одни дендриты передают сигналы в модуль, а другие – из модуля. Если все дендриты, входящие в распознающий модуль, сигнализируют о том, что распознаны все образы более низкого уровня, за исключением одного или двух, распознающий модуль отправит нисходящие сигналы в модули, ответственные за распознавание этих оставшихся неузнанными образов, с указанием высокой вероятности того, что образ скоро будет распознан и что эти модули более низкого порядка должны быть к этому готовы.

Б. Когда распознающий модуль узнаёт соответствующий образ (на основании активации всех или большинства входных дендритов), активируется выходной аксон этого распознающего модуля. Этот аксон, в свою очередь, может сообщаться со всей сетью дендритов, ведущих ко многим распознающим модулям более высокого порядка, для которых данный образ является входным сигналом. Сигнал и его величина учитываются распознающими модулями следующего уровня.

В. Если распознающий модуль более высокого уровня получает положительные сигналы ото всех или от большинства составляющих образов, за исключением сигнала от данного конкретного распознающего модуля, распознающий модуль более высокого уровня может послать нисходящий сигнал этому модулю, указывая на большую вероятность «ожидания» соответствующего образа. Этот сигнал заставляет распознающий модуль понизить пороговые параметры, в результате чего он с большей вероятностью передает по своему аксону положительный сигнал (что означает, что соответствующий образ распознан), даже если некоторые из входных сигналов отсутствуют или сомнительны.

Г. Ингибирующие сигналы снизу понижают вероятность распознавания модулем соответствующего образа. Это может происходить в результате распознавания на более низком уровне образов, несовместимых с образом, за который отвечает данный распознающий модуль (например, распознавание усов снижает вероятность того, что увиденное мной лицо принадлежит «моей жене»).

Д. Ингибирующие сигналы сверху тоже могут снижать вероятность распознавания образа соответствующим модулем. Это может происходить при распознавании образа более высокого порядка сложности, который несовместим с образом, распознанным данным модулем.

Е. Каждому сигналу соответствует ранее определенный набор параметров, таких как значимость, ожидаемая величина и ожидаемая вариабельность. Распознающий модуль рассчитывает общую вероятность присутствия образа на основании значений всех этих параметров для входных сигналов. Оптимальный математический метод решения данной задачи называется методом скрытых моделей Маркова. Если такие модели организованы иерархическим образом (как в новой коре или в математических моделях, воспроизводящих ее функции), мы называем их иерархическими скрытыми моделями Маркова.

Распознавание корой одних образов запускает распознавание следующих. Частично распознанные образы посылают нисходящие сигналы, полностью распознанные образы – восходящие сигналы. Эти распознанные новой корой образы являются языком мышления. Как и разговорный язык, язык мышления имеет иерархическую структуру, но не является «языком» в обычном понимании. Поначалу наши мысли не выражены словами, однако, поскольку речь тоже формируется в новой коре в виде иерархических образов, у нас бывают и мысли, основанные на языковых образах. Однако по большей части мысли выражаются неязыковыми образами.

Как я уже отмечал ранее, даже если бы мы умели регистрировать активацию образов в новой коре живого человека, мы все равно не смогли бы определить значение этих образов, если бы не имели доступа к полной иерархической системе вышестоящих и нижестоящих образов. Это сильно затрудняет доступ к мыслительному процессу другого человека. Достаточно сложно понять содержание наших собственных мыслей, а для понимания мыслей другого человека требуется овладеть его новой корой. Конечно же, пока нам это недоступно. Пока нам приходится использовать способность другого человека выражать свои мысли с помощью речи (а также других средств, включая жесты). Учитывая недостаточную способность людей справляться с этой задачей, нет ничего удивительного в том, что мы зачастую плохо понимаем друг друга.

У нас два способа мышления. При ненаправленном способе мышления мысли подталкивают друг друга нелогичным образом. Иногда, когда мы заняты чем-то отвлеченным, например сгребаем опавшие листья или просто идем по улице, у нас неожиданно возникают воспоминания о том, что мы делали несколько лет или десятилетий назад. Мы не можем немедленно восстановить в памяти те события, не прибегая к множеству других воспоминаний, которые помогают нам воссоздать более слаженную картину. Если нам удается воссоздать визуальное изображение давно забытой сцены, это происходит в настоящий момент, поскольку память не хранит визуальные образы или изображения. Как я уже говорил, не всегда очевидно, какие стимулы вызывают у нас в голове появление подобных мыслей. Последовательность мыслей, вызвавших воспоминание, может быть немедленно забыта. Но если даже нам удастся ее восстановить, это окажется нелинейная, кружная последовательность ассоциаций.

Второй способ – направленное мышление, которое мы используем для решения задач или формулировки логичного ответа. Например, так мы готовимся кому-то что-то сказать или формулируем в уме фразу, которую собираемся написать (например, в книге о разуме). Когда мы обдумываем подобную проблему, мы расчленяем ее на иерархические составляющие. Например, чтобы написать книгу, нужно написать отдельные главы. Каждая глава строится из разделов, разделы состоят из параграфов, параграфы – из предложений, в которых сформулированы идеи. Каждая идея построена из нескольких элементов в определенной конфигурации. Все элементы идеи и все связи между элементами тоже должны быть произнесены. Кроме того, наша новая кора действует по определенным правилам. Если мы выполняем письменную работу, нужно постараться избегать ненужных повторений, обеспечить читателю возможность следить за ходом изложения, использовать грамматические и стилистические правила и т. д. Следовательно, писатель должен создать в своей голове образ читателя, и этот образ также является иерархическим. При направленном мышлении мы продвигаемся по спискам новой коры, каждый из которых, в свою очередь, состоит из подсписков, а те – из еще более простых наблюдений. Помним также, что элементы списков могут содержать условные зависимости, так что наши мысли и действия зависят от оценок, сделанных в ходе мыслительного процесса.

Кроме того, каждая направленная мысль запускает иерархический путь ненаправленного мышления. Происходит постоянный наплыв воспоминаний, связанных как с нашим чувственным опытом, так и с нашими попытками направленного мышления. Наш мыслительный опыт сложен и запутан и состоит из наплывов образов, изменяющихся сотни раз в секунду.

Язык снов

Сны – пример ненаправленных мыслей. В них есть некий смысл, поскольку одни мысли запускают другие в соответствии с реальными связями между образами, хранящимися в новой коре. Неосмысленные элементы снов мы пытаемся зафиксировать с помощью нашей способности к конфабуляции (фантазии). Как я расскажу в девятой главе, больные с расщепленным мозгом (при поражении мозолистого тела, связывающего между собой полушария мозга) прибегают к конфабуляциям (с помощью левого полушария, контролирующего речевой центр) для объяснения того, что делает с полученными сигналами правое полушарие, к которому у левого полушария нет доступа. Мы постоянно прибегаем к конфабуляциям для объяснения исхода различных событий. Хотите яркий пример – просто прослушайте дневные комментарии по поводу состояния финансовых рынков. Вне зависимости от того, как изменяется ситуация на рынках, всегда можно найти причины этих изменений. И примеров подобных комментариев можно привести множество. Если бы комментаторы действительно понимали ситуацию, они не тратили бы время на составление подобных комментариев.

Конечно же, за конфабуляции тоже отвечает новая кора; они возникают в тех случаях, когда мы встречаемся с некоторыми трудностями при пересказе каких-то историй или объяснении каких-то фактов. Мы заполняем свой рассказ недостающими или забытыми подробностями, и он становится более осмысленным. Вот почему истории в устах разных рассказчиков, возможно, имеющих разные намерения, изменяются со временем. Однако с появлением письменного языка у нас появилась возможность фиксировать окончательную версию истории и предотвращать подобные вариации.

Истинное содержание сна в том виде, в каком мы его запоминаем, опять-таки представляет собой последовательность образов. Образы составляют основу истории, а мы дополняем ее конфабуляциями, ограниченными существующими образами. Эта фантазия и есть та версия сна, которую мы можем пересказать или вспомнить. Пересказывая сон, мы запускаем каскад образов, дополняющих наш сон в том виде, в каком мы увидели его изначально.

bannerbanner