Как работает мозг, Стивен Пинкер, Коннектоплазма

Коннектоплазма

В какой же части мыслекода заканчиваются правила и репрезентации, и начинаются нейронные сети? Большинство когнитивистов приходят к единому мнению по крайней мере по поводу крайних точек. На высших уровнях когнитивной способности, где мы сознательно проходим каждый шаг, применяя правила, которые мы выучили в школе или обнаружили сами, мышление похоже на продукционную систему с символическими записями в памяти и демонами, выполняющими операции. На нижнем уровне записи и правила выполняются в рамках чего-то вроде нейронной сети, которая реагирует на знакомые паттерны и ассоциирует их с другими паттернами. Однако граница между ними остается предметом споров. Можно ли сказать, что простые нейронные сети отвечают за преобладающую часть повседневного мышления, а уровню явных правил и суждений оставляют только плоды учености? Или сети больше напоминают строительный материал, не способный на проявление человеческого рассудка, пока из него не будут построены структурированные репрезентации и программы?

Представители научной школы, получившей название «коннекционизм», во главе с психологами Дэвидом Румельхартом и Джеймсом Мак-Клелландом, утверждают, что простые сети сами по себе отвечают за преобладающую часть человеческого интеллекта. В своей крайней форме коннекционизм гласит, что мышление – это одна большая сеть обратного распространения ошибок скрытого уровня, или, возможно, группа из похожих или идентичных сетей, и интеллект формируется за счет того, что учитель – среда – настраивает веса связей. Единственная причина, по которой люди умнее крыс, состоит в том, что в наших сетях между стимулом и реакцией больше скрытых уровней, и мы живем в среде других людей, которые выступают в роли учителей сети. Правила и символы могут быть полезны как приближенная модель того, что происходит в сети, для психолога, который не может угнаться за миллионами потоков возбуждения, протекающих в связях, но не более того103.

Другой подход – который мне нравится больше – состоит в том, что одни только нейронные сети не могут выполнить всю работу. В значительной мере человеческий интеллект объясняется структурированием сетей на программы манипулирования символами. В частности, манипулирование символами лежит в основе языка и тех компонентов мышления, которые с ним взаимодействуют. Этим когнитивная способность не ограничивается, но это значительная ее часть. Это все, о чем мы можем рассуждать про себя и в разговоре с другими. Занимаясь психолингвистикой, я собрал множество доказательств того, что даже простейший навык, связанный с говорением на английском языке, – такой, как умение образовывать форму прошедшего времени от глагола (walked от walk, came от come) – с вычислительной точки зрения слишком сложен, чтобы его могла обслуживать одна нейронная сеть104. В этом разделе книги я представлю более общие доказательства. Требует ли содержание наших повседневных мыслей (информация, которой мы обмениваемся в разговоре) вычислительного устройства, предназначенного для реализации глубоко структурированного мыслекода, или с ним может справляться нейронная сеть общего назначения – то, что один остряк назвал «коннекто-плазмой»?105 Я покажу вам, что наши мысли отличаются тонким логическим структурированием, которое не под силу никакой сети однородных уровней, состоящей из узлов.

Зачем нам это, спросите вы? Затем, что эти доказательства ставят под сомнение наиболее авторитетную теорию устройства нашего мышления из когда-либо предложенных учеными. Сам по себе персептрон или сеть со скрытыми уровнями – это высокотехнологичное воплощение старой теории об ассоциации идей. Британские философы Джон Локк, Дэвид Юм, Джордж Беркли, Дэвид Хартли и Джон Стюарт Милль утверждали, что мысль подчиняется двум законам. Первый – закон смежности: между идеями, которые часто встречаются вместе, в мышлении образуются ассоциации. Впоследствии, когда активизируется одна идея, активизируется и вторая. Второй закон – это сходство: когда две идеи обладают сходством, все, что ассоциируется с первой идеей, автоматически начинает ассоциироваться со второй. Юм таким образом резюмировал суть этой теории в 1748 году:

Опыт лишь показывает нам ряд единообразных действий, производимых определенными объектами, и учит нас, что такие-то объекты в такое-то время обладали известными способностями и силами. Когда появляется новый объект, обладающий подобными чувственными качествами, мы ожидаем, что найдем в нем подобные же силы и способности, и ждем от него такого же действия. От тела одинакового с хлебом цвета и плотности мы ожидаем сходной же питательности и способности поддерживать организм106.

Ассоциацию по смежности и сходству считали тем самым писцом, который пишет на знаменитой «чистой доске» (так Локк метафорически называл мозг новорожденного). Теория, получившая название «ассоциационизм», веками играла доминирующую роль во взглядах британских и американских ученых на работу мышления, и в определенной степени доминирует и по сей день. Когда «идеи» заменили стимулы и реакции, ассоциационизм превратился в бихевиоризм. Чистая доска и два универсальных закона обучения являются психологической основой и стандартной социологической модели. Отзвуки этой теории мы слышим и в расхожих фразах о том, как наше воспитание заставляет нас «ассоциировать» еду с любовью, богатство со счастьем, рост с властью и т. д.

До недавнего времени ассоциационизм был слишком абстрактной теорией, чтобы быть проверенным на практике, однако модели нейронных сетей, которые сейчас ничего не стоит создать с помощью компьютера, позволяют сделать его идеи более точными. Схема обучения, в которой учитель дает сети вход и правильный выход, а сеть старается в будущем воспроизвести это соответствие, представляет собой очень хорошую модель закона смежности. Распределенная репрезентация входа, при которой концепт не получает собственного узла («попугай»), а представляется паттерном активности узлов, соответствующих его свойствам («покрытый перьями», «имеет крылья» и т. д.), позволяет добиться автоматического распространения на подобные концепты и, таким образом, прекрасно вписывается в закон об ассоциации по сходству. А если допустить, что все части мышления устроены как подобного рода сеть, то мы получим реализацию идеи чистой доски. Итак, коннекционизм открывает перед нами прекрасные возможности. Увидев, что могут и чего не могут делать модели нейронных сетей, мы можем подвергнуть серьезному испытанию многовековую доктрину ассоциации идей.

Прежде чем начать, необходимо сразу отмести несколько ложных аргументов. Коннекционизм – не альтернатива вычислительной теории сознания, а ее разновидность, которая утверждает, что основной вид обработки информации, выполняемый мозгом, – это многомерный статистический анализ. Коннекционизм не является необходимой коррективой теории о том, что мозг подобен серийному компьютеру с действующим быстро и безошибочно центральным процессором, – никто этого и не утверждает. В реальной жизни нет Ахилла, который заявлял бы, что всякая форма мышления заключается в прокручивании в голове тысячи правил из учебника по логике. Наконец, сети связей не являются особенно реалистичными моделями мозга, невзирая на приклеившееся к ним оптимистичное название «нейронные сети». К примеру, так называемый «синапс» (вес связи) может переходить из возбужденного состояния в заторможенное, а по «аксону» (соединению) информация может поступать в обоих направлениях. С анатомической точки зрения и то и другое невозможно. Когда стоит выбор между тем, чтобы поскорее решить задачу, и тем, чтобы как можно точнее воспроизвести работу мозга, коннекционисты нередко выбирают первое; это говорит о том, что сети используются как форма искусственного интеллекта, лишь косвенно основанная на сравнении с нейронами, и не являются формой моделирования нейронной активности. Вопрос в том, действительно ли они осуществляют такие вычисления, которые можно считать моделью человеческого мышления?

Грубая коннектоплазма не способна воспроизвести пять особенностей повседневного мышления. Эти особенности на первый взгляд кажутся малозаметными, о их существовании даже не подозревали до тех пор, пока логики, лингвисты и специалисты по информатике не начали разглядывать под микроскопом значение предложений. Тем не менее именно они дают человеческой мысли ее неповторимую точность и силу, являясь, как мне кажется, важным элементом ответа на вопрос «Как работает мышление?».

Первая особенность – это способность работать с индивидным объектом. Давайте вернемся к первому отличию нейронных сетей от их компьютероподобных моделей. Вместо того, чтобы символически представлять объект в виде произвольного шаблона из последовательности битов, мы представляли его в виде шаблона из узлов одного уровня, каждый из которых соответствовал одному из свойств объекта. Перед нами тут же встает проблема: мы уже не можем отличить друг от друга два отдельных объекта с идентичными свойствами. Они представлены совершенно одинаковым образом, и система не обращает внимания на то, что перед ней – не один и тот же кусок физической материи. Мы потеряли индивидуальность объекта: мы можем создать репрезентацию овоща или лошади как понятия, но не конкретного овоща и не конкретной лошади. Все, что система узнает об одной лошади, будет сливаться с тем, что она знает о другой лошади, идентичной первой. Естественного способа представить двух разных лошадей нет. Если увеличить активность узлов, представляющих свойства лошади, вдвое, это не поможет, потому что система может решить, что это двойная степень уверенности в том, что присутствуют свойства лошади или что свойства лошади присутствуют в двойной степени.

Легко спутать отношение между классом и подклассом (например, между классом «животное» и подклассом «лошадь», с которыми сеть легко справляется) с отношением между подклассом и отдельным объектом (например, подклассом «лошадь» и отдельной особью по кличке «Мистер Эд»). У этих двух примеров отношений, естественно, есть кое-что общее. В обоих случаях свойства высшего порядка передаются и объектам низшего порядка. Если животные дышат, а лошади – это животные, то лошади дышат. Если у лошадей есть копыта, а Мистер Эд – лошадь, то у Мистера Эда есть копыта. Следуя этой логике, разработчик может соблазниться тем, чтобы рассматривать индивидуализированный объект как очень-очень узкий подкласс, используя при этом некое едва заметное различие между этими двойниками – например, крапинку, которая присутствует у одного объекта и отсутствует у другого.

Как и многие постулаты коннекционизма, эта идея уходит корнями в британский ассоциационизм. Как писал Беркли, «уберите ощущение мягкости, влажности, красноты, кислоты и вы уберете вишню, потому что она не существует отдельно от ощущений. Вишня, заявляю я, не что иное, как множество ощущаемых чувствами впечатлений»107. Тем не менее предположение Беркли себя не оправдало. Можно иметь совершенно идентичные знания о свойствах двух объектов и при этом все равно знать, что они разные. Представьте комнату с двумя одинаковыми стульями. В комнату входит человек и меняет стулья местами. Осталась ли комната прежней или стала другой? Всем ясно, что комната изменилась. Но нам не известны признаки, которые бы отличали один стул от другого – кроме того, что можно говорить об одном из них как о стуле № 1, а о втором – как о стуле № 2. Мы снова вернулись к произвольным ярлыкам, присваиваемым слотам памяти, как в презренном цифровом компьютере! Та же идея лежит в основе шутки комика Стивена Райта: «Пока меня не было дома, кто-то вытащил все вещи из моей квартиры и заменил их точными копиями. Когда я сказал об этом соседу по комнате, он спросил: “Мы с вами знакомы?”»

Есть, правда, одна характеристика, позволяющая отличить один индивидный объект от другого: они не могут находиться в одном и том же месте одновременно. Вероятно, мозг способен запечатлеть в памяти время и место нахождения каждого объекта и постоянно обновлять эти координаты, что позволяет ему различать индивидные объекты с идентичными свойствами. Тем не менее даже это не объясняет нашу способность отделять индивидные объекты друг от друга в мысленном восприятии. Предположим, что перед нами бесконечная белая плоскость, на которой нет ничего кроме двух идентичных друг другу кругов. Один из них, двигаясь, постепенно находит на второй и остается поверх него в течение несколько секунд, а затем продолжает двигаться дальше. Думаю, ни у кого не возникнет затруднений в том, чтобы воспринимать круги как отдельные сущности даже в те моменты, когда они находятся в одном и том же месте в одно и то же время. Это доказывает, что нахождения в определенном месте в определенное время тоже недостаточно для нашего ментального определения «индивидного объекта»108.

Мораль из всего сказанного заключается не в том, что индивидные объекты нельзя представить в нейронной сети. Это довольно просто: нужно лишь выделить несколько узлов для установления тождества каждого индивидного объекта вне зависимости от свойств данного объекта. Можно присвоить каждому индивиду собственный узел, а можно присвоить каждому индивиду что-то вроде серийного номера, закодированного в форме паттерна из возбужденных узлов. Мораль в том, что сети, моделирующие мышление, должны быть сделаны таким образом, чтобы воплощать абстрактное логическое представление об отдельном объекте, аналогично роли, которую играет произвольно маркированная ячейка памяти компьютера. Единственное, что не получается, – это ассоциатор паттернов, ограниченный наблюдаемыми свойствами объекта, современная реализация аристотелевской сентенции «нет ничего в уме, чего бы не было прежде в чувствах».

Можно ли сказать, что все эти рассуждения – всего лишь казуистика? Вовсе нет: понятие индивидного объекта – это один из ключевых элементов нашей способности рассуждать о жизни. Позвольте привести два примера из реальной жизни, включающих в себя две грандиозные сферы человеческого взаимодействия: любовь и правосудие.

Монозиготные близнецы схожи в большей части своих характеристик. Они не только выглядят одинаково, но и думают, чувствуют и действуют схожим образом. Но не совершенно идентично, конечно; это и есть лазейка, с помощью которой можно попытаться представить их как очень узкие подклассы. Вместе с тем любое живое существо, представляющее их как подклассы, должно по крайней мере тяготеть к тому, чтобы воспринимать идентичных близнецов одинаково. Живое существо должно переносить свое мнение с одного близнеца на другого, по крайней мере, в вероятностном смысле или в какой-то мере; помните? это один из самых привлекательных моментов ассоциационизма и его воплощения в форме коннектоплазмы. Например, если что-то привлекает вас в одном из близнецов (то, как он ходит, говорит, выглядит и т. д.), оно должно привлекать вас и в другом. А это подразумевает, что идентичные близнецы должны вечно фигурировать в историях, замешанных на ревности и предательстве поистине готического масштаба. На деле же ничего подобного не происходит. Супруга одного из идентичных близнецов не испытывает романтического влечения к другому. Любовь привязывает нас к человеку как к данному человеку, а не как к типу людей – сколь бы малочисленным ни был этот тип людей109.

10 марта 1988 года кто-то откусил половину уха офицеру полиции Дэвиду Дж. Стортону. Ни у кого не было сомнений относительно того, кто это сделал: это был либо Шон Блик, молодой человек (21 год), живущий в Пало-Альто (Калифорния), либо Джонатан Блик, его идентичный близнец. Оба брата оказались вовлечены в потасовку с полицейским, и один из них откусил офицеру часть уха. Обоим братьям были предъявлены обвинения в нанесении увечья, попытке ограбления, нападении на офицера полиции и нанесении увечья при отягчающих обстоятельствах. Последнее правонарушение (укушенное ухо) карается пожизненным заключением. Офицер Стортон, давая показания, сообщил, что у одного из близнецов были длинные волосы, а у другого – короткие, и укусил его длинноволосый. К сожалению, через три дня, когда близнецы сдались полиции, у них были одинаковые короткие стрижки, и от дачи показаний они отказались. Их адвокаты утверждали, что ни одному из них нельзя назначить суровое наказание, предполагаемое обвинением в нанесении тяжкого увечья. В отношении каждого из братьев есть разумные основания для сомнения по поводу того, действительно ли преступление совершил он, потому что это вполне мог быть и второй брат. Аргумент представляется весомым потому, что наше чувство справедливости велит нам выбрать индивида, который совершил поступок, а не какие-либо характеристики этого индивида110.

Наша одержимость индивидуальностью человека – это не необъяснимая причуда; вероятно, она развилась у нас из-за того, что каждый человек, которого мы встречаем, независимо от каких-либо наблюдаемых его свойств, непременно имеет неповторимый багаж воспоминаний и желаний, что обусловлено уникальной эмбриологической и биографической историей. В главе 6, когда мы перейдем к обратному проектированию чувства справедливости и романтической любви, мы увидим, что в их основе – ментальный акт регистрирования отдельного индивида.

Люди – не единственный класс схожих между собой индивидуальных объектов, которые нам приходится различать; еще один пример из реальной жизни – игра в «угадайку» в животном мире. Многим животным приходится играть в «угадайку» и таким образом следить за местонахождением отдельных объектов. Один из примеров – мать, следящая за своим потомством, которое может выглядеть точно также, как все остальные детеныши этого вида, но при этом обладать ее генетическим набором. Другой пример – хищник, охотящийся на стадных животных, который отслеживает одного представителя стада, следуя стратегии игры в салочки: если ты водишь, то не переключайся с намеченной жертвы на другую; не давай отдохнуть никому, кроме себя. Когда кенийские зоологи, желая упростить сбор данных об антилопах гну, решили пометить краской рога усыпленных с помощью транквилизатора особей, они обнаружили, что, как бы они ни старались восстановить силы и энергию помеченного животного перед его возвращением в стадо, в первый же день или чуть позже его убивали гиены. Одно из возможных объяснений состоит в том, что цветная метка позволяет гиенам выделить именно эту антилопу и загнать ее до изнеможения. Одна из последних версий того, зачем нужны полоски зебрам, – не для того, чтобы сливаться с высокой травой (это объяснение всегда представлялось сомнительным), а для того, чтобы превратить стадо зебр в живые «наперстки», сбить с толку льва или другого хищника, который пытается сосредоточить внимание на одной особи. Конечно, мы не можем быть уверены, что у гиен или львов есть понятие индивидного объекта; может быть, им просто кажется более аппетитным животное, не похожее на собратьев по стаду. Тем не менее эти примеры хорошо иллюстрируют стоящую перед вычислительной техникой проблему отличия индивидных объектов от классов и акцентируют важность присущей человеку способности решать эту задачу111.

Вторая проблема ассоциационизма известна как композициональность: способность репрезентации состоять из частей и обладать значением, которое исходит из значений составляющих и из того, каким образом они соединяются между собой. Композициональность – типичная черта всех естественных языков. Значение предложения The baby ate the slug («Ребенок съел слизняка») можно вывести из значений слов baby, ate, the и slug и из их положения в предложении. Целое не является простой суммой компонентов: если мы переставим слова в предложении, получив The slug ate the baby («Слизняк съел ребенка»), оно будет выражать совсем другую идею. Поскольку вы не слышали раньше ни то предложение, ни другое, вы наверняка интерпретировали их, применив к последовательности слов совокупность алгоритмов (включающих в себя правила синтаксиса). Конечный продукт в каждом случае – это совершенно новая мысль, которую вы собрали на ходу. Имея в своем распоряжении такие концепты, как «ребенок», «слизняк» и «есть», плюс способность располагать соответствующие им символы на мысленной доске объявлений в соответствии со схемой, которую могут прочитать демоны, вы можете впервые в жизни получить именно такую мысль.

Журналисты говорят, что когда собака кусает человека, это не новость, а вот когда человек кусает собаку— это новость. Композициональность ментальных репрезентаций – вот что позволяет нам воспринимать новости. Мы готовы принять любые нелепые и удивительные новые идеи, какими бы невообразимыми они ни казались. Корова перепрыгнула через луну; Гринч украл Рождество; Вселенная началась с Большого Взрыва; пришельцы высадились в Гарварде; Майкл Джексон женился на дочери Элвиса Пресли. Благодаря математике комбинаторики у нас никогда не будет недостатка в новостях; в мире есть сотни миллионов триллионов мыслей, которые еще никогда и никому не приходили в голову.

Вы, вероятно, подумали, что композициональность легко воспроизвести в модели нейронной сети: просто включить узлы «ребенок», «есть» и «слизняк». Но если бы процессы, происходящие в нашем мозге, ограничивались этим, мы бы не могли знать наверняка, что произошло: ребенок съел слизняка, слизняк съел ребенка или ребенок и слизняк поели. Концепты должны быть привязаны к ролям (в логике их называют «аргументами»): кто является едоком, а кто съеденным.

Тогда, может быть, можно прикрепить отдельный узел к каждой комбинации концептов и ролей? У нас получится узел «ребенок-ест-слизняка» и узел «слизняк-ест-ребенка». Ведь в мозге огромное количество нейронов, скажете вы, почему бы не поступить так? Одна из причин, почему так поступить нельзя, – в том, что для этого нужно не просто огромное, а огромное-преогромное количество. Количество комбинаций растет пропорционально допустимому размеру, приводя к комбинаторному взрыву, в результате которого количество комбинаций превысит возможности мозга даже по самым оптимистичным оценкам. Легенда гласит, что визирь Сисса Бен Дахир попросил у короля Инди Ширхама скромную награду за изобретение шахмат. Он просил всего лишь положить на первую клетку шахматной доски одно зернышко пшеницы, на вторую – два зернышка пшеницы, на третью – четыре, и так далее. Они не успели даже дойти до последней, шестьдесят четвертой клетки, когда король обнаружил, что, сам того не зная, потратил все запасы зерна в королевстве. Награда составила четыре триллиона бушелей – это количество зерна, произведенного во всем мире за две тысячи лет. Точно так же комбинаторные способности мыслей могут легко превзойти количество нейронов в мозге. Сотню миллионов триллионов значений предложений нельзя впихнуть в мозг, в котором всего сто миллиардов нейронов, отводя для каждого значения собственный нейрон.

Впрочем, даже если бы это и было возможно, сложные мысли все равно не хранились бы в мозге в готовом виде, по одной на каждый нейрон. На это указывает то, что наши мысли связаны между собой. Представим, что у каждой мысли есть собственный узел. Тогда нужно было бы иметь отдельные узлы для случаев, когда ребенок съел слизняка, слизняк съел ребенка, курица съела слизняка, слизняк съел курицу, ребенок увидел слизняка, слизняк увидел ребенка, курица увидела слизняка и т. д. Отдельные узлы пришлось бы выделить для каждой из этих мыслей и для многих других мыслей; ведь любой человек, способный подумать о том, что ребенок увидел курицу, также способен подумать о том, что курица увидела ребенка. И все же в этом арсенале мыслеблоков есть кое-что подозрительное: в нем сплошь и рядом встречаются совпадения. То ребенок что-то увидел, то слизняк что-то увидел, то слизняк что-то съел, то ребенок что-то съел, и т. д. Мысли сами собой выстраиваются в ячейки, образующие ряды, колонны, уровни, гиперряды, гиперколонны и надуровни обширной матрицы. Но эта замечательная система может показаться сложной для понимания, только если допустить, что мысли – это очень большой набор отдельных узлов, а эти узлы – совокупность изолированных фактов, никак не связанных друг с другом. Когда природа представляет нашему вниманию объекты, идеально подходящие для заполнения такого прямоугольного модуля ячеек, она как бы подсказывает нам, что эти объекты наверняка состоят из меньших компонентов, соответствующих рядам и колоннам. Именно так периодическая система химических элементов привела к пониманию структуры атома. По аналогичным причинам мы можем сделать вывод, что канву всех наших мыслей составляют образующие их концепты. Мысли состоят из концептов; они не хранятся в мозге в готовом виде112.

Композициональность, как ни странно, представляет большие сложности для коннектоплазмы. Все напрашивающиеся для решения проблемы методы оказываются недостаточными. Предположим, что мы отвели по одному узлу для каждого сочетания одного концепта и одной роли. Допустим, один узел будет означать «ребенок ест», а другой – «слизняк съеден», или, допустим, один узел будет означать «ребенок выполняет действие», а другой – «слизняк является объектом действия». Это позволит значительно сократить число комбинаций – но лишь за счет новой неопределенности относительно того, кто совершил какое действие и над кем. Мысль «Ребенок съел курицу, когда пудель съел слизняка» будет невозможно отличить от мысли «Ребенок съел слизняка, когда пудель съел курицу». Проблема в том, что блок «ребенок ест» не содержит информации о том, что ребенок съел, а блок «слизняк съеден» не содержит информации о том, кто его съел.

Шагом в правильном направлении будет встроить в систему способность различать концепты (ребенок, слизняк и др.) и роли, которые они выполняют (деятель, объект действия и т. д.). Допустим, мы создадим отдельные фонды узлов – один для роли деятеля, а другой для роли объекта действия. Чтобы представить суждение, каждый фонд узлов дополняется шаблоном для выполняющего роль в данный момент концепта, поступающим из отдельного раздела памяти. Если бы мы соединили каждый узел с соседними узлами, мы бы получили автоассоциатор для суждений, способный немного работать с комбинаторными мыслями. Мы бы могли хранить в готовом виде суждение «ребенок съел слизняка»; в этом случае, получая любые два компонента в форме вопроса (скажем, «ребенок» и «слизняк» в форме вопроса «Каково отношение между ребенком и слизняком?»), система дополняла бы шаблон, включив узлы, соответствующие третьему компоненту (в данном случае «съел»).

Ведь так? Увы, нет. Рассмотрим такие мысли:

Baby same-as baby. (Ребенок то-же-самое-что ребенок.)

Baby different-from slug. (Ребенок отличное-от слизняк.)

Slug different-from baby. (Слизняк отличное-от ребенок.)

Slug same-as slug. (Слизняк то-же-самое-что слизняк.)

Никакое сочетание весов связей, при котором элемент «ребенок» в первой ячейке и элемент «то-же-самое-что» в средней ячейке активизируют элемент «ребенок» в третьей ячейке, а элемент «ребенок» и «отличное-от» активизируют элемент «слизняк», а элемент «слизняк» и элемент «отличное от» включают элемент «ребенок», не позволит элементам «слизняк» и «то-же-самое-что» активизировать элемент «слизняк». Это все та же самая проблема «исключающего ИЛИ», только в другом обличье. Если связи, соединяющие элементы «ребенок» и «ребенок» и элементы «то-же-самое-что» и «ребенок» сильны, они активизируют элемент «ребенок» в ответ на «ребенок то-же-самое-что____» (что хорошо), однако они включат элемент «ребенок» и в ответ на «ребенок отличное-от – ____» (что плохо), и в ответ на «слизняк то-же-самое-что____» (что тоже плохо). Можно как угодно жонглировать весами связей, но вы никогда не найдете такой вариант, который будет работать для всех четырех предложений. Любой человек безошибочно поймет все четыре предложения, следовательно, человеческий мозг представляет суждения в более замысловатой форме, чем совокупность связей концепта с концептом или концепта с ролью. Мозгу нужна репрезентация для самого суждения. В нашем примере модели нужен дополнительный уровень – более конкретно, уровень, на котором суждение было бы представлено полностью, независимо от концептов и их ролей в суждении113.

Рисунок внизу показывает в упрощенной форме разработанную Джеффри Хинтоном модель, которая позволяет справиться с предложениями.

Узлы в модуле «суждений» активизируются произвольным образом, получается что-то вроде серийных номеров, которыми помечаются полноценные мысли. Этот модуль функционирует как сверхструктура, благодаря которой концепты в каждом суждении остаются каждый в своей ячейке. Обратите внимание, как точно архитектура этой сети воспроизводит стандартный, напоминающий естественный язык, мыслекод! Выдвигались и другие версии композициональных сетей, которые не так очевидно имитируют естественный язык, но все они непременно включали в себя специальные компоненты, которые задуманы для того, чтобы отделять концепты от их ролей, и для того, чтобы правильно увязывать каждый концепт с его ролью. Чтобы сеть могла выполнять функции, свойственные мышлению, нужно вернуть в нее такие компоненты логики, как предикат, аргумент и суждение; одних только ассоциаций явно недостаточно114.

Еще одна замечательная способность мышления, которую вы, возможно, даже никогда не осознавали, называется квантификацией или присваиванием значения переменным. Она представляет собой сочетание первой проблемы – различения индивидных объектов – и второй – композициональности. Ведь предметом наших композициональных мыслей, в конце концов, часто бывают индивидные объекты, и очень важно, каким образом эти индивидные объекты связаны с разными элементами мысли. Мысль о том, что какой-то определенный ребенок съел какого-то определенного слизняка, отличается от мысли о том, что какой-то определенный ребенок ест слизняков в принципе, или о том, что все дети вообще едят слизняков. Существует целая плеяда анекдотов, основанных на том, что слушатель не распознает это различие. «В США каждые сорок пять секунд кто-то получает травму головы» – «О, боже! Не повезло этому кому-то!» Когда мы слышим фразу «Хильдегард хочет выйти замуж за мускулистого мужчину», мы не можем знать наверняка, есть ли у нее уже кто-то подобный на примете или она просто регулярно ходит в спортзал в надежде найти кого-нибудь. Авраам Линкольн сказал: «Можно некоторое время дурачить всех людей; можно даже дурачить некоторых людей все время; но нельзя дурачить все время всех людей». Без способности квантификации мы едва бы поняли, что он сказал.

В этих примерах у нас есть несколько предложений или несколько прочтений двусмысленного предложения, в которых одни и те же концепты играют одни и те же роли, однако в результате получаются очень разные идеи. Привязать концепты к их ролям недостаточно. Специалисты по логике фиксируют эти различия с помощью переменных и кванторов. Переменная – это символ-заполнитель вроде х или у, который обозначает одну и ту же сущность в разных суждениях или в разных частях одного суждения. Квантор – это символ, который может выражать отношения «Существует определенный х, который…» и «Несмотря на х, справедливо утверждение, что…». Мысль может быть выражена суждением, состоящим из символов, которые обозначают концепты, роли, кванторы и переменные, расположенные в строго определенном порядке с использованием скобок. Сравним, к примеру: «Каждые сорок пять секунд ( существует X [который получает травму] ) » и «Существует X ( который каждые сорок пять секунд [получает травму] ) ». Наш мыслекод должен иметь механизм, который делал бы что-то вроде этого, но пока у нас нет ни малейшего понятия, как это можно осуществить в рамках ассоциативной сети.

Мало того, что суждение может быть об индивидном объекте, оно само должно интерпретироваться как нечто вроде индивидного объекта, а отсюда вытекает еще одна проблема. Сила коннектоплазмы заключается в наложении разных шаблонов в пределах одной и той же совокупности узлов. К сожалению, результатом может стать причудливая химера или вообще сбой в работе сети. Это одно из проявлений вечной проблемы коннектоплазмы, которая известна как интерференция или перекрестные помехи.

Возьмем два примера. Психологи Нил Коэн и Майкл Мак-Клоски научили сеть складывать две цифры. Сначала ее обучили прибавлять единицу к другим числам: получая на входе «1» и «3», сеть научилась выдавать на выходе «4», и т. д. Далее ее научили прибавлять 2 к любому другому числу. Увы, для решения задачи с прибавлением двойки веса связей переросли в значения, оптимальные для прибавления 2, а поскольку у сети не было специально выделенных средств, чтобы закрепить знание о том, как прибавить 1, она попросту забыла, как это делается! Этот эффект известен как «катастрофическое забывание», потому что он отличается от постепенного забывания, с которым мы имеем дело в повседневной жизни. Еще один пример – сеть, разработанная Мак-Клелландом и его коллегой Аланом Кавамото для присваивания значений двусмысленным предложениям. Например, предложение A bat broke the window (предложение может быть переведено с английского как «Бита разбила окно» или «Летучая мышь разбила окно». – Прим. пер.) может означать либо что в окно бросили бейсбольную биту, либо что через него пролетело крылатое млекопитающее. Сеть выдала единственное толкование, к которому не мог прийти человек: крылатое млекопитающее разбило окно с помощью бейсбольной биты115!

Как и в случае с любым другим инструментом, свойства, которые делают коннектоплазму пригодной для одних вещей, делают ее же непригодной для других вещей. Способность сети к обобщению обусловлена плотной взаимосвязанностью ее элементов и наложением входных данных. Но представьте, что вы – один из узлов сети; вам покажется не таким уж приятным то, что вам в ухо постоянно что-то орут тысячи других узлов и вас то и дело захлестывают волны входных данных. Нередко разные куски информации требуется хранить отдельно, чтобы они не смешивались. Один из способов сделать это – предоставить каждому суждению собственную ячейку памяти и адрес (что, опять же, указывает на то, что не все особенности компьютера оказываются всего лишь странностями кремниевого разума). Компьютеры, в конце концов, придумали не для обогрева, а для того, чтобы обрабатывать информацию таким образом, который имел бы значение для пользователей.

Психологи Дэвид Шерри и Дэн Шактер продолжили эту цепь рассуждений. Они отметили, что разные технические требования к системе памяти зачастую противоречат друг другу. Естественный отбор, утверждают они, отреагировал на эту проблему тем, что наделил организмы специализированными системами памяти. Каждая из таких систем имеет вычислительную структуру, оптимизированную для выполнения одной из задач, стоящей перед мышлением животного. Например, у птиц, запасающих зерно впрок на черный день, сформировалась отличная память на тайники (в случае североамериканской ореховки их количество составляет до десяти тысяч). Птицы, самцы которых поют, чтобы впечатлить самок или внушить страх другим самцам, хранят в памяти большое количество песен (двести в случае соловья). Память на тайники и память на песни располагаются в разных структурах мозга и имеют разные схемы нервных соединений. Мы, люди, одновременно предъявляем к своей системе памяти два очень различных требования. Мы должны помнить отдельные эпизоды: кто сделал что, кому, где, когда, почему, – а для этого необходимо каждый эпизод пометить временем, датой и серийным номером. Вместе с тем мы должны извлекать из информации обобщенное знание о том, как устроены люди и мир вокруг них. Шерри и Шактер предполагают, что природа дала нам по одной системе памяти для каждого из этих требований: «эпизодическую», или автобиографическую, память и «семантическую» память, то есть память общего знания (впервые это разграничение было проведено психологом Энделем Тулвингом)116.

Тонкость, благодаря которой количество доступных человеку мыслей увеличивается до поистине астрономического, заключается не в разделении концептов на три или четыре роли, а в своеобразной плодовитости нашего мышления, носящей название «рекурсивность». Фиксированной совокупности узлов для каждой роли недостаточно. Мы, люди, можем взять любое суждение целиком и отвести ему роль в более длинном суждении, а потом взять это длинное суждение и встроить его в еще большее, тем самым создав иерархическую структуру из суждений внутри суждений. Мы можем подумать не только о том, что ребенок съел слизняка, но и о том, что отец видел, как ребенок съел слизняка, и о том, что мне интересно, видел ли отец, что ребенок съел слизняка, и о том, что отец знает, что мне интересно, видел ли он, что ребенок съел слизняка, и о том, что я догадываюсь, что отец знает, что мне интересно, видел ли он, что ребенок съел слизняка, и т. д. Точно также, как способность прибавить единицу к любому числу влечет за собой способность генерировать бесконечное количество чисел, способность встроить суждение в другое суждение влечет за собой способность помыслить бесконечное число мыслей.

Чтобы получить суждения внутри суждений от сети, изображенной на предыдущей схеме, можно добавить еще один уровень связей в верхней части схемы, соединив модуль узлов, соответствующий целому суждению, с ячейкой роли в некотором более крупном суждении; эта роль может быть чем-то вроде «событие – наблюдаемое». Если мы продолжим добавлять всё новые уровни, мы можем получить многоуровневое суждение, запечатлев в кон-нектоплазме целую иерархическую структуру, соответствующую ему. Но это решение слишком громоздко и вызывает подозрения. Для каждого типа рекурсивной структуры придется предусмотреть отдельную сеть: одну сеть для человека, который думает о суждении, вторую – для человека, думающего о суждении о человеке, думающем о суждении, третью – для человека, сообщающего суждение о некоем человеке другому человеку, и т. д.

В вычислительной технике и психолингвистике используется более мощный и гибкий механизм. Каждая простая структура (соответствующая человеку, действию, суждению и т. д.) представляется в долгосрочной памяти один раз, и процессор переключает внимание от одной структуры к другой, сохраняя маршрут своих перемещений в краткосрочной памяти, чтобы связать суждение воедино. Этот динамический процессор, называемый рекурсивной сетью переходов, особенно хорошо воспроизводит понимание предложений, потому что мы слышим и читаем слова по одному, а не впитываем целое предложение целиком. И наши сложные мысли мы, по-видимому, жуем по кусочку, а не заглатываем или отрыгиваем целиком, а это означает, что наш мозг оснащен рекурсивным обрабатывателем суждений для мыслей, а не только для предложений. Психологи Майкл Джордан и Джефф Элман создали сети, в которых исходящие из узлов выхода соединения возвращаются обратно на совокупность узлов краткосрочной памяти, тем самым запуская новый цикл. Такая циклическая структура позволяет представить, как может протекать в нейронных сетях процесс обработки итеративной информации, однако и этого недостаточно, чтобы интерпретировать или строить структурированные суждения. В последнее время были предприняты попытки соединить циклическую сеть с сетью суждений и получить нечто вроде рекурсивной сети переходов, состоящей из кусочков коннектоплазмы. Эти попытки показывают, что нейронным сетям будет не по плечу наше рекурсивное мышление, если они не будут специально организованы в рекурсивный процессор117.

Нужно отдать должное человеческому мышлению: у него есть и еще одна когнитивная способность, которую очень сложно выжать из коннектоплазмы, а следовательно – сложно объяснить с помощью ассоциационизма. Нейронные сети с легкостью реализуют нечеткую логику, в которой все представляет собой что-то вроде чего-то в той или иной степени. Нужно признать, многие понятия из сферы здравого смысла довольно размыты и им сложно дать четкое определение. Философ Людвиг Виттгенштейн предлагал в качестве примера понятие «игра», образцы которого (паззлы, роллер-дерби, керлинг, «Подземелья и драконы», петушиные бои и т. д.) не имеют между собой ничего общего. Ранее я приводил еще два примера – «холостяк» и «овощ». Членам нечетко определяемой категории недостает одной определяющей черты; они во многих отношениях пересекаются – почти как члены одной семьи или как нити веревки, из которых ни одна не проходит по всей длине. В комиксе «Bloom County» пингвин по имени Опус, временно потерявший память, возражает, когда ему говорят, что он – птица. Птицы изящные и обтекаемые, отмечает Опус, а он – нет. Птицы умеют летать, а он – нет. Птицы умеют петь, а от его исполнения песни Yesterday слушатели давятся от хохота. Опус начинает подозревать, что на самом деле он – лось Буллвинкль. Итак, даже такие концепты, как «птица», оказываются построенными не на необходимых и достаточных условиях, а на прототипических представителях категории. Если вы найдете слово «птица» в словаре, то на картинке увидите не пингвина, а какую-нибудь маленькую птичку, например, воробья.

Эксперименты в области когнитивной психологии показали, что люди демонстрируют крайнюю узколобость в определении птиц, других животных, овощей, инструментов. У людей есть общий стереотип, который они распространяют на всех членов категории; этот стереотип они узнают быстрее, чем не соответствующие ему экземпляры, и даже заявляют, что видят стереотип, в тех случаях, когда на самом деле они видели образцы, похожие на него. Подобные ответы можно прогнозировать, подведя итог свойствам, которые у данного члена категории являются общими с другими ее членами: например, чем больше у него свойств, характерных для птицы, тем в большей степени он является птицей. Автоматический ассоциатор, получив образцы данной категории, сделает примерно то же самое, потому что он вычислит корреляции свойств. Это заставляет думать, что некоторые части человеческой памяти устроены наподобие автоассоциатора118.

Но ведь не может же наше мышление ограничиваться этим! Люди не всегда мыслят нечеткими категориями. Мы смеемся над Опусом, потому что часть нашего сознания понимает, что на самом деле он – птица. Может быть, мы сходимся в определении прототипа бабушки – это добрая седоволосая женщина лет семидесяти, которая потчует внуков кексами с черникой или куриным бульоном (зависит от того, чей это стереотип), но в то же самое время без труда понимаем, что и Тина Тернер и Элизабет Тейлор – тоже бабушки (более того, Тейлор – еще и еврейская бабушка). Если говорить о холостяках, многие люди – например, представители иммиграционных властей, мировые судьи, чиновники сферы здравоохранения – печально известны тем, что очень четко определяют эту категорию; мы все знаем, как много может зависеть от клочка бумаги. Примеры четкого мышления мы находим всюду. Судья может освободить явно виновного подозреваемого из-за формальности. Бармен может не налить пива взрослому человеку за день до того, как ему исполнится двадцать один год. Мы шутим, что нельзя быть немножко беременной или слегка женатым, но после того, как исследование канадских ученых показало, что замужние женщины занимаются сексом 1,57 раз в неделю, карикатурист Терри Мошер изобразил женщину, которая сидит в постели рядом с храпящим мужем и говорит: «Что ж, уже 0,57».

На самом деле нечеткие и четкие версии одной и той же категории могут мирно сосуществовать в одной и той же голове. Психологи Шэрон Армстронг, Генри Глейтман и Лайла Глейтман провели коварный эксперимент: они дали студентам университета стандартные тесты для нечетких категорий, но определить предложили очень четко определяемые категории – такие, как «нечетное число» и «лицо женского пола». Испытуемые с готовностью согласились с такими абсурдными утверждениями, как то, что 13 – более удачный пример нечетного числа, чем 23, и что мать – более удачный пример лица женского пола, чем комедийная актриса. Уже через несколько минут испытуемые заявляли, что число может быть либо четным, либо нечетным, а человек либо женского пола, либо мужского, без переходных вариантов.

У людей есть два режима мысли. Они могут формировать размытые стереотипы, автоматически усваивая корреляции свойств и опираясь на утверждение о том, что все явления в мире склонны делиться на группы (тот, кто лает, также должен кусаться и мочиться на пожарный гидрант). В то же время люди могут создавать системы правил – интуитивные теории, которые определяют категории с точки зрения применимых к ним правил и которые оценивают все члены категории одинаково. Во всех культурах есть системы формального родства – такие точные, что по ним можно доказывать теоремы. И в нашей собственной системе родства есть совершенно четкое определение того, что такое «бабушка»: это мать одного из родителей, и наплевать, печет она кексы или нет. Законодательство, арифметика, народные традиции, социальные условности (которые включают в себя и обряды перехода, четко отграничивающие взрослых от детей и холостяков от женатых мужчин) – все это примеры систем правил, в которые включены все люди на планете. Грамматика языка – это тоже одна из таких систем119.

Системы правил позволяют нам подняться над банальным сходством и сделать выводы, основанные на трактовке явлений. Как пишут Хинтон, Румельхарт и Мак-Клелланд, «людям хорошо дается обобщение только что полученных знаний. Если, к примеру, вы узнаете, что шимпанзе любят лук, вы, вероятно повысите свою оценку вероятности того, что гориллы тоже любят лук. В сети, которая использует распределенные репрезентации, такого рода обобщения производятся автоматически»120. Это смелое заявление – современный отголосок замечания Юма о том, что от тела, схожего с хлебом по цвету и консистенции, мы ожидаем аналогичной степени питательности. Тем не менее их предположение рушится в любом случае, когда речь идет о реальных знаниях человека. Конечно, любящие лук гориллы были взяты только ради примера, но интересно отметить, что авторы этого простого примера недооценивают наши способности. Даже зная немного о зоологии и совсем немного о гориллах, я уж точно не увеличил бы свою оценку вероятности того, что гориллы любят лук. Животных можно классифицировать по нескольким признакам. Их можно сгруппировать по генеалогии и сходству в одну таксономическую категорию, например, «человекообразные», но их также можно объединить в группы, которые отличаются друг от друга способом добычи пищи: всеядные, травоядные и плотоядные. Исходя из этого принципа, я могу рассуждать следующим образом. Шимпанзе – всеядные, поэтому неудивительно, что они едят лук; в конце концов, мы, будучи всеядными, тоже его едим. А вот гориллы – травоядные; они всю жизнь жуют дикий сельдерей, чертополох и другие растения. Травоядные могут быть очень привередливы в отношении видов, которыми они питаются, потому что их пищеварительный тракт оптимально приспособлен для того, чтобы устранять влияние ядов, содержащихся только в определенных видах растений (наиболее яркий пример – это коалы, которые специализируются на поедании листьев эвкалипта). Поэтому я бы не удивился, если бы гориллы не стали есть едкий лук, что бы там ни ели шимпанзе. В зависимости от того, какую систему классификации я имею в виду, шимпанзе и гориллы будут либо очень похожими соседями по таксономической категории, либо видами столь же разными, как люди и коровы121.

В рамках ассоциационизма и его реализации в форме коннектоплаз-мы то, как представлен объект (а именно в виде совокупности характеристик), автоматически заставляет систему делать определенные обобщения (если только она не была научена избегать подобного обобщения, намеренно предъявляя примеры обратного). Альтернатива, к которой я пытаюсь подвести, – это то, что человек может мысленно представить в символической форме виды объектов, причем используемые символы могут иметь отношение к целому ряду систем правил, которые мы все время держим в голове. (В теории искусственного интеллекта этот метод называется «обобщение, основанное на объяснении», а коннекционистские модели – это образец метода, называемого «обобщение, основанное на сходстве».) Наши системы правил выражают знание в форме композиционных, выраженных количественно рекурсивных суждений, и совокупности этих суждений смыкаются, образуя модули или интуитивные теории, касающиеся конкретных областей человеческого опыта: таких, как родство, интуитивная наука, интуитивная психология, числа, законы и язык. Некоторые из этих областей более подробно освещаются в главе 5122.

Что толку в четких категориях и системах правил? В социальном мире они могут послужить для разрешения спора между враждующими сторонами, каждая из которых ссылается на нечеткую границу категории: одна сторона заявляет, что тот или иной объект входит в категорию, а другая – что не входит. Обряды посвящения, достижение совершеннолетия, выдача дипломов, лицензий и других юридических документов – все эти события проводят четкие линии, благодаря которым каждый член общества может точно знать статус любого другого его члена. Подобным образом правила, не допускающие отступлений, являются хорошей защитой против тактики поэтапных мероприятий, когда кто-то пытается, пользуясь нечеткостью категории, постепенно отвоевать «территорию», выигрывая одно спорное дело за другим.

Правила и абстрактные категории помогают разобраться и в природе вещей. Обходя вопрос сходства, они позволяют нам проникнуть под внешний слой явлений и выяснить скрытые закономерности, в соответствии с которыми функционирует окружающий нас мир. А поскольку эти закономерности в определенном смысле слова цифровые, они придают репрезентациям точность и стабильность. Если сделать копию с аналоговой записи на магнитной пленке, а потом с копии сделать еще одну копию и так далее, качество записи будет ухудшаться с каждым «поколением». Но если сделать такую же цепочку копий в цифровом формате, качество последней будет нисколько не хуже первой. Подобным образом четкие символические репрезентации позволяют составлять логические цепочки, в которых символы дословно копируются в каждую из последующих мыслей, образуя то, что в логике называют термином «сорит»123:

Все во́роны – врановые.

Все врановые – птицы.

Все птицы – животные.

Всем животным нужен кислород.

Сорит позволяет мыслителю уверенно делать выводы, несмотря на ограниченный опыт. Так, мыслитель может сделать вывод, что воронам нужен кислород, даже если никто никогда не пытался лишить ворона кислорода и посмотреть, что произойдет. Мыслитель может прийти к этому выводу, даже если он никогда не наблюдал эксперимента, в котором какое бы то ни было животное было лишено кислорода, а только слышал об этом от заслуживающего доверия специалиста. Однако если каждый логический шаг в этом рассуждении будет нечетким, или вероятностным, или осложненным частными характеристиками представителей категории предыдущего логического шага, коэффициент ухудшения будет постепенно расти. Последнее утверждение будет таким же зашумленным, как энная пиратская копия видеокассеты или последняя произнесенная шепотом фраза в игре «сломанный телефон». Представители всех цивилизаций могут выстраивать длинные цепочки рассуждений из звеньев, истинность которых они не наблюдали непосредственно. Философы неоднократно указывали на то, что именно эта способность сделала возможным существование науки123.

Как и многие другие проблемные вопросы, связанные с мышлением, полемику по поводу коннекционизма нередко сводят к полемике между врожденностью и обучением. И, как всегда в таких случаях, это затрудняет способность четко мыслить. Несомненно, обучение играет огромную роль в моделировании коннекционных сетей. Часто разработчик сетей, вынужденный вернуться к чертежной доске из-за проблем, о которых я говорил выше, решает воспользоваться способностью сети со скрытыми уровнями запоминать совокупности входов и выходов и распространять их на новые подобные им данные. Иногда можно даже заставить типовую сеть со скрытыми уровнями делать то, что вам нужно, предварительно заучив ее «до смерти». Тем не менее обучение в авральном режиме само по себе не может быть спасением для коннектоплазмы. И не потому, что у сетей слишком мало «врожденной» структуры и слишком много информации на входе из окружения, а потому что у грубой коннектоплазмы так мало мощности, что иногда приходится создавать сети, используя самую худшую комбинацию: слишком малое количество врожденной структуры в сочетании со слишком большим количеством информации на входе из окружения.

Так, Хинтон разработал трехуровневую сеть для вычисления родственных отношений. (По его замыслу, она должна была служить примером того, как работают сети, однако другие коннекционисты восприняли ее как реальную психологическую теорию.) Уровень ввода включал в себя узлы, соответствующие имени, и узлы, соответствующие типу родственных отношений, например, «Колин» и «мать». Уровень вывода включал в себя узлы, соответствующие имени человека, который находится в таких отношениях с заданным человеком, например, «Виктория». Поскольку узлы и связи составляют врожденную структуру сети, а усваивать в процессе обучения ей приходится только веса связей, эта сеть, если ее воспринимать буквально, соответствует врожденному модулю мозга, предназначенному для выдачи ответов на вопросы о том, кто состоит с указанным человеком в родственном отношении указанного типа. Эта система не пригодна для анализа родственных отношений в общем, потому что знания в ней как бы размазаны по всем весам связей, соединяющим уровень вопросов с уровнем ответов, а не хранятся в базе данных, к которой могут иметь доступ разнообразные процессы поиска информации. Следовательно, это знание окажется бесполезным, если хотя бы немного изменить вопрос: например, спросить, в каком родственном отношении состоят между собой два человека, или запросить имена членов семьи человека и родственные отношения, в которых он с ними состоит. В этом смысле модель имеет слишком большой процент врожденной структуры; она создана специально для конкретного типа вопросов124.

Научив модель воспроизводить отношения в маленькой вымышленной семье, Хинтон обратил внимание на способность системы переносить сделанные выводы на другие пары родственников. Тем не менее при этом очень мало говорилось о том, что для того, чтобы сеть могла распространить выводы на 4 возможные пары из 104, ее нужно было сначала обучить работать с первой сотней. И каждую из ста пар в режиме обучения нужно было подать в сеть 1500 раз (это в общей сложности 150000 уроков!). Здесь явно не было ничего общего с тем, как усваивают систему семейных отношений маленькие дети. Эти цифры типичны для коннекционных сетей, потому что они приходят к решению не через правила; в них просто нужно «вдолбить» большинство примеров, и тогда они смогут просто переносить знания с одного примера на другой. Любой существенно отличающийся от прочих пример обязательно должен входить в набор для обучения, иначе сеть будет делать сомнительные выводы, как в анекдоте про статистиков на утиной охоте: один стреляет на метр выше, чем нужно, второй стреляет на метр ниже, а третий кричит: «Попали!»

Почему я уделяю столь пристальное внимание коннектоплазме? Уж конечно, не потому, что я считаю моделирование нейронных сетей бессмысленным занятием – как раз наоборот! Без него все мое величественное строение рассуждений о том, как работает мозг, осталось бы парить в воздухе. И уж конечно, я не считаю, что моделирование сетей заключается всего лишь в распределении подрядов между строителями-демонами и структурами данных нейронной «аппаратуры». Многие коннекционные модели поражают тем, чего можно добиться с помощью простейших операций ментального вычисления. С другой стороны, я считаю, что достоинства коннекционизма сильно преувеличивают. Благодаря тому, что сети много рекламировали, называя их функционирование мягким, параллельным, аналогичным, биологичным, бесперебойным, они приобрели привлекательные коннотации и обширную армию поклонников. Но ведь нейронные сети не способны творить чудеса, они только выполняют определенные логические и статистические операции. Решения по таким вопросам, как представление вводных данных, количество сетей, выбранная для каждой из них схема соединений, пути данных, управляющие структуры, соединяющие их между собой, – все это может рассказать гораздо больше о том, что делает систему по-настоящему интеллектуальной, чем общие способности составляющей ее коннектоплазмы.

И все же моя главная цель – не показать, на что неспособна та или иная модель, а показать, на что способен мозг. Смысл этой главы в том, чтобы познакомить вас с материей, из которой состоит наш разум. Мысли и мышление в наше время – уже не призрачные тайны, а механические процессы, которые мы можем изучить, рассматривая и оспаривая сильные и слабые стороны разных теорий. Мне представляется особенно показательным рассмотрение недостатков освященной веками доктрины об ассоциации идей, поскольку они позволяют лучше оценить точность, тонкость, сложность и открытость нашего повседневного мышления. Вычислительные возможности разума позволяют человеку достигать вполне реальных результатов. Они находят прекрасное применение в любви, правосудии, творчестве, музыке, родственных отношениях, законодательстве, науке и других сферах человеческой деятельности, которые мы рассмотрим в следующих главах. Но прежде чем перейти к этому, нам необходимо вернуться к другому вопросу, с которого начиналась эта глава.

Цитируется в переводе С. И. Церетели.