Диалоги (июль 2003 г.) - Александр Гордон
Шрифт:
Интервал:
Закладка:
А.Г. Это, в общем, довольно идеальный инструмент. Это в каком-то смысле лучше, чем знаменитая дрозофила. Потому что здесь можно плодить популяции, если говорить об эволюции этих искусственных объектов, как у нас шла речь в одной из программ. То есть у исследователя время не ограничено…
А что же с аниматами? Я просто хочу напомнить, что здесь, у нас, время программы ограничено, как время поиска у ручейника.
А.Ж. Я бы хотел здесь поговорить, дополнить рассказ Валентина Анатольевича о том, что интересен вопрос: а как же вырабатывается эта стратегия поведения у организма? Это то, о чём думали мы. И здесь, мне кажется, что многие ответы можно найти вот каким путём. Если встать на место нервной системы организма и оказаться в тех условиях, в которых находится она, то из этих условий просто логически вынужденно будет следовать и структура, и функция, и алгоритмы, по которым должна работать эта система. Я и хочу рассказать о результатах попытки такого вывода, это то, чем мы занимаемся. Покажите, пожалуйста, первый слайд.
Представим себя на месте управляющей системы. Что это такое? Вот есть любой организм – это некоторое тело, или некоторый объект, который является, по сути, частью среды. Если мы говорим о том, что этот организм управляем, значит, внутри него есть управляющая система, которая является частью этого организма. Причём будем рассматривать только такие организмы и такие объекты, где управляющая система лежит именно внутри организма, а не руководит им по телеметрии.
Из этой картинки сразу же следуют цели управления, то есть те цели, которые старается достигнуть система управления. Мне кажется, что здесь существуют две главные цели. Первая цель – это обеспечить выживание организма. Иначе, если этого нет, не о чем говорить, всё разваливается, и как такового этого тела не существует.
И вторая цель – это накопить знания, потому что управляемый организм, управляемый объект препятствует разрушению агрессивным воздействиям среды не за счёт своей твёрдости, как алмаз: «Вот стою тут и буду сопротивляться». Он препятствует разрушению за счёт того, что ведёт себя активно, он совершает некоторое воздействие на среду. И через эту среду к организму возвращается реакция совершенно другого типа. Например, если ребёнок хочет есть, то он кричит, и приходит мама с бутылочкой молока. Или, скажем, мы что-то бросаем вверх, а в результате падает плод с дерева. Организму надо ещё найти и понять эти реакции на его собственные действия.
Значит, для того чтобы обеспечить выживание, нужно знание: как это действие сопряжено с этим результатом? Поэтому я бы здесь выделил эти две цели управления. Может быть, даже цель накопления знания первична. Если мы хотим исследовать какое-то неизвестное пространство и сделаем для этого такого робота, который бы накопил знания, нам надо подумать о том, как он выживет, нам надо обеспечить его выживание.
Из этой же картинки сразу, наверное, следует (в грубом виде) алгоритм такого поиска. Нервная система должна найти обратные связи через среду. Это очень хорошая мысль, которую петербургский учёный Владимир Левченко когда-то красиво сформулировал. Среди всех действий, которые может совершать организм, есть такие, которые уходят в бесконечность и никуда не возвращаются, никогда к нам не вернутся. Надо найти те воздействия, которые через среду к нам вернутся, на наши датчики. И вот этот поисковый алгоритм нам надо найти.
Вы помните, как Максвелл в своё время предложил своего демона, которого помещал внутрь чёрного ящика и, пользуясь этим приёмом, он логически рассуждал, что же там должно происходить. Давайте мы сейчас с вами, подобно этому демону, погрузимся внутрь этого кружка нервной системы и посмотрим, что же она должна делать, если она находится в этих условиях.
Покажите, пожалуйста, следующий слайд. Исходное условие – это автономность системы управления, как я уже сказал. То есть мы находимся внутри тела. Второе условие – это дискретность, то есть у нас есть дискретные входы. Вот эти канальчики, по которым поступает дискретная информация. И есть дискретные выходы. Может быть, их много. Но это дискретные кнопочки, которые мы можем нажать. То есть, то, что является выходом нервной системы – это пучок волокон, через которые идут бинарные сигналы, точно так же, как и через вход. Их может быть много, миллионы рецепторов, но через них поступают бинарные сигналы.
И вот перед нами есть экран с входящей информацией, на котором мы видим входящие сигналы. И есть целый, так сказать, набор кнопочек, на которые нужно нажимать.
Представим себя внутри, в этой чёрной комнате с экраном, на который нам проецируется информация из окружающего мира. Первая задача, которую система должна решить – как в этом потоке входной информации научиться узнавать что-то знакомое. Например, сказать: «Ага, вот это красное пятно я уже когда-то видел». И когда этот момент произойдёт, тем самым произойдёт некое формирование образа (вот этого пятна) и акт его распознавания – «я его распознал». Теперь система его будет узнавать всегда, когда она его увидит, она его распознает. Это первое. Поэтому на этой схеме, которая сейчас видна, первый блок в нервной системе – это формирование и распознавание образов.
А.Г. Для того чтобы распознать, всё-таки надо каким-то образом повлиять на это красное пятно для того, чтобы сделать заключение о том, что это такое. Ведь недостаточно просто сенсорно считать.
А.Ж. Вы правильно говорите, но задачу: «Узнать это пятно» – можно решить, как бы не влияя на него в некотором смысле слова. То есть, если у вас несколько раз повторяется эта конфигурация, вы можете даже не воздействовать на неё, но узнавать: «Вот это лицо я уже видел неоднократно в толпе».
А.Г. Но кто это, я не знаю.
А.Ж. Я пока не знаю. Второе. Теперь надо найти, как я могу своими выходными воздействиями повлиять на это красное пятно. Ну, естественно, если у вас никаких знаний нет, вы начинаете что-то случайно перебирать. Наконец, вы находите, что вот это действие позволяет это пятно убрать. А вот это действие позволяет его вызвать. Это то, вообще говоря, с чего начинает ребёнок. Какие действия он находит первыми? Как игрушку взять, а следующее действие, он что находит? Как её бросить. Как маму вызвать? Как маму отогнать. Как это получить? Как от этого избавиться? Потому что он имеет дело с бинарными сигналами и бинарными объектами, и бинарными действиями. Либо я вызываю этот образ, либо я его вытесняю.
Эта связь образов, наших действий и обратной реакции на них уже есть знания. И если эти знания статистически достоверны, то есть связи не первый раз повторяются, если я понимаю, что, видимо, всегда это действие вызывает такой-то эффект, то я должен запомнить это, мне нужна память. Мы это называем базой знаний. В базе знаний записываются сведения о том, как действия влияют на образы. Естественно, для того чтобы хранить образы, нужна ещё память образа, где хранится эта конструкция, эти найденные мною образы.
Хорошо. Предположим, у меня эти знания накапливаются, то есть, сидя в этой чёрной комнате, наблюдая за входами и выходами я себе в блокноте, в конце концов, записываю, как эти действия влияют на эти образы. Предположим, у меня этих знаний накопилось много. Могу ли я управлять теперь ими? Могу, но я не знаю – зачем. Что здесь хорошо? Что здесь плохо? Мне нужны какие-то качественные критерии. Для этого в каждом организме есть такой блок или подсистема, которую мы назвали аппаратом эмоций. Может быть, мы ошибаемся, и биологи нас поправят, но такая вещь должна быть.
А.Г. Она и есть.
А.Ж. Она, в общем-то, есть, судя по всему. Это аппарат, который задаёт качественную окраску этим образам. Это очень хитрый, очень сложный, очень многофункциональный аппарат, который на самом деле решает много задач. Одна из них – это соотнести эти сформированные образы с теми целевыми функциями. Это происходит примерно так. Видимо, есть некоторая шкала, напоминающая термометр, и указатель на этой шкале. Один из моих студентов удачно назвал это штуку «хорошометром». То, что она есть, я могу сейчас доказать.
Если я сейчас спрошу: Валентин Анатольевич, вам сейчас как? Вы скажите, да так, ничего. На четвёрку, может быть, с плюсом. То есть на огромный комплекс распознанных в этот момент образов вы как-то отреагировали, сжали, свернули и превратили всё это в одну оценку. И этих оценок у каждого из нас штук десять – слов-то в русском языке не так и много, чтобы выразить наше состояние.
А.Г. В русском больше, чем в любом другом всё-таки.
А.Ж. Да, но не 50. От «очень плохо», от «безобразно» до «хорошо», «так себе», «прекрасно», «великолепно», вот, собственно, и всё. Примерно десяток-другой оценок. Это одна из этих функций.
Так вот, мне теперь надо понять, как влияет на эту оценку то, что вы распознаете появление того или другого образа на экране входной информации. Если каждый раз уже знакомое нам красное пятно вызывает у меня отрицательное ощущение, падение этого «хорошометра», значит, это что-то такое плохое. Значит, с помощью тех знаний, которыми я уже обладаю в своём блокнотике, в своей базе знаний, я буду каждый раз при появлении этого пятна делать что-то такое, чтобы оно исчезло, наконец, с глаз долой. А если этот объект, другой образ, для меня полезен, если он каждый раз вызывает повышение «хорошометра»? Скажем, это опять знакомая нам мама с бутылочкой молока, и я нашёл здесь какие-то кнопочки, нажав на которые, я вызову появление мамы? Сразу же поднимется мой «хорошометр», значит, я буду стараться этим пользоваться.