Разговор с электрическим мозгом - Василий Захарченко
Шрифт:
Интервал:
Закладка:
За год Институт информации в Москве обрабатывает 11 000 иностранных изданий, 3000- советской периодики, 90 000 патентов, опубликованных на 65 языках. Для того чтобы обрабатывать всю эту гигантскую массу материалов, конечно, необходимо применение кибернетических машин.
Можно было бы до бесконечности продолжать эти важные расчеты, в сводятся они в основном к тому, чтобы призвать на помощь информационные машины.
Проблема перевода уже давно интересовала изобретателей и ученых. Первые машины перевода с одного языка на другой обрабатывали сугубо научный текст. Да оно и понятно - словарный запас в научных текстах сравнительно беднее, чем в художественных. Перевод с английского языка на французский и в обратном порядке проходил гладко, потому что строй языков был очень близок. Но когда столкнулись с переводами с немецкого языка на русский, перед учеными возникли необычайные трудности. Грамматика этих языков совершенно различна - в немецком глагол уходит в конец фразы. Машина мгновенно получила двойку по грамматике, а ученые растерялись.
Тогда начали создавать машину, которая заранее программировалась бы на эти правила.
Языковеды начали давать свои советы - теперь разводили руками кибернетики.
- Что же, вы хотите лишить машину универсальности? - говорили они.- Но это слишком дорого - создавать единичные машины. Кибернетическое устройство обязательно должно быть универсальным.
Однако для создания универсальной машины невероятно возрастало количество вариантов грамматических правил. Для 10 языков получалось 90 правил перевода. А как все это запрограммировать в машину?
Начав с некоторых успехов, кибернетики в конце концов зашли в тупик. И тогда возникла мысль создать язык-посредник. Машина будет переводить на этот язык, а уже потом с языка-посредника будут осуществляться переводы на все языки. Прежде всего это резко снизит количество промежуточных процессов: вместо 90 вариантов правил понадобится всего 20, из них 10 правил для перевода на язык-посредник и 10 - для перевода на другой язык.
Эта идея оказалась чрезвычайно плодотворной. Однако что же это за язык-посредник и каким он должен быть?
Сначала взяли первый попавшийся язык - латынь. Латынь не подошла - она была лишена универсальности, необходимой для языка-посредника. Тогда лингвисты предложили использовать язык "эсперанто" и недавно созданный язык "интерлингва". В эсперанто грамматика состоит всего из 16 правил, к тому же не очень сложных.
Но дело опять не пошло на лад - язык эсперанто оказался слишком непохожим на живые языки. И наконец, после нескольких неудачных попыток языковеды пришли к необходимости создания для кибернетических машин своего собственного, специального языка. На этом языке никто никогда не будет говорить. Он будет скрыт от нас в недрах электронной переводческой машины. Сегодня над созданием такого языка работают ученые уже многих стран мира. В частности, в Ленинграде созданием такого языка занимается большая группа лингвистов. В основу своей работы они берут 26 западноевропейских и восточных языков, учитывают, какая честь населения земного шара пользуется тем или иным языком, и отбирают нечто среднеарифметическое из этих языков, с учетом их распространения.
Сегодня рано еще говорить о результатах в работе над созданием языка кибернетических машин, но все же некоторые правила могут представлять интерес.
Например, в этом языке прилагательное обязательно должно стоять перед существительным, подлежащее располагается всегда раньше сказуемого, наречие должно стоять до глагола. Артикли, существующие в некоторых европейских языках, были признаны абсолютно ненужными. Но, возможно, и этот язык, который сейчас разрабатывается, окажется несовершенным и от него придется отказаться.
Язык машин - язык совершенно условный. Он будет представлять собой сетку соответствий между элементами языков, подвергающихся переводу. Московские ученые, во всяком случае, настаивают на создании именно такого языка.
Нужно сознаться, что сегодня вся работа по созданию машин-переводчиков ведется пока еще лишь в области технических текстов. Никто не ставит серьезно вопрос о переводе художественной литературы.
Работа лингвистов и кибернетиков в области переводов дает иногда поразительные результаты. В свое время вся мировая пресса писала о том, что ни одному ученому в мире до сих пор не удалось расшифровать древние рукописи племени майя, уничтоженного испанскими конквистадорами в Южной Америке свыше четырех веков назад. Такую же судьбу разделяют письмена ронго-ронго с острова Пасхи.
Иероглифы майя нанесены на кожу, на кору фикуса; а иероглифы ронго-ронго вырезаны на кусках дерева. Знание языков обоих этих народов давным-давно утеряно.
Советскому ученому Ю. Кнорозову удалось установить, что письменность майя - это иероглифы. И вот за расшифровку таинственных надписей взялись молодые ученые Сибирского отделения Академии наук. Перед ними стояла невероятная, почти неразрешимая задача - раскрыть тайну 400 иероглифов, более половины из которых были совершенно непонятны, а в отношении другой половины имелись лишь весьма смутные догадки.
Работу ло переводу поручили машине. Была составлена специальная программа статистического исследования языка. В машину вводились данные поиска словаря, цифровые обозначения для всех иероглифов. Были введены все буквы латинского алфавита. Увлекательный, сложный процесс расшифрован мертвого языка длился два дня. За это время машина проделала свыше миллиарда операций. И какой успех! 40 процентов текста уже можно было прочитать. 130 лет трудились ученые над расшифровкой рукописей майя. И только сегодня с помощью машины удалось приоткрыть тайну древнего языка. Для расшифровки всего текста племени майя потребуется еще 200 часов работы, во время которых машина должна будет произвести 11 миллиардов операций.
Язык ронго-ронго также ждет своих исследователей. И, очевидно, мысли народа, когда-то населявшего остров Пасхи, станут известны человечеству с помощью машины, анализирующей самое прекрасное, самое удивительное, что создал человек,- язык,
Совершенно по-другому решается вопрос создания языка для машин-информаторов. Здесь не нужно никакого логического языка - нужны абстрактные знаки, условные символы.
Примером таких абстрактных знаков может служить известная всем азбука Морзе, состоящая из точек и тире, впервые примененная при телеграфных передачах.
Число знаков доведено до предела: их всего два.
Но может быть и другая "экономия". Вот запись на языке математики: а+в=в+а, А вот то же на обычном языке:
"Сумма складываемых чисел, не зависим от последовательности их сложения". Как видите, количестве знаков во втором случае почти в десять рас больше.
Примером символического языке может служить и язык химии. Серная кислота - H2SO4. Понятие одно и то же, однако в одном случае слова, в другом - символы.
Современные электронно-вычислительные машины не только должны собирать и распространять информацию, но они обязаны перерабатывать ее. Этим машинам нужен свой язык - новый код.
Его разработкой заняты многие вычислительные центры.
Программисты Вычислительного центра Сибирского отделения Академии наук создают сейчас новый язык - посредник между человеком и машиной. Этот язык назван "альфа"-языком или "сибирским языком". Он является значительным вкладом во взаимопонимание между человеком и машиной.
А взаимоотношения эти еще очень сложны. Ведь текст-задание программист должен с помощью специальных программ - трансляторов - преобразовать в язык, "понятный" машине. В этом случае программист превращается в своеобразного "жреца-посредника" между миром машин и человечеством.
Таким образом, встает задача: сделать язык машины доступным не единицам, а широкому кругу людей.
В свое время молодой ученый - заведующий отделом программирования Вычислительного центра Сибирского отделения Академии наук Андрей Ершов представляет себе этот процесс как своеобразное обучение машины. Человек дает задание машине, она, если не понимает, задает вопрос. Новый ответ - и снова вопрос машины. И так до полного взаимного понимания.
- Во взаимоотношениях человека и машины,- говорит Ершов,- надо добиться, чтобы машина с каждым новым заданием становилась все "понятливей", чтобы, получая аналогичные задания, она не задавала одних и тех же вопросов. Иначе говоря, надо, чтобы машина сохраняла в своей электрической памяти "протоколы" своих бесед с человеком и свои новые знания употребляла в дальнейшей работе. Это не что иное, как обучение машины человеческому языку.
- Настанет ли такое время, когда машина будет понимать человека с полуслова?
- Да. Это время не за горами,- говорит молодой ученый.- Все дело в накоплении "словарных запасов" машиной. Сначала человек - учитель приспосабливается к ограниченному языку ученика - машины. А когда тот его начинает понимать, расширяя баланс языка и знаний, подтягивает его до своего уровня. Невольно я вспоминаю машину в японском павильоне Всемирной выставки, которая выполняет с голоса 40 команд на шести языках. Нз первые ли это шаги?