Звуки и знаки - Александр Кондратов
Шрифт:
Интервал:
Закладка:
И не только времени, но и денег. Ежегодно на доку ментальный поиск в США тратится свыше миллиарда долларов. И тем не менее в тех же США — на неоправданное дублирование тратится не менее десяти процентов всех средств, что отпущены на научно-исследовательские и конструкторские работы. Вот два характерных примера. На эксперимент по засеву облаков было израсходовано более четверти миллионов долларов. Результаты этого эксперимента появились в публикации, но затерялись в потоке отчетов и статей. И вскоре эксперимент был повторен, причем дублирование его обошлось уже в три миллиона долларов. Национальное управление по аэронавтике и исследованию космического пространства потратило год и восемнадцать миллионов долларов на разработку ракетной системы «Атлас-Вега». Одновременно столько же времени и средств ушло на разработку аналогичной системы «Атлас-Агена В», которой занималось министерство ВВС Соединенных Штатов.
Вполне понятно, что на службу информации различные фирмы, исследовательские институты, министерства и управления зарубежных стран не жалеют средств — эти средства окупаются сторицей.
В нашей стране информационная служба централизована. О создании единой общегосударственной системы сбора и обработки информации для учета, планирования и управления записано в «Основных направлениях развития народного хозяйства СССР на 1976–1980 годы», утвержденных XXV съездом КПСС. Совет Министров СССР принял специальное постановление, возложив на Государственный комитет по науке и технике руководство научно-технической информацией в нашей стране, определение дальнейшего развития системы этой информации, координацию исследовательских и технических работ, методическое руководство всей сетью научно-технической информации, разграничение функций между отдельными органами информации и контроль над их деятельностью.
Сеть информационных органов СССР включает такие специальные институты, как ВИНИТИ — Всесоюзный институт научной и технической информации, где работают тысячи штатных сотрудников и десятки тысяч переводчиков, ЦНИИПИ — Центральный научно-исследовательский институт патентной информации, ВНИИКИ—Всесоюзный научно-исследовательский институт научно-технической информации, классификации и кодирования. В каждой отдельной отрасли, как правило, существуют свои институты, а отделы или бюро научно-технической информации есть почти во всех солидных научно-исследовательских и проектно-конструкторских институтах, на предприятиях промышленности, сельского хозяйства, транспорта и связи.
Отпустить необходимые средства, создать единую сеть службы информации — это, так сказать, задача общественная, социальная, государственная. И она в нашей стране решается. Но есть еще задачи сугубо внутренние, связанные с самой спецификой проблемы. Решить их должна особая наука об информации, или, как ее называют ныне, информатика (известный советский логик В. А. Успенский предложил термин «документалистика», однако в нашей литературе первый термин получил гораздо большее распространение).
«Информатика — это научная дисциплина, изучающая структуру и свойства (а не конкретное содержание) научной информации, а также закономерности научно-информационной деятельности, ее теорию, историю, методику и организацию, — пишут А. И. Михайлов, А. И. Черный и Р. С. Гиляровский в монографии «Основы информатики». — Целью информатики является разработка оптимальных способов и средств представления (записи), сбора, аналитико-синтетической переработки, хранения, поиска и распространения научной информации. Информатика имеет дело со смысловой (семантической) информацией, но не занимается качественной оценкой этой информации. Такая оценка может производиться лишь специалистами в соответствующих областях науки или практической деятельности».
Информатика находится в начале своего становления. Как и всякая другая наука, она сначала собирает факты и обобщает их, затем анализирует и выявляет общие закономерности. И, как считают все специалисты, основная теоретическая задача информатики в наши дни — это выяснение закономерностей, по которым происходит создание семантической, смысловой информации, передача этой информации и практическое использование в самых различных сферах человеческой деятельности, начиная с доказательства математических теорем и кончая применением достижений науки и техники в повседневном быту.
Содержание, семантика, смысл кодируется с помощью специальных языков науки и техники и прежде всего с помощью нашего человеческого языка, сложного и неоднозначного. Перевод с этого языка на язык информатики— так можно сформулировать задачу номер один, которая стоит перед современными исследователями.
В поисках языка
Язык машины — язык чисел. На этот язык в принципе должна быть переведена вся информация, накопленная человечеством в области науки и техники, вообще вся сумма знаний, запечатленных в печатной продукции. Кодирование числами началось задолго до появления ЭВМ и информационного взрыва. Списки книг и произведений составлялись и древними греками, и египтянами, и жителями Двуречья. Уже в VII веке до н. э. на глиняных табличках из библиотеки ассирийского царя Ашшурбанипала давалось заглавие, номер таблички или собрания табличек, образующих «глиняную книгу» и т. д. Более ста лет назад, в 1876 году, американский библиотековед Мелвил Дьюи предложил классифицировать книги, относящиеся к различным областям знания, с помощью десятичных чисел.
Каждый основной раздел этой классификации обозначался одной цифрой, от нуля до девяти. При дальнейшем его делении к этой цифре присоединяется вторая, а затем и третья цифра. А чтобы индексы были всегда трехзначные, к однозначным и двузначным числам Дьюи добавлял нули. Например, естественные науки получают индекс 500, математика тогда будет под индексом 510, астрономия — 520, физика — 530, химия — 540, геология — 550, палеонтология — 560 и т. д.
Сведения о той или иной сфере могут быть в периодических изданиях, словарях и других публикациях. Они могут касаться истории вопроса, могут говорить о практическом применении и о многом другом. Дьюи разработал список таких делений, занумеровал его, и теперь тот или иной номер может присоединяться к трехзначному числу, индексу любого раздела классификации. Например, физика имеет индекс 530, а ее раздел механика — индекс 531. Тогда словари по механике кодируются как 53103 (словари обозначены в списке Дьюи числом 03), история механики — 53109 (09 — обозначение «истории вопроса»).
А как быть со странами или языками? Дьюи предложил для обозначения их использовать окончания индексов филологии и истории, которые зафиксировали различные языки и страны мира. И тогда геология Европы получает обозначение 55040 (первые три цифры — индекс геологии, две вторые — Европы), геология Азии — 55050, геология Африки — 55060 и т. п.
Десятичной классификацией Дьюи пользуются почти девяносто процентов библиотек США и Великобритании. Однако в большинстве стран мира, в том числе и в нашей стране, используется другая десятичная классификация, именуемая универсальной, сокращенно УДК. Создана она была в начале нашего столетия и с тех пор продолжает совершенствоваться и расширяться. В последних изданиях УДК содержится более ста тысяч руб-рик, охватывающих самые различные области человеческого знания. Полный объем ее таблиц составляет около пятисот авторских листов, то есть десяток томов по триста — пятьсот страниц в каждом.
Тысячи учреждений почти в сотне стран мира пользуются системой УДК. По сути дела, это своеобразный международный язык-посредник. Ведь тексты, выходящие на множестве различных языков мира, индексируются с помощью числового кода УДК. Зная этот код, мы можем перевести его символы средствами своего родного языка.
Система УДК. представляет собой иерархию. Вершина ее — десять цифр, от нуля до девяти, обозначающих главные разделы: 0 — общий отдел, 1 — философия, 2 — религия, 3 — общественные науки и т. д. Далее по тому же десятичному принципу каждый из разделов дробится на отдельные подразделы, те, в свою очередь, на группы, группы—на подгруппы и так до тех пор, пока сохраняется необходимость членения. Чем больше развита та или иная область знания, тем больше и глубина деления.
Например, в минералогии и кристаллографии она достигла десятой степени, то есть отдельные понятия записываются в виде десяти цифр (структура кальцита обозначается числом 548.736.442.2, где цифра 5 обозначает математику и естественные науки, 4 — химию и т. д.). Там, где надо, глубина может увеличиваться безгранично.
Приведем для образца запись на УДК фрагмента текста на русском языке. Фраза «Строительство из стали с экономической точки зрения» будет записана так: 624.94.003.1. Первая цифра, шестерка, кодирует прикладные знания, медицину, технику; вторая — двойка — технику и инженерное дело. Сочетание цифр 624.94. обозначает строительство, каркасные конструкции. А цифры 003.1 — определитель «экономической точки зрения».