Аналитика: методология, технология и организация информационно-аналитической работы - Юрий Курносов
Шрифт:
Интервал:
Закладка:
Естественным выходом из такой ситуации является создание инструментальных средств, обеспечивающих режим автоматизированного протоколирования выводов аналитика при первом прочтении сообщения. Создание таких средств возможно при условии, что автоматизированная система рассматривается в качестве инструмента предобработки сообщений, предлагающей аналитику некий набор версий, подлежащих оцениванию и утверждению им по прочтении некоторого сообщения. Теоретически создание подобных систем не является чем-то невозможным, более того, технологическая база на сегодня способна обеспечить необходимое быстродействие, если задаться реалистичными целями (то есть, не требовать от компьютерной системы стопроцентной достоверности выводов).
Чего же тогда можно требовать от такой системы? Какой ценностью обладает система, которая предоставляет не абсолютно достоверные выводы?
— Польза от такой системы однозначно есть. Для того, чтобы она была полезна, достаточно, чтобы она обеспечивала генерацию ограниченного числа максимально правдоподобных гипотез о значении некоторого комплекса атрибутов на основе проведения анализа формально-логических отношений, выраженных в тексте. Уже в этом случае аналитик получает возможность отбирать те из них, которые наилучшим образом описывают его выводы, полученные экспертным путем. Это не только экономия времени на протоколирование, но и возможность формально логической экспертизы утверждений, выраженных в тексте.
Таким образом, окончательно убеждаемся в необходимости учета ряда специфических атрибутов сообщения, содержащих дополнительную информацию о контексте информационного взаимодействия и результатах его анализа. Остается определить, какие именно атрибуты целесообразно включить в протокол анализа сообщения. Вероятно, было бы лучше вывести перечень атрибутов на основе исчерпывающего рассмотрения универсального алгоритма обработки сообщения (это можно сделать, но тогда аргументация выбора отнимет много страниц, а это нарушит замысел книги). Поэтому здесь мы ограничимся максимально компактным перечнем, а пример разбора поместим в приложении 3.
Прежде, чем перейти к рассмотрению этого перечня, заметим лишь, что ситуативный контекст сообщения, как правило, уникален, и поэтому значения атрибутов содержатся на разных уровнях семантической иерархии сообщения и присутствуют в различных комбинациях. В ходе анализа сообщения его потребитель (аналитик) неосознанно проходит несколько циклов «погружения» в семантическую иерархию сообщения, в результате чего значение одного и того же атрибута могут извлекаться на разных этапах анализа.
Описание основного содержания этапов обработки и анализа сообщений и их условные обозначения (столбец «Идентификатор этапа» — Э-ID) представлены в табл. 4.3, позже эти данные будут использованы при описании распределения атрибутов сообщения по этапам и семантическим классам.
Таблица 4.3 — Содержание этапов обработки и анализа сообщений. Содержание этапа Э-ID Получение физического доступа к среде распространения данных 00 Получение материальной копии массива данных 01 Разбиение массива данных на сообщения по структурным признакам 02 Анализ и согласование форматов представления данных 03 Экспресс-анализ и отбор сообщений (язык, ключевые слова, структурные признаки и идентификационные данные) 04 Структурный анализ сообщения (выделение элементов структурной организации текста) 05 Выделение, категорирование и маркировка метаязыковых конструкций 06 Анализ и восстановление ссылочных отношений 07 Анализ и восстановление временных отношений 08 Анализ и восстановление пространственных отношений 09 Анализ и восстановление функциональных отношений (субъект-объектных, инструментальных и иных) 10 Идентификация ситуационной модели или фрейма, описывающего ситуационный и коммуникативный контекст 11 Анализ и восстановление рефлексийных отношений 12 Анализ эмоциональной компоненты сообщения и соотнесение оценочных суждений с субъектами рефлексии 13 Анализ акцентов внимания субъектов рефлексии 14 Анализ и восстановление логических (причинно-следственных) отношений 15 Выделение и связывание повествовательных стратегий (сюжетных линий), их пространственная и временная синхронизация 16 Выделение релевантных сведений 17 Выявление противоречий 18 Обобщение информации 19Ниже, в табл. 4.4, приведено основное содержание и обозначения семантических классов атрибутов сообщений (колонка «Идентификатор семантического класса» — С-ID).
Таблица 4.4 — Содержание семантических классов атрибутовсообщений. Семантическая группа С-ID Технология АК: параметры канала информационного взаимодействия 00 Технология АК: параметры инструментария обработки данных 01 Технология АК: адресная и маршрутная информация 02 Технология АК: лексико-синтаксические параметры 03 Системно-реляционные параметры: время 04 Системно-реляционные параметры: пространство 05 Системно-реляционные параметры: морфология 06 Системно-реляционные параметры: информационный обмен 07 Системно-реляционные параметры: процессы 08 Системно-реляционные параметры: энергия 09Теперь мы можем перейти к рассмотрению атрибутов, вынесение которых на верхний уровень описания сообщения позволит упростить многие задачи, связанные с повторным вовлечением сообщений в цикл ИАР за счет применения средств автоматизации. В приводимой ниже таблице в соответствие атрибутам приведены их семантические классы и этапы обработки сообщения (имеющий желание, да изучит).
Таблица 4.4 — Соответствие атрибутов семантическим классам и этапам аналитической обработки сообщения. Атрибуты С-ID Э-ID Физические параметры носителя 00 00 Идентификационные данные канала или носителя данных 00 00, 01 Интенсивность потока сообщений 00 00 Стоимостные характеристики носителя или стоимость эксплуатации канала 00 00, 01 Способ первичного представления данных 01 03 Правила формализации 01 03, 05 Адресные и идентификационные данные участников АК 02,05 02, 04, 11, 12 Язык представления 03 03 Специфика синтаксических предписаний, используемых в сообщении 03 03, 05, 06 Специфика словаря сообщения 03 04, 05, 06 Время получения данных аналитиком 04 02 Время получения данных источником 04 08 Время события, инициировавшего появление сообщения (ставшего центральной темой) — внутреннее время сообщения 04 06, 08, 12, 14 Пространственная локализация события (физическое, организационное, целевое и иные виды пространства) 05 09, 10, 14 Перечень объектов сообщения 06 10, 12 Перечень неявных объектов сообщения (тех, чье участие подразумевается, но не декларируется) 06 10, 11, 12 Цепочка распространения информации 07 11, 12 Заинтересованные и потенциально заинтересованные потребители 07 00, 1114, 10 Временная и событийная иерархия сообщения (с привязкой к объектам) 04 08, 10, 11, 16 Динамические характеристики процессов, в том числе — процесса распространения информации 04,08,09 08, 10, 11, 16 Координатная и траекторная информация (с привязкой к объектам) 04-09 09-11, 15, 16 Атрибуты С-ID Э-ID Полнота АК и/или сообщения 03 02, 07 Достаточность для интерпретации 03,04-09 07, 15 Локальный коммуникативный контекст сообщения в рамках информационного взаимодействия тех же участников АК 02,06 02, 04, 11 Тематический контекст сообщения в рамках информационного взаимодействия произвольных участников АК (предшествующие и последующие сообщения в рамках данной тематики) 06 02, 04, 11, 14 Ситуационный контекст сообщения 11 Класс источника (первичный или вторичный) 07 11, 12 Класс сообщения (контактное, внутрисистемное, транзитное, межсистемное) 00-09 11, 12 Вид фильтрации сообщения (пассивная или активная) 00-09 12-15 Ценностная ориентация субъекта и объекта 04-09 01, 04, 11-15 Устойчивость системы ценностей 04-09 01, 04, 11-15 Целевая ориентация субъекта/объекта 04-09 01, 04, 11-15 Функциональная группа сообщения (информативная, подкрепительная, нормативно-директивная, запрос, общекоммуникативная, преобразования сознания, эмоционального воздействия) 04-09 01, 04, 11-15 Идентификационные данные и характеристики систем, к которым принадлежат объекты сообщения 04-09 01, 04, 08-15 Характеристика оснований для наличия отношений доверия (в том числе — принадлежность участников АК к единой иерархической системе) 04-09 01, 04, 08-15 Отношения потребления ресурсов в системах участников АК или объектов сообщения 04-09 01, 04, 08-15 Экспертная оценка достоверности сообщений участников АК 04-09 01, 04 Вероятные причины и последствия события 04-09 01, 04, 08-15 Достаточность или необходимость дополнительных условий 04-09 01, 04, 08-15 Возможность или необходимость протекания событий 06,07 01, 04, 08-15 Атрибуты С-ID Э-ID Ожидаемость и расчетное время получения сообщения или свершения события 04-09 01, 04, 08-16 Наличие оттенка модальности в сообщении 03-09 08-15В приведенном перечне дана лишь базовая совокупность атрибутов, позволяющая осуществлять различные виды автоматизированного связывания сообщений как по «внешним» атрибутам, доступным на этапе получения сообщения, так и по «внутренним» атрибутам, получаемым на этапе семантического анализа. Для специфических же задач анализа и различных организационно-технических систем перечень атрибутов может варьироваться.