Аналитика: методология, технология и организация информационно-аналитической работы - Юрий Курносов
Шрифт:
Интервал:
Закладка:
Каждому человеку ежедневно приходится выступать в роли аналитика, но едва ли кому-нибудь удастся припомнить, что ему приходилось проделывать подобные операции над каждым получаемым им сообщением. Очевидно, что алгоритм поведения аналитика при выполнении им задачи анализа сообщений адаптивен, однако на каком же этапе анализа отбрасываются лишние ветви рассуждений?
Действительно, на основании опыта протоколирования реальной аналитической работы, можно сделать вывод о том, что алгоритм работы аналитика действительно выстроен по адаптивной схеме, но не в той области, где это кажется наиболее уместным. Для понимания сообщения в любом случае необходимо, чтобы та часть аналитической работы, в ходе которой аналитик производит разбор рефлексивной структуры, субъект-объектной иерархии и привязку временных шкал соответствующих уровней сообщения, проделывалась им во всех случаях. Нарушение этого требования может привести к нарушению временной, объектной или рефлексивной структуры. Если результат нарушения первых двух (структур) понятен большинству специалистов, некогда осваивавших чтение иностранной художественной литературы, то нарушение рефлексивной структуры может привести к нарушению именно той составляющей сообщения, где наиболее ярко проявляют себя отношения прагматического и эмоционального порядка. То есть в результате ошибок в восстановлении рефлексивной структуры, отношение одобрения может сместиться к осуждаемому объекту и наоборот.
Из этого можно сделать вывод о том, что адаптация и оптимизация алгоритма анализа сообщения производится только на этапе формулирования окончательных выводов. То есть уже тогда, когда аналитик идентифицирует сообщение, его фрагмент или последовательность сообщений с некоторой моделью, ранее сформированной на основании личного или иным образом приобретенного опыта.
Рассмотрение процесса анализа сообщения с точки зрения его алгоритмизации и автоматизации позволяет сделать целый ряд интересных выводов.
1. Исключение транзитивных элементов субъект-объектной, временной и рефлексивной иерархий производится на этапе субъектного (объектного) связывания высказываний в рамках одного сообщения, сеанса информационного взаимодействия или некоторого конечного ансамбля сообщений.
2. Анализ сообщения, содержащего указания на некоторые совокупности субъектов и объектов (как иерархические, так и одноуровневые) может осуществляться циклически с постепенным вовлечением в процесс анализа все новых и новых субъектов и объектов.
3. Одно и тоже сообщение может использоваться более, чем в одном цикле анализа с вовлечением различных наборов субъектов и объектов, ко всему прочему размещенных еще и в различных временных срезах.
4. Эмоциональная окрашенность сообщения может быть выражена в специфическом подборе слов и распространяться как на сообщение в целом, так и на отдельные объекты.
5. Различные эмоциональные акценты, а также специфические термины, используемые для передачи модальных оттенков, могут быть использованы при автоматизированном ранжировании конкурентных сценариев, синтезируемых на основании анализа потока сообщений.
6. Возможность редукции сложных высказываний к лексическим примитивам способна существенно снизить сложность соотнесения отдельных фрагментов сообщения с различными уровнями рефлексивной, субъект-объектной и временной иерархий.
7. Возможность смены уровня абстракции описания сообщения позволяет упростить процедуры распознавания сообщений, относящихся к описанию феноменов сходной природы.
Общим следствием предложенных выше частных выводов является необходимость синтеза и хранения наряду с оригиналом сообщения его описания, построенного с учетом обеспечения возможности синтеза и предварительного анализа сценариев без привлечения оригиналов сообщений. При этом описание сообщения должно быть сформировано с учетом возможности смены уровня абстракции, т. е. с привлечением некоторой стандартизованной иерархической терминологии. Одним из возможных путей реализации такого рода описаний является создание метаязыка, представляющего собой специфическую надстройку над естественным языком человеческого общения, предназначенную для редуцирования высказываний естественного языка. В качестве же вспомогательного инструмента для создания моделей высказываний, допускающих смену уровня абстракции в интересах решения задачи распознавания сценариев и прецедентов, целесообразно использовать пополняемую объектную иерархическую реализацию фрагментов естественного языка.
Использование для представления сообщений метаязыка редуцирования высказываний и объектной иерархической реализации фрагментов естественного языка (объектного иерархического лексикона) позволит привести процесс анализа сообщений к объектной парадигме и упростить процесс синтеза сценариев и ситуационных моделей, сведя его к процессу объединения последовательностей объектов-высказываний, обладающих единым интерфейсом. Такая технология в идеале способна свести этот процесс к примитивным логическим операциям.
Помимо прочего использование стандартизованных интерфейсов объектов-высказываний может обеспечить формальную проверку внутренней и контекстной непротиворечивости.
В данном примере и комментариях к нему основное внимание было сосредоточено на системах, способных осуществлять свои функции с продуцированием и потреблением текстовых массивов. Логическая структура изложения описывается следующей последовательностью:
— классификация информативных признаков сообщений;
— разбор примера сообщения;
— проблемы алгоритмизации аналитической работы.
Ниже приводится перечень наиболее важных положений.
1. В социальных и эргатических системах возможно появление информации, предваряющей событие (изменение состояния системы), что является следствием планового характера деятельности человека.
2. Успешное решение задачи автоматизации информационно-аналитической работы возможно лишь при создании специализированной системы синтеза, хранения и распознавания сценариев, ситуационных моделей и исторических прецедентов.
3. Задача автоматизации этих процессов включает в себя среди прочих задачи автоматизированной предобработки сообщений, таких, как: извлечение временной и субъект-объектной иерархии, классификация, атрибуция, регистрация и редукция сложных высказываний к лексическим примитивам.
4. Решение задач автоматизированной предобработки сообщений является первым шагом на пути к автоматизации процесса синтеза сценариев и ситуационных моделей на основе анализа потоков сообщений СМИ.
5. Предложенное в статье систематизированное описание информативных аспектов сообщений и факторов, обуславливающих их ценность для анализа информации, содержащейся в сообщениях (в том числе и на внешнем по отношению к ним уровне), позволяет унифицировать и алгоритмизировать процесс анализа сообщений СМИ.
6. Одним из крайне важных приложений информации, извлекаемой из сообщений на основе анализа их временной и субъект-объектной иерархий, является формирование портрета инерционных характеристик социальных сред.
7. Вскрытие специфики эмоциональной окраски формулировок в сообщении может способствовать выявлению попыток манипуляции сознанием индивида или группы, т. е. создания «виртуальной реальности» (искаженного информационного поля), в которой они призваны действовать, не считаясь с реалиями.
8. В интересах восстановления системы взаимоотношений между участниками информационного взаимодействия, система хранения должна содержать в себе не только данные и сообщения, но и их оценки, данные с позиций участников модели (например, «конструктивная тенденция», «деструктивная тенденция», «улучшение параметров», ухудшение параметров» и т. д.).
9. Ценность моделей определяется возможностью смены уровня абстракции, что позволяет применять их к ситуациям, обладающим лишь частичным сходством с ранее имевшим место историческим прецедентом.
10. В интересах автоматизации информационно-аналитической деятельности помимо прочих проблем, надлежит решить следующие: проблему создания метаязыка описания сообщений и проблему синтеза объектного иерархического лексикона.
Безусловно, создание систем поддержки информационно-аналитической работы представляет собой комплексную междисциплинарную задачу, требующую совместной работы специалистов различных научных отраслей (таких, как специалисты в области лингвистики текста, информатики, искусственного интеллекта, логики и философии), а также специалистов-практиков, специализирующихся на решении информационно-аналитических задач. Все же, несмотря на существование финансовых затруднений, препятствующих ведению серьезных научно-исследовательских проектов, можно высказать надежду, что необходимый уровень кооперации специалистов, работающих в этой области, будет достигнут. Это позволит приблизиться к успешному решению проблемы автоматизации аналитической работы.