Введение к аналитике
Широкий спектр источников и категорий событий, которые обрабатываются системой мониторинга за состоянием окружающей среды, подразумевает раздельную обработку сильно неформализованной и нечеткой информации. Технически это обоснованно, поскольку в последующие алгоритмы должны оперировать не содержанием новостей, а их атрибутами. Более подробно этот вопрос освящен в статье "Теория и практика разработки систем мониторинга".
Результатом категорирования входных потоков данных в системе являются формализованные отчеты - сводки по категориям катастроф.
Однако полные сводки обладают большой избыточностью и неоднозначностью. И то, и другое является особенностью неформализованных и относительно самостоятельных каналов СМИ. Анализировать такие сводки тоже нелегко. Помогает поисковая машина, которая по контексту может уменьшить объемы информации для анализа.
И все же поисковый инструментарий системы не может "учесть" всю специфику конкретной критической ситуации. В частности, таковыми являются взаимосвязи между заданными категориями или атрибутами информации о состоянии окружающей среды. Кроме того, в парадигме настоящей системы используются лишь семь тематических категорий катастроф. Они очень масштабны и, в то же время, не могут охватить все существующие категории.
Поэтому для создания полной картины прошлой, текущей и/или прогнозируемой ситуации просто необходимо периодически интегрировать разведенные потоки фактов и прогнозов, акцентируя внимание пользователей сайта на важных проблемах с неявно выраженными зависимостями фактических событий и складывающихся ситуаций в целом. Для этого на сайте использованы web-страницы раздела "Фактомониторинг катастроф".
Раздел в данной версии не является систематическим и состоит из тематических web-страниц, которые формируются "вручную" на основе анализа всего объема информации о катастрофах, последствиях, прогнозах и причинах их возникновения. Информация о катастрофах собрана, обработана и хранится системой web-мониторинга "IDP-Аналитика WM" в процессе мониторинга web-пространства.