Применение методов географического информационного поиска для анализа новостных данных
Авдюшина Анна Евгеньевна, Королёва Юлия Александровна, Маркина Татьяна Анатольевна, Бессмертный Игорь Александрович
Университет ИТМО РФ
Статья посвящена выделению неформальных районов на основе данных из новостных источников и социальных сетей по критерию географической близости. Предложена методика извлечения геоданных из текстов для пространственной кластеризации. Из текстов извлекаются географические названия, которые преобразуются в геолокации с помощью геокодирования. Выделенные геоточки кластеризуются по плотности и для каждого кластера определяется распределение тем. Данный подход позволяет абстрагироваться от административного деления и выявить кластеры, близкие к восприятию горожан. Результаты кластеризации перспективно применять в разнообразных задачах управления городской инфраструктурой: мониторинг общественной жизни, анализ качества городской среды, общественная безопасность. Отличие предложенной методики от аналогов состоит в синтезе геоданных для группировки объектов. Разработанные на основе методики программные средства позволяют принимать решения в области урбанистики: развитие микрорайонов города и транспортной инфраструктуры, размещение социально значимых объектов и обеспечение безопасности.
интеллектуальный анализ данных, умный город, информационная модель, системы поддержки принятия решений, кластеризация, геопространственные данные