ПРОЕКТИРОВАНИЕ И РЕАЛИЗАЦИЯ ИНСТРУМЕНТАЛЬНЫХ СРЕДСТВ ДЛЯ СЕМАНТИЧЕСКОГО АНАЛИЗА БОЛЬШИХ ДАННЫХ О НАУЧНЫХ И ТЕХНОЛОГИЧЕСКИХ РЕШЕНИЯХ В ОБЛАСТИ ЭНЕРГЕТИКИ
Копайгородский Алексей Николаевич, Хайруллина Елена Павловна
Институт систем энергетики им. Л.А. Мелентьева СО РАН
В статье рассмотрены подходы к проектированию и реализации отдельных компонентов инструментальных средств для семантического анализа извлекаемой из открытых источников информации о научных и технологических решениях в области энергетики. Рассмотрена структура билингвистической онтологии, позволяющая решать задачу классификации информации с учётом ее представления в различных языках и синонимии. Рассмотрен подход к поиску и обработке информации из открытых источников, основанный на применении разработанных авторами средств семантического анализа, реализация которых выполнялась на Python с использованием библиотеки Natural Language Toolkit.
научно-технологическое прогнозирование, семантический анализ, классификация текстовых документов, билингвистическая онтология