Метрический анализ сходства композиционных данных для нечеткого поиска релевантных рецептур эластомерных смесей

  • Рыбанов Александр Александрович, Волжский политехнический институт (филиал) Волгоградского государственного технического университета (Волжский, Россия)
  • Каблов Виктор Федорович, Волжский политехнический институт (филиал) Волгоградского государственного технического университета (Волжский, Россия)

В статье рассматривается актуальная задача разработки специализированных методов для поиска и ранжирования близких по составу рецептур резиновых смесей в базах данных. Целью исследования является разработка и сравнительный анализ метрик сходства, адаптированных для количественной оценки близости многокомпонентных композиционных данных, представленных в виде нормированных векторов весовых долей ингредиентов. Основное содержание работы включает формальную постановку задачи идентификации релевантных рецептур, требующую максимизации комплексной функции сходства, учитывающей как качественный состав (наличие ингредиентов), так и количественные пропорции. В качестве инструментария предложены и адаптированы четыре метрики: взвешенные коэффициенты Жаккара и Дайса, сходство Хеллингера и косинусное сходство. Теоретический анализ их свойств дополнен эмпирической валидацией на реальной промышленной базе данных, содержащей 6096 уникальных рецептур. Научная новизна исследования заключается в систематическом применении и адаптации аппарата метрического анализа к задаче поиска аналогов для композиционных данных материаловедения, а также в выявлении фундаментальной кластеризации рассматриваемых мер сходства. В отличие от существующих подходов, фокусирующихся на бинарном представлении состава или прогнозе свойств, представленная методология целенаправленно решает задачу точного поиска по составу и пропорциям. Полученные результаты выявили практически функциональную эквивалентность взвешенных коэффициентов Жаккара и Дайса (коэффициент корреляции r=0.991), образующих один кластер мер, чувствительных к полному набору компонентов. Сходство Хеллингера и косинусное сходство продемонстрировали сильную корреляцию (r=0.883), сформировав второй кластер мер, ориентированных на оценку структурного подобия пропорций, при этом метрика Хеллингера показала повышенную чувствительность к вариациям долей минорных ингредиентов. На основе этого сформулированы практические рекомендации по комбинированному использованию одной метрики из каждого кластера для создания эффективных поисковых систем. Разработанный метрический аппарат создает формальную основу для интеллектуального поиска аналогов, автоматизации подбора компонентов и сокращения времени на разработку новых рецептур в промышленности.

рецептуры резиновых смесей, поиск аналогов, метрики сходства, взвешенный коэффициент Жаккара, коэффициент Дайса, сходство Хеллингера, косинусное сходство, композиционные данные, база данных, материаловедение

2026-06-05

Вернуться назад