РЕСУРСЫ, ПРЕДОСТАВЛЯЮЩИЕ ДАННЫЕ ДЛЯ МАШИННОГО ОБУЧЕНИЯ И ПРОВЕРКИ ТЕХНОЛОГИЙ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Сикулер Денис Валерьевич
Российский государственный педагогический университет им. А. И. Герцена
В статье выполнен обзор 10 ресурсов сети Интернет, позволяющих подобрать данные для разнообразных задач, связанных с машинным обучением и искусственным интеллектом. Рассмотрены как широко известные сайты (например, Kaggle, Registry of Open Data on AWS), так и менее популярные или узкоспециализированные ресурсы (к примеру, The Big Bad NLP Database, Common Crawl). Все ресурсы предоставляют бесплатный доступ к данным, в большинстве случаев для этого даже не требуется регистрация. Для каждого ресурса указаны характеристики и особенности, касающиеся поиска и получения наборов данных. В работе представлены следующие сайты: Kaggle, Google Research, Microsoft Research Open Data, Registry of Open Data on AWS, Harvard Dataverse Repository, Zenodo, Портал открытых данных Российской Федерации, World Bank, The Big Bad NLP Database, Common Crawl
поиск данных, набор данных, открытые данные, репозиторий данных, каталог наборов данных, искусственный интеллект, машинное обучение