Supervise.ly

Онлайн сервис управления, аннотирования и подготовки датасетов для глубокого обучения.

Web
Annotation
Computer vision
Node.js

2017

Перейти на

Supervise.ly

Читать на

Medium

Прямо сейчас глубокое обучение (Deep Learning) завоевывает мир. Автомобили без водителя, Deep Dream, генерация музыки — то, что еще вчера казалось магией, сегодня уже обычное дело. И для этого не нужно быть волшебником или кандидатом наук. Есть видеокарта? Этого достаточно.

Рис 1. Хорошее время для глубокого обучения.

Одна из главных причин, почему Deep learning уже не является чем-то невероятным — это современные фреймворки. Tensorflow, Caffe, Keras — с их помощью можно конструировать сложные нейронные сети как из кубиков Лего.

Но есть не самая приятная часть, о которой обычно забывают: данные. Это как топливо для алгоритмов машинного обучения, без которого нейронные сети не будут работать. Существует множество библиотек и фреймворков для создания нейронных сетей, но очень мало утилит для подготовки данных.

Большие компании имеют возможности собирать огромные датасеты и инвестировать средства в такие сервисы, как Amazon Mechanical Turk. Что остается небольшим компаниям и специалистам?

Почему мы создали Supervise.ly

Создание решений для бизнеса из самых разных сфер — каждодневная часть нашей работы. Чтобы использовать самые последние модели в реальной жизни, сначала нам требуется собрать данные, подготовить их и дополнить публичными датасетами. А еще данные следует доразметить и выгрузить в конкретном формате. Обычно эта работа занимает большую часть нашего времени! 😫

Рис 2. Пропущенный элемент

Чтобы облегчить эту работу мы и создали бесплатный сервис, в котором можно быстро и легко пройти все шаги подготовки датасета для обучения — Supervise.ly.

Что внутри?

Так как Supervise.ly может вам помочь?

  • Онлайн сервис по работе с датасетам. Храните и работайте с данными в едином месте, из любой точки мира: со множеством инструментов и надежным резервированием.
  • Импорт данных. Загружайте собственные изображения или автоматически конвертируйте популярные публичные датасеты в наш формат.
  • Инструмент аннотирования. Разметка даже одного изображения может занимать до 30 минут: очень важно иметь удобный и практичный инструмент. Мы поддерживаем горячие клавиши, попиксельную и полигональную разметку, фильтрацию и тегирование в веб-решении.
    Рис 3. Инструмент аннотирования
  • Умный экспорт. Храните датасеты в едином месте и обрабатывайте их вместе! Без кода: простые JSON конфигурации позволяют фильтровать, изменять масштаб, аугоментировать, разбивать и объединять данные. И, конечно, выгружать результат в одном их популярных форматов, готовыми для обучения.
    Рис 4. Экспорт
  • Статистика. Важно знать свои данные, чтобы не встретиться с неожиданными проблемами в будущем. Такие проблемы как дисбаланс классов можно выявить еще на этапе просмотра статистики.
    Рис 5. Статистика
  • Управление ролями. Компании оценят возможность создания множества аккаунтов, разделения пользователей на группы и роли, настройки уровней доступа и лог с возможностью отмены действий.
  • Интеграции. Используйте мощные инструменты, такие как Amazon Mechanical Turk вместе с Supervisely для максимальных результатов.

Для кого?

  • Студенты и исследователи оценят простоту и возможность использовать открытые датасеты. К тому же, для некоммерческого использования Supervise.ly абсолютно бесплатный.
  • Бизнес и компании смогут иметь единое место для безопасного хранения ценной информации и использовать преимущества онлайн аннотирования. Для тех, кто беспокоится вопросом приватности данных мы подготовили версию Supervisely для запуска на собственных серверах.

Больше информации

Чтобы облегчить начало работы мы начали серию обучающих материалов о том, как обучать самые последние модели с использованием Supervisely.

Больше подробностей в нашем блоге на Medium или документации.