Перейти к содержанию

Подготовка данных

Подготовка данных — это основа успешных моделей компьютерного зрения. Ultralytics Platform предоставляет комплексные инструменты для управления вашими обучающими данными, от загрузки и аннотирования до анализа.

Обзор

Раздел «Данные» в Ultralytics Platform помогает вам:

  • Загружать изображения, видео и ZIP-архивы
  • Аннотировать с помощью ручных инструментов и разметки с использованием ИИ
  • Анализировать свои данные с помощью статистики и визуализаций
  • Экспортировать в стандартных форматах для локального обучения

Рабочий процесс

graph LR
    A[📤 Upload] --> B[🏷️ Annotate]
    B --> C[📊 Analyze]
    C --> D[🚀 Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ЭтапОписание
ЗагрузкаИмпортировать изображения, видео или ZIP-архивы с автоматической обработкой
АннотированиеРазметка данных с помощью ограничивающих рамок, полигонов, ключевых точек или классификаций.
АнализПросмотр распределений классов, пространственных тепловых карт и статистики размеров.
ЭкспортСкачивание в формате NDJSON для автономного использования.

Поддерживаемые задачи

Платформа Ultralytics поддерживает все 5 типов задач YOLO:

ЗадачаОписаниеИнструмент аннотирования
ОбнаружениеОбнаружение объектов (detect) с помощью ограничивающих рамокИнструмент «Прямоугольник»
СегментацияСегментация экземпляров (segment) с помощью пиксельных масокИнструмент «Полигон»
ПозаОценка ключевых точек (формат COCO, 17 точек)Инструмент «Ключевая точка»
OBBОриентированные ограничивающие рамки для повернутых объектовИнструмент «Ориентированная рамка»
КлассификацияКлассификация на уровне изображенияСелектор классов

Основные характеристики

Умное хранилище

Платформа Ultralytics использует эффективную технологию хранения данных:

  • Дедупликация: Идентичные изображения хранятся только один раз.
  • Целостность: Контрольные суммы обеспечивают целостность данных.
  • Эффективность: Оптимизированное хранение и быстрая обработка.

URI наборов данных

Ссылочные наборы данных с использованием ul:// формат URI:

yolo train data=ul://username/datasets/my-dataset

Это позволяет обучать модели на наборах данных Платформы с любой машины, на которой настроен ваш API-ключ.

Статистика и визуализация

Каждый набор данных включает автоматическую статистику:

  • Распределение классов: Столбчатая диаграмма количества меток по классам.
  • Тепловая карта местоположения: Пространственное распределение аннотаций
  • Анализ размеров: Распределение ширины и высоты изображений
  • Разбивка по наборам данных: Количество образцов в обучающем, валидационном и тестовом наборах
  • Наборы данных: Загружайте и управляйте своими обучающими данными
  • Аннотирование: Разметка данных с помощью ручных инструментов и инструментов с ИИ

Часто задаваемые вопросы

Какие форматы файлов поддерживаются для загрузки?

Ultralytics Platform поддерживает:

Изображения: JPEG, PNG, WebP, BMP, GIF, TIFF, HEIC, AVIF, JP2, DNG (максимум 50 МБ каждое)

Видео: MP4, WebM, MOV, AVI, MKV, M4V (максимум 1 ГБ, кадры извлекаются со скоростью 1 FPS, максимум 100 кадров)

Архивы: ZIP-файлы (максимум 50 ГБ), содержащие изображения с опциональными метками YOLO

Каков максимальный размер набора данных?

Ограничения на хранение зависят от вашего тарифа:

ПланЛимит хранилища
Бесплатно100 ГБ
Pro500 ГБ
КорпоративныйПользовательский

Ограничения на отдельные файлы: изображения — 50 МБ, видео — 1 ГБ, ZIP-архивы — 50 ГБ

Могу ли я использовать свои наборы данных Platform для локального обучения?

Да! Используйте формат URI набора данных для локального обучения:

export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100

Или экспортируйте свой набор данных в формате NDJSON для полностью автономного обучения.



📅 Создано 20 дней назад ✏️ Обновлено 12 дней назад
glenn-jocher

Комментарии