Подготовка данных
Подготовка данных — это основа успешных моделей компьютерного зрения. Ultralytics Platform предоставляет комплексные инструменты для управления вашими обучающими данными, от загрузки и аннотирования до анализа.
Обзор
Раздел «Данные» в Ultralytics Platform помогает вам:
- Загружать изображения, видео и ZIP-архивы
- Аннотировать с помощью ручных инструментов и разметки с использованием ИИ
- Анализировать свои данные с помощью статистики и визуализаций
- Экспортировать в стандартных форматах для локального обучения
Рабочий процесс
graph LR
A[📤 Upload] --> B[🏷️ Annotate]
B --> C[📊 Analyze]
C --> D[🚀 Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Этап | Описание |
|---|---|
| Загрузка | Импортировать изображения, видео или ZIP-архивы с автоматической обработкой |
| Аннотирование | Разметка данных с помощью ограничивающих рамок, полигонов, ключевых точек или классификаций. |
| Анализ | Просмотр распределений классов, пространственных тепловых карт и статистики размеров. |
| Экспорт | Скачивание в формате NDJSON для автономного использования. |
Поддерживаемые задачи
Платформа Ultralytics поддерживает все 5 типов задач YOLO:
| Задача | Описание | Инструмент аннотирования |
|---|---|---|
| Обнаружение | Обнаружение объектов (detect) с помощью ограничивающих рамок | Инструмент «Прямоугольник» |
| Сегментация | Сегментация экземпляров (segment) с помощью пиксельных масок | Инструмент «Полигон» |
| Поза | Оценка ключевых точек (формат COCO, 17 точек) | Инструмент «Ключевая точка» |
| OBB | Ориентированные ограничивающие рамки для повернутых объектов | Инструмент «Ориентированная рамка» |
| Классификация | Классификация на уровне изображения | Селектор классов |
Основные характеристики
Умное хранилище
Платформа Ultralytics использует эффективную технологию хранения данных:
- Дедупликация: Идентичные изображения хранятся только один раз.
- Целостность: Контрольные суммы обеспечивают целостность данных.
- Эффективность: Оптимизированное хранение и быстрая обработка.
URI наборов данных
Ссылочные наборы данных с использованием ul:// формат URI:
yolo train data=ul://username/datasets/my-dataset
Это позволяет обучать модели на наборах данных Платформы с любой машины, на которой настроен ваш API-ключ.
Статистика и визуализация
Каждый набор данных включает автоматическую статистику:
- Распределение классов: Столбчатая диаграмма количества меток по классам.
- Тепловая карта местоположения: Пространственное распределение аннотаций
- Анализ размеров: Распределение ширины и высоты изображений
- Разбивка по наборам данных: Количество образцов в обучающем, валидационном и тестовом наборах
Быстрые ссылки
- Наборы данных: Загружайте и управляйте своими обучающими данными
- Аннотирование: Разметка данных с помощью ручных инструментов и инструментов с ИИ
Часто задаваемые вопросы
Какие форматы файлов поддерживаются для загрузки?
Ultralytics Platform поддерживает:
Изображения: JPEG, PNG, WebP, BMP, GIF, TIFF, HEIC, AVIF, JP2, DNG (максимум 50 МБ каждое)
Видео: MP4, WebM, MOV, AVI, MKV, M4V (максимум 1 ГБ, кадры извлекаются со скоростью 1 FPS, максимум 100 кадров)
Архивы: ZIP-файлы (максимум 50 ГБ), содержащие изображения с опциональными метками YOLO
Каков максимальный размер набора данных?
Ограничения на хранение зависят от вашего тарифа:
| План | Лимит хранилища |
|---|---|
| Бесплатно | 100 ГБ |
| Pro | 500 ГБ |
| Корпоративный | Пользовательский |
Ограничения на отдельные файлы: изображения — 50 МБ, видео — 1 ГБ, ZIP-архивы — 50 ГБ
Могу ли я использовать свои наборы данных Platform для локального обучения?
Да! Используйте формат URI набора данных для локального обучения:
export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100
Или экспортируйте свой набор данных в формате NDJSON для полностью автономного обучения.