Подготовка данных
Подготовка данных — это основа успешных моделей компьютерного зрения. Ultralytics Platform предоставляет комплексные инструменты для управления вашими обучающими данными, от загрузки и аннотирования до анализа.
Обзор
Раздел «Данные» в Ultralytics Platform помогает вам:
- Загрузка изображений, видео и архивов (ZIP, TAR, GZ)
- Добавляйте аннотации с помощью инструментов ручного рисования и интеллектуальной маркировки SAM
- Анализировать свои данные с помощью статистики и визуализаций
- Экспорт в формате NDJSON для локального обучения

Рабочий процесс
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Этап | Описание |
|---|---|
| Загрузка | Импорт изображений, видео или архивов с автоматической обработкой |
| Аннотирование | Разметка данных с помощью ограничивающих рамок, полигонов, ключевых точек или классификаций. |
| Анализ | Просмотр распределений классов, пространственных тепловых карт и статистики размеров. |
| Экспорт | Скачать в формате NDJSON для использования в автономном режиме |
Поддерживаемые задачи
Платформа Ultralytics поддерживает все 5 типов задач YOLO:
| Задача | Описание | Инструмент аннотирования |
|---|---|---|
| Обнаружение | Обнаружение объектов (detect) с помощью ограничивающих рамок | Инструмент «Прямоугольник» |
| Сегментация | Сегментация экземпляров (segment) с помощью пиксельных масок | Инструмент «Полигон» |
| Поза | Оценка ключевых точек (формат COCO, 17 точек) | Инструмент «Ключевая точка» |
| OBB | Ориентированные ограничивающие рамки для повернутых объектов | Инструмент «Ориентированная рамка» |
| Классификация | Классификация на уровне изображения | Селектор классов |
Выбор типа задачи
Тип задачи устанавливается при создании набора данных и определяет, какие инструменты аннотирования будут доступны. Вы можете изменить его позже в настройках набора данных, но несовместимые аннотации не будут отображаться после переключения.
Основные характеристики
Умное хранилище
Ultralytics использует хранилище с адресацией по содержанию (CAS) для эффективного управления данными:
- Дедупликация: идентичные изображения хранятся только один раз с помощью хеширования XXH3-128.
- Целостность: адресация на основе хеша обеспечивает целостность данных
- Эффективность: Оптимизированное хранение и быстрая обработка.
URI наборов данных
Ссылочные наборы данных с использованием ul:// Формат URI (см. Использование наборов данных платформы):
yolo train data=ul://username/datasets/my-dataset
Это позволяет проводить обучение на наборах данных платформы с любого компьютера, на котором настроен ваш ключ API.
Использование данных платформы из Python
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Вкладки набора данных
На каждой странице набора данных имеется пять вкладок:
| Вкладка | Описание |
|---|---|
| Изображения | Просмотр изображений в виде сетки, компактном или табличном виде с наложением аннотаций |
| Занятия | Просмотр и редактирование названий классов, цветов и количества меток в каждом классе |
| Графики | Автоматическая статистика: распределение по частям, подсчет классов, тепловые карты |
| Модели | Модели, обученные на этом наборе данных с метриками и статусом |
| Ошибки | Изображения, обработка которых завершилась с ошибкой, с подробностями об ошибке и инструкциями по исправлению |
Статистика и визуализация
Параметр Charts вкладка обеспечивает автоматический анализ, включая:
- Раздельное распределение: кольцевая диаграмма количества изображений train/val/test
- Лучшие классы: круговая диаграмма наиболее частых классов аннотаций
- Ширина изображения: гистограмма распределения ширины изображения
- Высота изображения: гистограмма распределения высоты изображения
- Точки на экземпляр: распределение вершин многоугольника или ключевых точек (наборы данныхsegment)
- Расположение аннотаций: 2D-тепловая карта положений центров ограничительных рамок
- Размеры изображения: 2D-тепловая карта ширины по отношению к высоте с линиями-ориентирами соотношения сторон
Быстрые ссылки
- Наборы данных: Загружайте и управляйте своими обучающими данными
- Аннотирование: Разметка данных с помощью ручных инструментов и инструментов с ИИ
Часто задаваемые вопросы
Какие форматы файлов поддерживаются для загрузки?
Ultralytics Platform поддерживает:
Изображения: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (максимум 50 МБ каждое)
Видео: MP4, WebM, MOV, AVI, MKV, M4V (максимум 1 ГБ, кадры извлекаются со скоростью 1 FPS, максимум 100 кадров)
Архивы: ZIP, TAR, TAR.GZ, TGZ, GZ (максимум 10 ГБ), содержащие изображения с опциональными меткамиYOLO
Каков максимальный размер набора данных?
Ограничения на хранение зависят от вашего тарифа:
| План | Лимит хранилища |
|---|---|
| Бесплатно | 100 ГБ |
| Pro | 500 ГБ |
| Корпоративный | Пользовательский |
Ограничения на отдельные файлы: изображения — 50 МБ, видео — 1 ГБ, архивы — 10 ГБ
Могу ли я использовать свои наборы данных Platform для локального обучения?
Да! Используйте формат URI набора данных для локального обучения:
export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "your_key"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Или экспортируйте набор данных в формате NDJSON для полностью автономного обучения.