Link to this sectionПодготовка данных#
Подготовка данных — это основа успешных моделей компьютерного зрения. Ultralytics Platform предоставляет комплексные инструменты для управления данными для обучения: от загрузки и аннотирования до анализа.
Watch: Get Started with Ultralytics Platform - Data
Link to this sectionОбзор#
Раздел Data в Ultralytics Platform помогает тебе:
- Загружать изображения, видео и файлы датасетов (ZIP, TAR, включая
.tar.gz/.tgz, NDJSON) - Аннотировать с помощью инструментов ручной разметки и умной маркировки на базе SAM — выбирай между SAM 2.1 или новым SAM 3
- Анализировать свои данные с помощью статистики и визуализаций
- Экспортировать данные в формате NDJSON для локального обучения

Link to this sectionРабочий процесс#
graph LR
A[Upload]:::start --> B[Annotate]:::proc
B --> C[Analyze]:::proc
C --> D[Train]:::out
classDef start fill:#4CAF50,color:#fff
classDef proc fill:#2196F3,color:#fff
classDef out fill:#9C27B0,color:#fff| Этап | Описание |
|---|---|
| Загрузка | Импортируй изображения, видео или архивы с автоматической обработкой |
| Разметка | Размечай данные с помощью ручных инструментов для всех 6 типов задач или используй аннотацию SAM для детекции, сегментации, семантической сегментации и OBB |
| Анализ | Просматривай распределение классов, пространственные тепловые карты и статистику размеров |
| Экспорт | Скачивай в формате NDJSON для оффлайн-использования |
Link to this sectionПоддерживаемые задачи#
Ultralytics Platform поддерживает все 6 типов задач YOLO:
| Задача | Описание | Инструмент аннотирования |
|---|---|---|
| Detect | Детекция объектов с ограничивающими рамками (BBox) | Инструмент прямоугольника |
| Segment | Сегментация экземпляров с пиксельными масками | Инструмент многоугольника |
| Semantic | Семантическая сегментация с пиксельными областями по классам | Инструмент многоугольника |
| Pose | Оценка ключевых точек с помощью встроенных и пользовательских шаблонов скелета | Инструмент ключевых точек |
| OBB | Ориентированные ограничивающие рамки для повернутых объектов | Инструмент ориентированной рамки |
| Classify | Классификация на уровне изображения | Выбор класса |
Тип задачи устанавливается при создании датасета и определяет доступные инструменты аннотирования. Ты можешь изменить его позже через селектор задач в заголовке датасета, но несовместимые аннотации не будут отображаться после переключения.
Link to this sectionКлючевые особенности#
Link to this sectionУмное хранилище#
Ultralytics Platform использует контентно-адресуемое хранилище (CAS) для эффективного управления данными:
- Дедупликация: Идентичные изображения хранятся только один раз благодаря хешированию XXH3-128
- Целостность: Адресация на основе хешей гарантирует целостность данных
- Эффективность: Оптимизированное хранение и быстрая обработка
Link to this sectionURI датасетов#
Ссылайся на датасеты, используя формат URI ul:// (см. Использование датасетов платформы):
yolo train data=ul://username/datasets/my-datasetЭто позволяет обучать модели на датасетах платформы с любого компьютера, где настроен твой API ключ.
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)Link to this sectionВерсионирование датасетов#
Создавай неизменяемые снимки (снапшоты) NDJSON твоего датасета для воспроизводимого обучения. Каждая версия фиксирует количество изображений, классов и аннотаций на момент создания. Подробности см. во вкладке «Версии».
Link to this sectionВкладки набора данных#
Страницы датасетов могут содержать до шести вкладок в зависимости от состояния датасета и твоих прав доступа:
| Вкладка | Описание |
|---|---|
| Изображения | Просматривай изображения в виде сетки, компактного списка или таблицы с наложенными аннотациями |
| Classes | Просматривай и редактируй названия классов, цвета и количество меток для каждого класса |
| Графики | Автоматическая статистика: распределение по выборкам (split), количество классов, тепловые карты |
| Модели | Модели, обученные на этом датасете, с метриками и статусом |
| Версии | Создавай и скачивай неизменяемые снимки NDJSON для воспроизводимого обучения |
| Ошибки | Изображения, обработка которых не удалась, с описанием ошибок и инструкциями по их исправлению |
Вкладки Classes (Классы) и Charts (Графики) появляются, когда в датасете есть изображения. Errors (Ошибки) появляется только при наличии сбоев в обработке. Versions (Версии) доступна для владельцев или для пользователей с доступом, если версии уже существуют.
Link to this sectionКластеризация#
Исследуй датасет как интерактивную 2D-диаграмму рассеяния, где визуально похожие изображения расположены близко друг к другу. Это полезно для поиска кластеров, дубликатов и выбросов, а также для проверки распределения выборок или классов по данным. Выдели область на графике инструментом «лассо», чтобы отфильтровать галерею до этих изображений. Подробности см. в разделе Кластеризация.
Link to this sectionСтатистика и визуализация#
Вкладка Charts предоставляет автоматический анализ, включая:
- Распределение выборок (Split Distribution): Круговая диаграмма количества изображений в обучающей, валидационной и тестовой выборках
- Топ классов: Круговая диаграмма наиболее часто встречающихся классов аннотаций
- Размеры изображений: Гистограмма распределения ширины и высоты изображений (в пикселях)
- Точки на экземпляр: Распределение количества вершин многоугольника или ключевых точек (для датасетов сегментации или поз)
- Расположение аннотаций: 2D тепловая карта расположения центров ограничивающих рамок
- Размеры изображений 2D: 2D тепловая карта ширины относительно высоты с направляющими линиями соотношения сторон
Link to this sectionБыстрые ссылки#
- Датасеты: Загружай, управляй и экспортируй данные для обучения
- Аннотирование: Размечай данные с помощью ручных и ИИ-инструментов
- Облачное обучение: Обучай модели на своих аннотированных датасетах
- URI датасета: Используй
ul://URI для обучения откуда угодно
Link to this sectionFAQ#
Link to this sectionКакие форматы файлов поддерживаются для загрузки?#
Ultralytics Platform поддерживает:
Изображения: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (макс. 50 МБ каждое)
Видео: MP4, WebM, MOV, MKV, M4V (макс. 1 ГБ, кадры извлекаются с частотой 1 FPS, максимум 100 кадров)
Файлы датасетов: Архивы ZIP или TAR, включая .tar.gz и .tgz (макс. 10 ГБ на Free, 20 ГБ на Pro, 50 ГБ на Enterprise), содержащие изображения с опциональными метками в формате YOLO, а также экспорт NDJSON
Link to this sectionКаков максимальный размер датасета?#
Лимиты хранилища зависят от твоего тарифного плана:
| Тарифный план | Лимит хранилища |
|---|---|
| Бесплатно | 100 ГБ |
| Pro | 500 ГБ |
| Enterprise | Без ограничений |
Лимиты на отдельный файл: изображения 50 МБ, видео 1 ГБ, датасеты 10 ГБ на Free / 20 ГБ на Pro / 50 ГБ на Enterprise
Link to this sectionМогу ли я использовать датасеты платформы для локального обучения?#
Да! Используй формат URI датасета для локального обучения:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100Или экспортируй свой датасет в формате NDJSON для полностью оффлайн обучения.