Meet YOLO26: next-gen vision AI.

Link to this sectionПодготовка данных#

Подготовка данных — это основа успешных моделей computer vision. Ultralytics Platform предоставляет комплексные инструменты для управления данными для обучения: от загрузки и разметки до анализа.



Watch: Get Started with Ultralytics Platform - Data

Link to this sectionОбзор#

Раздел «Данные» в Ultralytics Platform помогает тебе:

  • Загружать изображения, видео и файлы датасетов (ZIP, TAR, включая .tar.gz/.tgz, NDJSON)
  • Размечать с помощью ручных инструментов рисования и интеллектуальной разметки на базе SAM — выбери SAM 2.1 или новый SAM 3
  • Анализировать свои данные с помощью статистики и визуализаций
  • Экспортировать в формате NDJSON для локального обучения

Ultralytics Platform Data Overview Sidebar Datasets

Link to this sectionРабочий процесс#

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ЭтапОписание
ЗагрузкаИмпортируй изображения, видео или архивы с автоматической обработкой
АннотированиеРазмечай данные ручными инструментами для всех 6 типов задач или используй SAM-разметку для задач detect, segment, semantic и OBB
АнализПросматривай распределение классов, пространственные тепловые карты и статистику размеров
ЭкспортСкачивай в формате NDJSON для автономного использования

Link to this sectionПоддерживаемые задачи#

Ultralytics Platform поддерживает все 6 типов задач YOLO:

ЗадачаОписаниеИнструмент разметки
DetectДетекция объектов с помощью ограничивающих рамокИнструмент «Прямоугольник»
SegmentСегментация экземпляров с помощью масок пикселейИнструмент «Полигон»
SemanticСемантическая сегментация с областями пикселей для каждого классаИнструмент «Полигон»
PoseОценка ключевых точек со встроенными и пользовательскими шаблонами скелетовИнструмент «Ключевые точки»
OBBОриентированные ограничивающие рамки для повернутых объектовИнструмент «Ориентированная рамка»
ClassifyКлассификация на уровне изображенияВыбор класса
Выбор типа задачи

Тип задачи устанавливается при создании датасета и определяет, какие инструменты разметки будут доступны. Ты можешь изменить его позже в заголовке датасета, но несовместимая разметка не будет отображаться после переключения.

Link to this sectionОсновные функции#

Link to this sectionУмное хранилище#

Ultralytics Platform использует контентно-адресуемое хранилище (CAS) для эффективного управления данными:

  • Дедупликация: Идентичные изображения сохраняются только один раз с помощью хеширования XXH3-128
  • Целостность: Адресация на основе хешей обеспечивает целостность данных
  • Эффективность: Оптимизированное хранение и быстрая обработка

Link to this sectionURI датасетов#

Ссылайся на датасеты, используя формат URI ul:// (см. Использование датасетов платформы):

yolo train data=ul://username/datasets/my-dataset

Это позволяет проводить обучение на датасетах платформы с любого компьютера, где настроен твой API key.

Использование данных платформы из Python
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Link to this sectionВерсионирование датасетов#

Создавай неизменяемые NDJSON-снимки твоего датасета для воспроизводимого обучения. Каждая версия фиксирует количество изображений, классов и разметок на момент создания. См. Вкладка версий для получения подробной информации.

Link to this sectionВкладки датасетов#

Страницы датасетов могут отображать до шести вкладок в зависимости от состояния датасета и твоих прав доступа:

ВкладкаОписание
ИзображенияПросматривай изображения в виде сетки, компактном или табличном виде с наложенной разметкой
КлассыПросматривай и редактируй названия классов, цвета и количество меток для каждого класса
ГрафикиАвтоматическая статистика: распределение по выборкам, количество классов, тепловые карты
МоделиМодели, обученные на этом датасете, с метриками и статусом
ВерсииСоздавай и скачивай неизменяемые NDJSON-снимки для воспроизводимого обучения
ОшибкиИзображения, обработка которых не удалась, с описанием ошибок и рекомендациями по исправлению

Classes and Charts appear when the dataset has images. Errors appears only when processing failures exist. Versions appears for owners, or for non-owners when versions already exist.

Link to this sectionКластеризация#

Исследуй свой датасет как интерактивную 2D-диаграмму рассеяния, где визуально похожие изображения находятся рядом — это полезно для поиска кластеров, дубликатов и выбросов, а также для проверки распределения выборок или классов по твоим данным. Выдели лассо область графика, чтобы отфильтровать галерею до этих изображений. См. Кластеризация для подробностей.

Link to this sectionСтатистика и визуализация#

The Charts tab provides automatic analysis including:

  • Распределение выборок: Кольцевая диаграмма количества изображений для train/val/test
  • Топ классов: Кольцевая диаграмма наиболее частых классов разметки
  • Размеры изображений: Гистограмма распределения ширины и высоты изображений (в пикселях)
  • Точек на экземпляр: Распределение количества вершин полигона или ключевых точек (для датасетов segment/pose)
  • Расположение разметки: 2D тепловая карта позиций центров ограничивающих рамок
  • Размеры изображений 2D: 2D тепловая карта ширины относительно высоты с направляющими линиями соотношения сторон

Link to this sectionБыстрые ссылки#

  • Датасеты: Загружай, управляй и экспортируй свои данные для обучения
  • Разметка: Размечай данные с помощью ручных и ИИ-инструментов
  • Облачное обучение: Обучай модели на своих размеченных датасетах
  • URI датасета: Используй URI ul:// для обучения из любого места

Link to this sectionFAQ#

Link to this sectionКакие форматы файлов поддерживаются для загрузки?#

Ultralytics Platform поддерживает:

Изображения: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (макс. 50 МБ каждое)

Видео: MP4, WebM, MOV, AVI, MKV, M4V (макс. 1 ГБ, кадры извлекаются с частотой 1 FPS, макс. 100 кадров)

Файлы датасетов: Архивы ZIP или TAR, включая .tar.gz и .tgz (макс. 10 ГБ на тарифе Free, 20 ГБ на Pro, 50 ГБ на Enterprise), содержащие изображения с опциональными метками в формате YOLO, а также экспорты NDJSON

Link to this sectionКаков максимальный размер датасета?#

Лимиты хранилища зависят от твоего тарифного плана:

ТарифЛимит хранилища
Free100 ГБ
Pro500 ГБ
EnterpriseБезлимитно

Лимиты на отдельные файлы: Изображения 50 МБ, видео 1 ГБ, датасеты 10 ГБ на Free / 20 ГБ на Pro / 50 ГБ на Enterprise

Link to this sectionМогу ли я использовать свои датасеты платформы для локального обучения?#

Да! Используй формат URI датасета для локального обучения:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

Или экспортируй свой датасет в формате NDJSON для полностью автономного обучения.

Комментарии