Подготовка данных
Подготовка данных является основой успешных моделей компьютерного зрения. Ultralytics предоставляет комплексные инструменты для управления вашими обучающими данными, от загрузки до аннотирования и анализа.
Обзор
Раздел «Данные» Ultralytics поможет вам:
- Загрузка изображений, видео и ZIP-архивов
- Добавляйте аннотации с помощью ручных инструментов и маркировки с помощью искусственного интеллекта
- Анализируйте свои данные с помощью статистики и визуализации
- Экспорт в стандартные форматы для локального обучения
Рабочий процесс
graph LR
A[📤 Upload] --> B[🏷️ Annotate]
B --> C[📊 Analyze]
C --> D[🚀 Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Этап | Описание |
|---|---|
| Загрузить | Импорт изображений, видео или ZIP-архивов с автоматической обработкой |
| Аннотировать | Маркируйте данные с помощью ограничительных рамок, многоугольников, ключевых точек или классификаций. |
| Анализировать | Просмотр распределения классов, пространственных тепловых карт и статистики измерений |
| Экспорт | Скачать в формате NDJSON для использования в автономном режиме |
Поддерживаемые задачи
Ultralytics поддерживает все 5 типов YOLO :
| Задача | Описание | Инструмент аннотирования |
|---|---|---|
| Обнаружение | Обнаружение объектов с помощью ограничительных рамок | Инструмент «Прямоугольник» |
| Сегментация | Сегментация экземпляров с помощью пиксельных масок | Инструмент «Многоугольник» |
| Поза | Оценка ключевых точек (17-точечный COCO ) | Инструмент Keypoint |
| OBB | Ориентированные ограничительные рамки для повернутых объектов | Ориентированный инструмент для создания ящиков |
| Классификация | Классификация на уровне изображений | Селектор классов |
Основные характеристики
Умное хранение
Ultralytics использует эффективную технологию хранения данных:
- Дедупликация: идентичные изображения хранятся только один раз
- Целостность: контрольные суммы обеспечивают целостность данных
- Эффективность: оптимизированное хранение и быстрая обработка
URI наборов данных
Справочные наборы данных с использованием ul:// Формат URI:
yolo train data=ul://username/datasets/my-dataset
Это позволяет проводить обучение на наборах данных платформы с любого компьютера, на котором настроен ваш ключ API.
Статистика и визуализация
Каждый набор данных включает автоматическую статистику:
- Распределение классов: гистограмма количества меток по классам
- Тепловая карта местоположения: пространственное распределение аннотаций
- Анализ размеров: соотношение ширины и высоты изображения
- Разбивка: количество образцов для обучения/валидации/тестирования
Быстрые ссылки
- Наборы данных: загрузка и управление учебными данными
- Аннотация: Маркировка данных с помощью ручных и искусственного интеллекта инструментов
Часто задаваемые вопросы
Какие форматы файлов поддерживаются для загрузки?
Ultralytics поддерживает:
- Изображения: JPG, PNG, WebP, TIFF, BMP и другие распространенные форматы
- Видео: MP4, AVI, MOV — кадры извлекаются автоматически
- Архивы: ZIP-файлы, содержащие изображения с опциональными метками YOLO
Каков максимальный размер набора данных?
Ограничения по хранению данных зависят от вашего тарифного плана:
| План | Ограничение хранения |
|---|---|
| Бесплатно | 100 ГБ |
| Pro | 500 ГБ |
| Предприятие | Пользовательский |
Могу ли я использовать наборы данных своей платформы для локального обучения?
Да! Используйте формат URI набора данных для локального обучения:
export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100
Или экспортируйте набор данных в формате NDJSON для полностью автономного обучения.