YOLOv8 YOLOv6. YOLOv6: подробное исследование обнаружения объектов в реальном времени
Ландшафт компьютерного зрения определяется быстрой итерацией и конкуренцией. Двумя важными вехами в этой эволюции являются Ultralytics YOLOv8, универсальный мощный инструмент, выпущенный в начале 2023 года, и YOLOv6.YOLOv6, высокопроизводительный детектор от Meituan. Хотя обе модели направлены на решение проблемы обнаружения объектов в реальном времени, они подходят к ней с разными философиями в отношении архитектуры, удобства использования и развертывания.
В этом сравнении рассматриваются технические различия между этими архитектурами, что помогает разработчикам выбрать подходящий инструмент для различных приложений, от автономных транспортных средств до промышленного контроля.
Метрики производительности
При выборе модели для производства решающим фактором часто является компромисс между скоростью инференции и средней точностью (mAP). В таблице ниже представлены результаты обеих моделей на COCO , стандартном тесте для обнаружения объектов.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
В то время как YOLOv6.0 демонстрирует конкурентоспособную производительность на специализированном GPU , Ultralytics YOLOv8 демонстрирует исключительную универсальность, сохраняя высокую точность во всех масштабах, а также предлагая превосходную простоту использования и более широкую аппаратную совместимость.
Ultralytics YOLOv8: универсальный стандарт
Выпущено Ultralytics в январе 2023 года, YOLOv8 значительный архитектурный сдвиг по сравнению со своими предшественниками. Он был разработан не только как модель обнаружения, но и как унифицированная структура, способная одновременно обрабатывать несколько задач зрительного восприятия.
- Авторы: Гленн Джокер, Аюш Чаурасия и Цзин Цю
- Организация:Ultralytics
- Дата: 2023-01-10
- GitHub:ultralytics/ultralytics
Основные характеристики архитектуры
YOLOv8 головку обнаружения без анкеров, которая упрощает процесс обучения, устраняя необходимость вручную настраивать анкерные рамки на основе распределения набора данных. Это делает модель более устойчивой при обобщении на пользовательских наборах данных.
Архитектура включает модуль C2f (Cross-Stage Partial bottleneck с двумя свертками), который заменяет модуль C3, используемый в YOLOv5. Модуль C2f улучшает поток градиента и позволяет модели обучаться более богатым представлениям признаков без значительного увеличения вычислительных затрат. Кроме того, YOLOv8 развязанную структуру головы, разделяя задачи объектности, классификации и регрессии, что, как было показано, улучшает скорость сходимости и точность.
Экосистема и удобство использования
Одной из определяющих сильных сторон YOLOv8 его интеграция в Ultralytics . Пользователи могут обучать, валидировать и развертывать модели с помощью простого CLI Python , с встроенной поддержкой настройки гиперпараметров и отслеживания экспериментов.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=50)
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
YOLOv6.0: Промышленная производительность
YOLOv6.YOLOv6, разработанный отделом искусственного интеллекта Meituan Vision, позиционируется как «детектор объектов нового поколения для промышленного применения». Он в значительной степени ориентирован на максимальную пропускную способность аппаратных ускорителей, таких как NVIDIA .
- Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг и др.
- Организация: Meituan
- Дата: 2023-01-13
- Arxiv:2301.05586
Архитектурный фокус
YOLOv6.YOLOv6 использует модуль двунаправленной конкатенации (BiC) в своей «шее» для улучшения слияния признаков. Он также использует стратегию обучения с помощью якорей (AAT), которая пытается объединить преимущества парадигм на основе якорей и без якорей на этапе обучения, хотя вывод остается без якорей.
Основой является EfficientRep, который разработан с учетом аппаратных возможностей для GPU . Эта оптимизация делает YOLOv6 эффективным в сценариях, где возможна пакетная обработка на серверах, например, при автономном анализе видео. Однако такая специализация иногда может приводить к более высокой задержке на периферийных устройствах, CPU, по сравнению с моделями, оптимизированными для вычислений общего назначения.
Подробное сравнение
1. Эффективность обучения и память
Ultralytics разработаны с учетом эффективности обучения. YOLOv8 требует меньше CUDA , чем альтернативные решения на основе трансформаторов или более старые архитектуры. Такая эффективность позволяет разработчикам обучать более крупные модели или использовать более крупные размеры пакетов на потребительских графических процессорах (таких как NVIDIA 3060 или 4090).
Напротив, конвейер обучения YOLOv6. YOLOv6, хотя и эффективен, часто требует более тщательной настройки гиперпараметров для достижения стабильности. Его зависимость от конкретных стратегий инициализации может затруднять новичкам адаптацию к пользовательским наборам данных без проведения обширных экспериментов.
Интеграция Ultralytics
Ultralytics легко интегрируются с Ultralytics (ранее HUB). Этот веб-инструмент позволяет визуализировать наборы данных, отслеживать обучение в режиме реального времени и одним щелчком мыши развертывать модели на iOS, Android или пограничных устройствах — функции, которые значительно оптимизируют жизненный цикл машинного обучения по сравнению с традиционными репозиториями.
2. Универсальность задач
Важным отличительным фактором является набор задач, поддерживаемых изначально.
- YOLOv8 является многозадачной средой. Она поддерживает:
- Обнаружение объектов
- Сегментация экземпляров (маскировка на уровне пикселей)
- Оценка позы (обнаружение ключевых точек)
- Ориентированные ограничивающие прямоугольники (OBB) (для воздушных или вращающихся объектов)
- Классификация изображений
- YOLOv6.YOLOv6 в первую очередь предназначен для стандартного обнаружения объектов. Хотя были выпущены экспериментальные версии для других задач, поддержка экосистемы и документация для них менее полные, чем для YOLOv8.
3. Развертывание и экспорт
Обе модели поддерживают экспорт в ONNX и TensorRT. Однако конвейер Ultralytics значительно более надежен, поскольку автоматически обрабатывает сложные операторы и динамические оси.
Например, экспорт YOLOv8 в TensorFlow для мобильного развертывания является встроенной функцией:
# Export YOLOv8 to TFLite format for Android/iOS
yolo export model=yolov8n.pt format=tflite
Эта простота использования распространяется на OpenVINO и CoreML, что делает YOLOv8 превосходным выбором для кроссплатформенного развертывания.
Готовность к будущему: аргументы в пользу YOLO26
Хотя YOLOv8 YOLOv6. YOLOv6 остаются мощными инструментами, область искусственного интеллекта быстро развивается. Для разработчиков, начинающих сегодня новые проекты, Ultralytics представляет собой вершину эффективности и производительности.
Выпущенная в январе 2026 года, YOLO26 основана на сильных сторонах YOLOv8 в ней внедрены революционные изменения:
- Полная NMS: благодаря устранению необходимости в немаксимальном подавлении (NMS) YOLO26 сокращает задержку вывода и упрощает процессы развертывания.
- Оптимизатор MuSGD: вдохновленный обучением LLM, этот оптимизатор обеспечивает более быструю конвергенцию и большую стабильность во время обучения.
- Оптимизация краев: благодаря удалению Distribution Focal Loss (DFL) YOLO26 достигает до 43% более быстрой инференции на CPU, устраняя ключевое ограничение предыдущих высокоточных моделей.
- Улучшенные функции потери: интеграция ProgLoss и STAL значительно улучшает обнаружение небольших объектов, что является критически важным требованием для изображений с дронов и датчиков IoT.
Заключение
YOLOv6.0 послужил впечатляющим эталоном GPU в промышленных условиях, особенно для стандартных задач обнаружения, где аппаратное обеспечение является фиксированным. Однако для подавляющего большинства разработчиков и исследователей Ultralytics YOLOv8 предлагает более сбалансированный, универсальный и удобный интерфейс. Поддержка сегментации, позы и OBB в сочетании с надежной Ultralytics делает его более безопасной долгосрочной инвестицией.
Тем, кто ищет абсолютное передовое решение, мы рекомендуем перейти на YOLO26, который сочетает в себе универсальность v8 с архитектурной эффективностью нового поколения.
Дополнительная литература
Ознакомьтесь с другими моделями Ultralytics :
- YOLO11: надежный предшественник YOLO26.
- YOLOv9: Известен своей программируемой градиентной информацией (PGI).
- YOLOv10: пионер подхода NMS.