YOLOv6.0 против YOLO11: эволюция промышленного обнаружения объектов
Область обнаружения объектов в реальном времени переживает бурное развитие, обусловленное потребностью в моделях, которые обеспечивают баланс между скоростью, точностью и гибкостью развертывания. В этом сравнении рассматриваются два важных этапа на этом пути: YOLOv6.YOLOv6, специализированная промышленная платформа от Meituan, и YOLO11— универсальная и ориентированная на пользователя архитектура от Ultralytics. Хотя обе модели нацелены на высокую производительность, они значительно различаются по архитектурной философии, поддержке экосистемы и простоте использования.
Обзор модели
Понимание контекста этих моделей помогает оценить их преимущества. YOLOv6. YOLOv6 в значительной степени ориентирован на аппаратные оптимизации для промышленной производительности, тогда как YOLO11 комплексном опыте разработчиков, предлагая передовую точность для более широкого спектра задач машинного зрения.
YOLOv6-3.0
Выпущенная в начале 2023 года компанией Meituan, YOLOv6.YOLOv6 (также известная какYOLOv6 .0: A Full-Scale Reloading») была разработана специально для промышленного применения. Авторы — Чуй Ли, Лулу Ли, Ифэй Гэн и другие — сосредоточились на максимальном увеличении пропускной способности NVIDIA . В ней представлен модуль «двунаправленного соединения» (BiC) и обновлена стратегия обучения с помощью анкеров (AAT) с целью расширить границы приложений, критичных к задержкам, таких как автоматизированный контроль производства.
YOLO11
Запущен в сентябре 2024 года Гленном Джочером и Цзин Цю в Ultralytics, YOLO11 усовершенствованную версию YOLOv8 . Он обеспечивает превосходные возможности извлечения признаков для сложных сцен, сохраняя при этом эффективность. В отличие от своих предшественников, YOLO11 создан с упором на удобство использования в Ultralytics , что обеспечивает доступность обучения, валидации и развертывания как для исследователей, так и для корпоративных разработчиков.
Техническое сравнение
В следующей таблице показаны различия в производительности двух архитектур. YOLO11 обеспечивает более высокую точность (mAP) для моделей аналогичного размера, особенно в более крупных вариантах, при этом сохраняя конкурентоспособную скорость вывода.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Архитектура и Дизайн
YOLOv6 использует базовую структуру типа VGG, которая эффективна на графических процессорах, но может быть перегружена параметрами. Во время обучения она использует блоки RepVGG, которые перепараметризуются в более простые структуры для вывода. Эта «структурная перепараметризация» является ключом к ее скорости на специализированном оборудовании, таком как Tesla T4.
YOLO11 усовершенствует дизайн сети CSP (Cross Stage Partial) с блоком C3k2, который обеспечивает лучший градиентный поток и снижает вычислительную избыточность. Он обеспечивает превосходный баланс производительности, достигая более высокой точности с меньшим количеством FLOP и параметров, чем эквивалентные YOLOv6 . Эта эффективность приводит к снижению требований к памяти во время обучения, что позволяет пользователям обучать на потребительских GPU, где YOLOv6 сталкиваться с проблемами нехватки памяти.
Преимущество меньшего использования памяти
Ultralytics , такие как YOLO11 требуют значительно меньше CUDA во время обучения по сравнению со старыми архитектурами или моделями с большим количеством трансформаторов, такими как RT-DETR. Это позволяет использовать более крупные пакеты данных и ускорить итерации обучения на стандартном оборудовании.
Экосистема и простота использования
Одно из самых существенных различий заключается в экосистеме, окружающей эти модели.
YOLOv6 — это в первую очередь репозиторий для исследований. Несмотря на свою мощность, он часто требует ручной настройки наборов данных, сложной настройки среды и глубоких знаний PyTorch реализации пользовательских конвейеров обучения.
Ultralytics YOLO11 процветает Простота использования. ultralytics Python предоставляет единый интерфейс для всех задач. Разработчики могут переключаться между обнаружением, сегментация экземплярови оценка позы просто изменив название модели.
from ultralytics import YOLO
# Load a YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100)
# Export to ONNX for deployment
model.export(format="onnx")
Эта хорошо поддерживаемая экосистема включает в себя исчерпывающую документацию, активные форумы сообщества и интеграцию с такими инструментами, как Ultralytics для управления данными и Weights & Biases для отслеживания экспериментов.
Универсальность и применение в реальных условиях
В то время как YOLOv6. YOLOv6 ориентирован исключительно на обнаружение ограничительных рамок, YOLO11 огромную универсальность. Он изначально поддерживает:
- Обнаружение объектов: стандартная локализация ограничительной рамки.
- Сегментация экземпляров: маскирование объектов на уровне пикселей, что имеет решающее значение для биомедицинской визуализации и удаления фона.
- Оценка позы: обнаружение ключевых точек скелета для анализа спортивных результатов и мониторинга поведения.
- Классификация: Категоризация целых изображений.
- Ориентированные ограничительные рамки (OBB): обнаружение повернутых объектов, что имеет важное значение для аэрофотосъемки и логистики перевозок.
Идеальные варианты использования
- YOLOv6.YOLOv6: Наилучшим образом подходит для строго контролируемых промышленных сред, где гарантировано наличие специального GPU (например, NVIDIA ), а единственной задачей является высокопроизводительное 2D-обнаружение. Примером может служить высокоскоростное обнаружение дефектов на сборочной линии.
- YOLO11: предпочтительный выбор для различных сценариев развертывания, от периферийных устройств до облачных серверов. Благодаря балансу точности и скорости он идеально подходит для аналитики в розничной торговле, автономной навигации и приложений для умных городов, где адаптивность и простота обслуживания имеют первостепенное значение.
Будущее Edge AI: YOLO26
Хотя YOLO11 мощным инструментом, разработчики, стремящиеся к абсолютной передовой эффективности и производительности, должны обратить внимание на YOLO26. Выпущенный в январе 2026 года, YOLO26 представляет собой сдвиг парадигмы в области компьютерного зрения в реальном времени.
Почему стоит перейти на YOLO26?
YOLO26 основан на успехе YOLO11 в нем внедрены архитектурные нововведения, которые значительно повышают скорость и простоту развертывания.
- Сквозной дизайн NMS: в отличие от YOLO11 YOLOv6, которые используют немаксимальное подавление (NMS) для фильтрации перекрывающихся рамок, YOLO26 изначально является сквозным. Это устраняет NMS , что приводит к детерминированной задержке и упрощению процессов развертывания.
- Ускорение CPU до 43%: благодаря удалению Distribution Focal Loss (DFL) и оптимизации архитектуры для пограничных вычислений YOLO26 демонстрирует превосходную производительность на CPU и устройствах с низким энергопотреблением, где GPU недоступны.
- Оптимизатор MuSGD: вдохновленный инновациями в области обучения LLM, новый оптимизатор MuSGD обеспечивает более стабильное обучение и более быструю конвергенцию, сокращая время и затраты, необходимые для обучения пользовательских моделей.
- Улучшения для конкретных задач: от улучшенного обнаружения мелких объектов с помощью ProgLoss + STAL до специализированных потерь для семантической сегментации и OBB, YOLO26 предлагает повышенную точность для всех задач зрительного восприятия.
Заключение
YOLOv6.YOLOv6 остается достойным выбором для определенных промышленных ниш, GPU. Однако для подавляющего большинства разработчиков и исследователей Ultralytics предлагают более выгодное ценное предложение.
YOLO11 предоставляет надежную, универсальную и удобную платформу, которая упрощает сложный процесс обучения современных нейронных сетей. Она обеспечивает более высокую точность по каждому параметру и поддерживает более широкий спектр задач.
Для новых проектов в 2026 году и далее YOLO26 является рекомендуемой отправной точкой. Его архитектура NMS и CPU делают его наиболее перспективным решением для внедрения эффективного и высокопроизводительного ИИ в реальный мир. Использование Ultralytics еще больше ускоряет этот процесс, позволяя командам переходить от сбора данных к внедрению в рекордно короткие сроки.
Дополнительная литература
- Изучите другие модели, такие как YOLOv10 для ранних концепций NMS.
- Узнайте о обучении по пользовательским данным в нашем Руководстве по обучению.
- Узнайте, как развертывать модели с помощью ONNX или TensorRT.