YOLOv5 YOLO11: соединяя традиции и инновации в области обнаружения объектов
Эволюция архитектуры YOLO You Only Look Once) стала определяющим событием в области компьютерного зрения. От фундаментальной надежности YOLOv5 передовой эффективности YOLO11 — каждая итерация расширяла границы скорости и точности. В этом руководстве представлено подробное техническое сравнение, которое поможет разработчикам, исследователям и инженерам выбрать подходящую модель для своих конкретных потребностей развертывания.
Обзор модели
YOLOv5: промышленный стандарт
Выпущено в 2020 году Гленном Джочером и Ultralytics, YOLOv5 быстро стал золотым стандартом для практического обнаружения объектов. Это была первая YOLO , реализованная нативно в PyTorch, что сделало ее исключительно доступной для широкого сообщества ИИ. Благодаря балансу между простотой использования, надежными конвейерами обучения и гибкостью развертывания, она закрепила свое место в тысячах академических и промышленных приложений.
- Авторы: Гленн Джокер
- Организация:Ultralytics
- Дата: 2020-06-26
- GitHub:ultralytics/yolov5
YOLO11: усовершенствованный преемник
YOLO11, выпущенная в 2024 году, представляет собой значительный шаг вперед в Ultralytics . Опираясь на архитектурные достижения YOLOv8, она представляет усовершенствованную базовую и головную структуру, разработанную для превосходного извлечения характеристик и эффективности. YOLO11 на максимизации соотношения точности и вычислительной мощности, обеспечивая более высокую среднюю точность (mAP) с меньшим количеством параметров по сравнению с предшественниками.
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 2024-09-27
- GitHub:ultralytics/ultralytics
Последние рекомендации
Хотя YOLO11 значительные улучшения по сравнению с YOLOv5, разработчики, начинающие новые проекты в 2026 году, должны также оценить YOLO26. Он отличается нативной сквозной архитектурой (без NMS), инновационным оптимизатором MuSGD и на 43 % более быстрым CPU , что делает его лучшим выбором для современного периферийного развертывания.
Сравнение технической архитектуры
Базовая сеть и извлечение признаков
YOLOv5 использует магистраль CSPDarknet. Эта конструкция сети Cross-Stage Partial стала революционной для уменьшения вычислительной избыточности при сохранении богатого градиентного потока. Она эффективно уравновешивает глубину и ширину, позволяя модели обучаться сложным функциям без взрывного роста количества параметров.
YOLO11 развивает эту концепцию с помощью усовершенствованной магистрали CSP (C3k2) и вводит улучшенные механизмы пространственного внимания. Архитектура специально настроена для захвата мелких деталей, что значительно повышает производительность при обнаружении небольших объектов. Это усовершенствованная конструкция позволяет YOLO11 более высокой точности при меньшем размере модели.
Обнаружение Head
Датчик в YOLOv5 основана на анкерах и использует заранее определенные анкерные рамки для прогнозирования местоположения объектов. Этот подход эффективен, но требует тщательной настройки гиперпараметров размеров анкеров для пользовательских наборов данных.
YOLO11 использует головку обнаружения без якоря. Этот современный подход упрощает процесс обучения, позволяя напрямую прогнозировать центры и размеры объектов, устраняя необходимость в расчетах якорных рамок. Это не только оптимизирует процесс обучения, но и улучшает обобщение для объектов различной формы и пропорций.
Метрики производительности
В следующей таблице показаны различия в производительности между YOLOv5 YOLO11. Ключевым наблюдением является компромисс между скоростью и точностью. YOLO11 достигает более высоких mAP , сохраняя при этом конкурентоспособную или превосходную скорость вывода, особенно на GPU .
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 1.9 | 4.5 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 7.2 | 16.5 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 21.2 | 49.0 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 46.5 | 109.1 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 86.7 | 205.7 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Анализ:
- Точность: YOLO11n (Nano) достигает впечатляющих 39,5% mAP, что значительно превосходит 28,0% YOLOv5n. Это делает YOLO11 гораздо более предпочтительным YOLO11 для легких приложений, требующих высокой точности.
- Скорость: YOLO11 демонстрируют более высокую скорость CPU в ONNX , что крайне важно для развертывания наGPU .
- Эффективность: YOLO11 этих результатов с сопоставимым или зачастую меньшим количеством параметров (например, YOLO11x по сравнению с YOLOv5x), демонстрируя эффективность своих архитектурных оптимизаций.
Обучение и экосистема
Простота использования
Обе модели используют преимущества известной Ultralytics , в которой приоритетом является опыт разработчиков.
- YOLOv5 установил стандарт «начните обучение за 5 минут» благодаря своей интуитивной структуре и использованию стандартного PyTorch .
- YOLO11 безупречно интегрируется в единую
ultralyticsPython . Этот пакет предоставляет единый API для всех задач, что означает переход от Обнаружение в Сегментация экземпляров или Оценка позы требует изменения всего одного строкового аргумента.
Эффективность обучения
YOLO11 оптимизированные процедуры обучения, которые часто приводят к более быстрой конвергенции. Такие функции, как мозаичное увеличение, были усовершенствованы, а конструкция без анкеров устраняет этап предварительной обработки эволюции автоанкеров, присутствующий в YOLOv5. Кроме того, обе модели демонстрируют значительно более низкое потребление памяти во время обучения по сравнению с детекторами на основе трансформаторов, такими как RT-DETR, что позволяет использовать более крупные пакеты данных на потребительских графических процессорах.
Обучение с помощью Ultralytics
Обучение YOLO11 с помощью Python невероятно просто. Тот же синтаксис применяется к YOLOv5 ultralytics пакет.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Универсальность
В то время как YOLOv5 поддержку сегментации и классификации на более позднем этапе своего жизненного цикла, YOLO11 разработан с нуля как многозадачный обучающийся алгоритм. Он изначально поддерживает:
- Обнаружение объектов
- Сегментация экземпляров
- Классификация изображений
- Оценка позы
- Oriented Bounding Box (OBB)
Это делает YOLO11 более YOLO11 «швейцарским ножом» для сложных конвейеров компьютерного зрения, где одновременно требуется несколько типов анализа.
Идеальные варианты использования
Когда выбирать YOLOv5
- Устаревшие системы: Если у вас есть существующий производственный конвейер, построенный на основе конкретного формата YOLOv5 или
requirements.txt, продолжение работы с YOLOv5 стабильность. - Особые аппаратные ограничения: на очень старом оборудовании или в определенных реализациях FPGA более простая архитектура YOLOv5 иметь существующие оптимизированные битовые потоки.
- Повторение исследований: для воспроизведения научных работ 2020–2023 годов, в которых YOLOv5 использовался YOLOv5 базового уровня.
Когда следует выбирать YOLO11
- Развертывание Edge AI: превосходное соотношение скорости и точности делает YOLO11 для таких устройств, как NVIDIA или Raspberry Pi, особенно для обработки видео в реальном времени.
- Требования к высокой точности: приложения в медицинской визуализации или обнаружении дефектов, где каждый процентный пункт mAP .
- Многозадачные приложения: проекты, требующие оценки положения (например, спортивная аналитика) или поворота ограничительных рамок (например, аэрофотосъемка), выигрывают от встроенной поддержки YOLO11.
- Обучение по работе с облачными технологиями: использование Ultralytics для оптимизации управления наборами данных и обучения моделей.
Заключение
Как YOLOv5 YOLO11 свидетельством стремления Ultralytics к совершенству в области открытого исходного кода. YOLOv5 остается надежным, проверенным в боях рабочим инструментом. Однако YOLO11 предлагает привлекательный путь обновления благодаря усовершенствованной архитектуре, превосходной точности и более широкой поддержке задач.
Для разработчиков, смотрящих в будущее, выбор очевиден: YOLO11 преимущество в производительности, необходимое для современных приложений. Тем, кто ищет абсолютное превосходство, мы также настоятельно рекомендуем ознакомиться с YOLO26, который представляет собой сквозное обнаружение NMS для еще более простого развертывания.
Другие модели, которые могут вас заинтересовать YOLOv10 для исследования производительности в реальном времени или YOLO для обнаружения открытого словаря.