Перейти к содержанию

YOLOv7 YOLO11: техническое сравнение детекторов реального времени

Эволюция архитектур обнаружения объектов характеризуется быстрым прогрессом в области скорости, точности и простоты внедрения. В данном руководстве представлено подробное техническое сравнение между YOLOv7, современной модели 2022 года, и YOLO11, передовой версии от Ultralytics 2024 Ultralytics . Мы анализируем их архитектурные различия, показатели производительности и пригодность для современных приложений компьютерного зрения.

Краткое изложение

В то время как YOLOv7 значительные архитектурные улучшения, такие как E-ELAN, YOLO11 представляет собой поколенческий скачок в области удобства использования, поддержки экосистемы и эффективности. YOLO11 превосходную производительность на современном оборудовании, значительно упрощает рабочие процессы обучения и YOLO11 встроенную поддержку более широкого спектра задач, выходящих за рамки простого обнаружения.

ФункциональностьYOLOv7YOLO11
АрхитектураE-ELAN, на основе конкатенацииC3k2, SPPF, оптимизирован для GPU
ЗадачиОбнаружение, поза, сегментация (ограниченно)Обнаружение, Сегментация, Классификация, Определение позы, OBB, Отслеживание
Простота использованияВысокая сложность (несколько сценариев)Оптимизированный (унифицированный Python )
ЭкосистемаРассеянный (направление исследований)Интегрированный (Ultralytics )
РазвертываниеТребуются скрипты для ручного экспортаЭкспорт в более чем 10 форматов в одну строку

Подробный анализ

YOLOv7: архитектура «Bag-of-Freebies»

Выпущенная в июле 2022 года, YOLOv7 разработана с целью расширить границы обнаружения объектов в реальном времени за счет оптимизации процесса обучения без увеличения затрат на вывод — концепция, известная как «bag-of-freebies».

Основные технические особенности:

  • E-ELAN (Extended Efficient Layer Aggregation Network): эта архитектура позволяет сети изучать более разнообразные особенности путем контроля самых коротких и самых длинных путей градиента, улучшая конвергенцию.
  • Масштабирование модели: YOLOv7 методы комбинированного масштабирования, которые одновременно изменяют глубину и ширину для различных ограничений ресурсов.
  • Вспомогательная головка: она использует механизм назначения меток «от грубого к тонкому», в котором вспомогательная головка помогает контролировать процесс обучения в более глубоких слоях.

Детали YOLOv7:

Узнайте больше о YOLOv7

YOLO11: Повышенная эффективность и универсальность

YOLO11 на Ultralytics , которые заключаются в приоритете удобства разработчиков наряду с высокой производительностью. В нем внедрены усовершенствования архитектуры, которые снижают вычислительные накладные расходы при сохранении высокой точности, что делает его исключительно быстрым как на периферийных устройствах, так и на облачных графических процессорах.

Основные технические особенности:

  • Блок C3k2: усовершенствованная версия узкого места CSP (Cross Stage Partial), использовавшегося в предыдущих версиях, обеспечивающая более качественную экстракцию признаков с меньшим количеством параметров.
  • Улучшенный SPPF: слой Spatial Pyramid Pooling - Fast оптимизирован для более эффективного захвата многомасштабного контекста.
  • Универсальность задач: в отличие от YOLOv7, который в основном представляет собой модель обнаружения с некоторыми возможностями определения позы, YOLO11 с самого начала YOLO11 разработан для обработки сегментации экземпляров, оценки позы, ориентированных ограничивающих прямоугольников (OBB) и классификации.
  • Оптимизированное обучение: YOLO11 передовые стратегии увеличения объема данных и усовершенствованные функции потерь, которые стабилизируют обучение, требуя от пользователя меньшей настройки гиперпараметров.

YOLO11 :

Узнайте больше о YOLO11

Сравнение производительности

При сравнении этих моделей очень важно учитывать компромисс между скоростью (задержкой) и точностью (mAP). YOLO11 обеспечивает лучший баланс, предлагая высокую точность при значительно более низких вычислительных требованиях (FLOP) и более высокой скорости вывода на современных графических процессорах, таких как NVIDIA .

Эффективность имеет значение

YOLO11 сопоставимой или даже лучшей точности, чем более старые модели с меньшим количеством параметров. Эта «эффективность параметров» напрямую приводит к снижению потребления памяти во время обучения и более быстрому выполнению на периферийных устройствах, таких как NVIDIA Orin Nano.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Как показано в таблице, YOLO11x превосходит YOLOv7 по точности (54,7% против 53,1%), сохраняя при этом сопоставимую скорость GPU . Что еще более важно, меньшие варианты YOLO11 n/s/m) предлагают невероятные преимущества в скорости для приложений, где критически важна обработка в реальном времени, таких как видеоаналитика.

Экосистема и простота использования

Наиболее значительным фактором, отличающим разработчиков, является экосистема, окружающая модель. Именно в этом Ultralytics превосходит Ultralytics .

Преимущество Ultralytics

YOLO11 интегрирован в ultralytics Python , предоставляющий единый интерфейс для всего жизненного цикла машинного обучения.

  • Простой API: вы можете загрузить, обучить и проверить модель с помощью всего нескольких строк Python .
  • Хорошо поддерживаемая экосистема: Ultralytics обеспечивает активную поддержку, частые обновления и беспроблемную интеграцию с такими инструментами, как Ultralytics для управления данными.
  • Гибкость развертывания: для экспорта YOLO11 ONNX, TensorRT, CoreML или TFLite всего одна команда. В отличие от этого, YOLOv7 требует сложных сторонних репозиториев или ручной настройки скриптов для разных форматов экспорта.

Сравнение кодов:

Обучение YOLO11:

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")

# Train on COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Обучение YOLOv7: Обычно требует клонирования репозитория, установки определенных зависимостей и запуска длинных аргументов командной строки:

python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'

Реальные примеры использования

Когда выбирать YOLOv7

  • Сравнительный анализ устаревших технологий: если вы проводите академические исследования и вам необходимо сравнить новые архитектуры с передовыми стандартами 2022 года.
  • Конкретные пользовательские реализации: если у вас есть существующий конвейер, сильно настроенный под конкретные tensor YOLOv7 , и вы не можете позволить себе его рефакторинг.

Когда следует выбирать YOLO11

  • Производственное внедрение: для коммерческого применения в розничной торговле, сфере безопасности или производстве, где надежность и простота обслуживания имеют первостепенное значение.
  • Edge Computing: Эффективность YOLO11n и YOLO11s делает их идеальными для работы на Raspberry Pi или мобильных устройствах с ограниченной мощностью.
  • Многозадачные приложения: если ваш проект требует одновременного обнаружения объектов, их сегментирования и оценки их положения, YOLO11 этой задачей без дополнительных усилий.

Передовые технологии: YOLO26

Хотя YOLO11 отличным выбором для большинства приложений, Ultralytics внедрять инновации. Недавно выпущенный YOLO26 (январь 2026 г.) еще больше расширяет границы возможного.

  • Полная NMS: YOLO26 устраняет немаксимальное подавление (NMS), что приводит к упрощению процессов развертывания и снижению задержки.
  • Оптимизация полей: благодаря устранению распределенного фокального убытка (DFL) YOLO26 обеспечивает ускорение CPU до 43%, что делает его лучшим выбором для полей искусственного интеллекта.
  • Оптимизатор MuSGD: Вдохновленный обучением LLM, этот гибридный оптимизатор обеспечивает стабильную сходимость.

Разработчикам, которые сегодня приступают к новому высокопроизводительному проекту, настоятельно рекомендуется изучить YOLO26.

Узнайте больше о YOLO26

Заключение

YOLOv7 YOLO11 важными вехами в истории компьютерного зрения. YOLOv7 мощные архитектурные концепции, которые продвинули эту область вперед. Однако YOLO11 усовершенствовал эти идеи, превратив их в более практичный, быстрый и удобный для пользователя пакет.

Для подавляющего большинства пользователей — от исследователей до инженеров предприятий —YOLO11 или более новая версия YOLO26) предлагает оптимальное сочетание точности, скорости и удобства для разработчиков, подкрепленное надежной Ultralytics .

Другие модели для изучения

  • YOLO26: новейшая модель NMS для максимальной скорости и точности.
  • YOLOv10: пионер в области обучения NMS для обнаружения в реальном времени.
  • RT-DETR: детектор на основе трансформатора для сценариев с высокой точностью.
  • SAM : Модель Meta Segment Anything для сегментации без обучения.

Комментарии