Перейти к содержанию

YOLO11 YOLOv7: техническое сравнение архитектуры и производительности

По мере ускорения развития области компьютерного зрения выбор правильной архитектуры обнаружения объектов становится критически важным для успеха. Двумя основными конкурентами в YOLO являются YOLO11, разработанная Ultralytics, и YOLOv7, исследовательская модель от Academia Sinica. Хотя обе модели внесли значительный вклад в развитие современных технологий, они удовлетворяют разные потребности в отношении скорости, гибкости и простоты внедрения.

В этом руководстве представлен подробный технический анализ их архитектуры, показателей производительности и идеальных вариантов использования, чтобы помочь разработчикам и исследователям выбрать лучший инструмент для своих проектов.

Обзор модели и истоки

Понимание происхождения этих моделей позволяет понять контекст архитектурных решений, лежащих в их основе.

YOLO11

Выпущено в сентябре 2024 года компанией Ultralytics, YOLO11 усовершенствование философии компании, ориентированной на производство. Он был разработан для максимальной эффективности на современном оборудовании, обеспечивая баланс между высокой пропускной способностью и конкурентоспособной точностью.

  • Авторы: Гленн Джочер и Цзин Цю
  • Организация:Ultralytics
  • Дата: сентябрь 2024 г.
  • Основные преимущества: простота использования в режиме реального времени, широкая поддержка задач (обнаружение, сегментация, поза, OBB, классификация) и оптимизированное развертывание через Ultralytics .

Узнайте больше о YOLO11

YOLOv7

Выпущенная в июле 2022 года, YOLOv7 важной вехой в научной деятельности команды, стоящей за YOLOv4. В ней было представлено несколько «бесплатных бонусов» для повышения точности без увеличения затрат на вывод, с упором на оптимизацию обучаемой архитектуры.

  • Авторы: Чен-Яо Ванг, Алексей Бочковский и Хонг-Юань Марк Ляо
  • Организация: Институт информатики, Academia Sinica
  • Дата: Июль 2022
  • Основные направления: анализ градиентного пути, перепараметризация модели и динамическое присвоение меток.

Узнайте больше о YOLOv7

Анализ производительности

При сравнении этих архитектур важнейшую роль играют такие показатели, как средняя точность (mAP) и задержка вывода. В таблице ниже показано, как новые инженерные решения в YOLO11 к повышению эффективности по сравнению со старой YOLOv7 .

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Основные выводы

  • Эффективность: модель YOLO11m достигает немного более высокой точности (51,5% mAP) по сравнению со стандартной YOLOv7 51,4%), при этом используя примерно на 45% меньше параметров (20,1 млн против 36,9 млн) и значительно меньше FLOP.
  • Скорость: на графических процессорах T4 YOLO11 стабильно превосходят свои YOLOv7 по задержке вывода, что является критически важным фактором для приложений реального времени, таких как автономное вождение или видеоаналитика.
  • Масштабируемость: YOLO11 более широкий диапазон масштабов моделей (от Nano до X-Large), что упрощает развертывание на аппаратном обеспечении с ограниченными ресурсами, таком как Raspberry Pi или мобильные устройства.

Архитектурные различия

Ultralytics YOLO11

YOLO11 на концепции магистральной сети CSPNet (Cross-Stage Partial Network), но усовершенствует блочную структуру для лучшего градиентного потока и извлечения признаков.

  • Усовершенствованная основа: использует улучшенный блок C3k2 (более быстрая реализация узких мест CSP), который улучшает повторное использование функций и одновременно сокращает вычисления.
  • Обнаружение без анкоров: Как и его непосредственные предшественники, YOLO11 головку без анкоров, упрощая процесс обучения за счет устранения необходимости в ручной кластеризации анкорных рамок.
  • Многозадачные головки: архитектура изначально разработана для поддержки нескольких задач с использованием унифицированной структуры головки, что позволяет плавно переключаться между обнаружением объектов, сегментацией экземпляров и оценкой позы.

YOLOv7

YOLOv7 «Extended-ELAN» (E-ELAN) для эффективного управления самыми короткими и самыми длинными градиентными путями.

  • E-ELAN: вычислительный блок, разработанный для того, чтобы сеть могла обучаться более разнообразным особенностям без разрушения градиентного пути.
  • Перепараметризация модели: использует методы перепараметризации (RepConv) для объединения отдельных слоев свертки в один слой во время вывода, что повышает скорость без потери точности обучения.
  • Вспомогательная головка от грубой до тонкой: вводит вспомогательную головку для контроля обучения, которая помогает глубокому контролю модели, но добавляет сложность к процессу обучения.

Эволюция до YOLO26

Хотя YOLO11 значительные улучшения, новейшая версия YOLO26 еще больше расширяет границы возможного. Выпущенная в январе 2026 года, YOLO26 отличается сквозной конструкцией NMS, что устраняет необходимость в постобработке и ускоряет CPU до 43%. В ней также используется оптимизатор MuSGD, вдохновленный обучением LLM, для более быстрой конвергенции.

Обучение и простота использования

Для разработчиков «пользовательский опыт» модели — то, насколько легко ее обучать, проверять и внедрять — часто так же важен, как и исходные метрики.

Преимущество экосистемы Ultralytics

YOLO11 полностью интегрирован в Python Ultralytics Python , предлагая рабочий процесс «от нуля до героя».

  1. Единый API: Вы можете переключаться между YOLO11, YOLOv8или YOLO26, изменив одну строку.
  2. Эффективность использования памяти: Ultralytics оптимизированы для использования меньшего CUDA во время обучения по сравнению со многими исследовательскими репозиториями. Это позволяет использовать более крупные пакеты данных на потребительских графических процессорах.
  3. Экспорт в один клик: экспорт в такие форматы, как ONNX, TensorRT, CoreML или TFLite с помощью одной команды.
from ultralytics import YOLO

# Load a YOLO11 model (or YOLO26 for best results)
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for deployment
path = model.export(format="onnx")

YOLOv7

YOLOv7 использует отдельный репозиторий. Несмотря на свою мощность, он часто требует:

  • Ручная настройка .yaml файлы для анкоров (если не используется версия без анкоров).
  • Специальные скрипты «развертывания» для объединения перепараметризованных весов перед экспортом.
  • Более сложные аргументы командной строки для управления вспомогательными головками во время обучения.

Приложения в реальном мире

Когда следует выбирать YOLO11

YOLO11 лучший выбор для коммерческих и промышленных применений, где надежность и простота обслуживания имеют ключевое значение.

  • Edge AI: Наличие моделей «Nano» и «Small» делает YOLO11 для интеллектуальных камер и устройств IoT, контролирующих производственные линии.
  • Многозадачные проекты: если ваше приложение требует отслеживания объектов с одновременной оценкой ключевых точек (например, спортивная аналитика), унифицированная структура YOLO11 упрощает кодовую базу.
  • Быстрое прототипирование: простота использования позволяет командам быстро повторять операции с настраиваемыми наборами данных с помощью Ultralytics , сокращая время вывода продукта на рынок.

Когда выбирать YOLOv7

  • Академический бенчмаркинг: если вы воспроизводите результаты из литературы 2022-2023 годов или изучаете конкретные эффекты архитектур E-ELAN.
  • Устаревшие системы: для систем, уже глубоко интегрированных с конкретной структурой ввода/вывода исходных YOLO в стиле Darknet.

Заключение

В то время как YOLOv7 остается уважаемым вехой в истории обнаружения объектов, YOLO11 предлагает более современное, эффективное и удобное для разработчиков решение. Благодаря превосходному соотношению скорости и точности, более низким требованиям к памяти и поддержке надежной Ultralytics , YOLO11 более четкий путь к внедрению в реальных условиях.

Тем, кто ищет самые передовые технологии, мы рекомендуем ознакомиться с YOLO26, который основан на этих принципах и использует инференцию NMS и оптимизаторы нового поколения.

Дополнительные ресурсы


Комментарии