YOLOv7 против YOLO11: подробное техническое сравнение

Ландшафт компьютерного зрения быстро меняется в последние несколько лет. Для разработчиков и исследователей, выбирающих подходящий фреймворк для обнаружения объектов, критически важно понимать архитектурные и практические различия между знаковыми моделями разных поколений. Это руководство содержит детальное техническое сравнение академического прорыва YOLOv7 и высокооптимизированной, готовой к промышленному внедрению Ultralytics YOLO11.

Происхождение моделей и архитектурные концепции

YOLOv7, выпущенная 6 июля 2022 года авторами Чиен-Яо Ваном, Алексеем Бочковским и Хонг-Юань Марком Ляо из Института информационных наук Academia Sinica, представила в этой области несколько новых концепций. Модель, подробно описанная в их исследовательской статье о YOLOv7, опубликованной на arXiv, делает основной упор на подход «обучаемого набора бесплатных инструментов» (trainable bag-of-freebies) и сети расширенного эффективного агрегирования слоев (E-ELAN). Эти архитектурные решения были специально разработаны для максимального повышения эффективности градиентных путей, что делает её мощным инструментом для академического бенчмаркинга на высокопроизводительных GPU.

Узнай больше о YOLOv7

YOLO11, разработанная Гленном Джочером и Цзин Цю в Ultralytics, была выпущена 27 сентября 2024 года. YOLO11 смещает акцент с чистой архитектурной сложности на целостную экосистему, ориентированную на разработчика. Хостясь в репозитории Ultralytics на GitHub, YOLO11 предлагает оптимизированный анкор-фри (безакорный) дизайн, который значительно снижает потребление памяти как во время обучения, так и во время инференса. Она нативно интегрирована в платформу Ultralytics, предлагая непревзойденную простоту использования — от разметки датасетов до развертывания на периферийных устройствах.

Узнай больше о YOLO11

Преимущества экосистемы

В то время как отдельные репозитории часто становятся заброшенными после публикации академической статьи, модели Ultralytics получают постоянные обновления, что обеспечивает долгосрочную совместимость с современными стеками машинного обучения, такими как последние релизы PyTorch и специализированные аппаратные ускорители.

Метрики производительности и эффективность

При развертывании моделей в реальных приложениях необходимо балансировать между «сырой» точностью, скоростью инференса и вычислительными затратами. Ниже представлено прямое сравнение вариантов YOLOv7 и YOLO11, протестированных на стандартных бенчмарках датасета COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Примечание: Отсутствие показателей скорости CPU для YOLOv7 указывает на устаревшие среды тестирования, в которых не были стандартизированы бенчмарки ONNX CPU. Лучшие значения в сопоставимых категориях выделены.

Анализ результатов

Данные иллюстрируют явную эволюцию в эффективности. Модель YOLO11l (Large) достигает превосходного показателя mAPval в 53,4% по сравнению с 51,4% у YOLOv7l, при этом используя значительно меньше параметров (25,3 млн против 36,9 млн) и радикально меньше FLOPs (86,9 млрд против 104,7 млрд). Такое снижение вычислительной сложности позволяет YOLO11 работать быстрее на реализациях NVIDIA TensorRT и требует меньше VRAM, что делает её гораздо более подходящей для сред с ограниченными аппаратными ресурсами.

Удобство использования и рабочие процессы обучения

Основная точка расхождения между этими двумя фреймворками — это опыт разработчика.

Обучение YOLOv7

Использование оригинальной кодовой базы YOLOv7 с открытым исходным кодом часто требует клонирования репозитория, ручного разрешения зависимостей и использования громоздких аргументов командной строки. Управление различными задачами или экспорт в мобильные форматы часто подразумевает модификацию исходных скриптов или использование сторонних форков.

Обучение YOLO11

YOLO11 глубоко интегрирована в Python-пакет ultralytics, что упрощает жизненный цикл машинного обучения. Обучение модели обнаружения объектов занимает всего несколько строк кода, а фреймворк нативно обрабатывает скачивание данных, настройку гиперпараметров и кэширование.

from ultralytics import YOLO

# Load a pretrained YOLO11 Nano model for maximum speed
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX format for deployment
export_path = model.export(format="onnx")

Более того, YOLO11 обладает невероятной универсальностью. Просто меняя суффикс модели, ты можешь мгновенно перейти от обнаружения к сегментации экземпляров, отслеживанию поз или распознаванию ориентированных ограничивающих рамок (OBB) — такой уровень нативной поддержки мультизадачности отсутствует в YOLOv7.

Упрощенный экспорт

Экспорт YOLO11 в форматы для периферийных устройств, такие как Apple CoreML или фреймворки Intel OpenVINO, требует всего одной команды .export(), позволяя избежать сложных манипуляций с графами, часто необходимых для моделей предыдущего поколения.

Идеальные сценарии развертывания

Понимание сильных сторон каждой модели помогает определить оптимальные сценарии их использования.

Взгляд в будущее: парадигмальный сдвиг YOLO26

Хотя YOLO11 представляет собой высокоотточенное современное решение, область машинного обучения продвигается неумолимо. Пользователям, которые начинают совершенно новые проекты в области зрения сегодня, настоятельно рекомендуется изучить недавно выпущенную Ultralytics YOLO26.

Выпущенная в январе 2026 года, YOLO26 представляет несколько революционных функций, которые превосходят как YOLOv7, так и YOLO11:

  • Нативно архитектура без NMS: YOLO26 исключает необходимость постобработки методом подавления немаксимумов (Non-Maximum Suppression). Этот дизайн типа end-to-end упрощает конвейеры развертывания и радикально снижает вариативность задержек.
  • До 43% быстрее инференс на CPU: Благодаря стратегическому удалению модуля Distribution Focal Loss (DFL), YOLO26 сильно оптимизирована для периферийных устройств и сред без выделенных GPU.
  • Интеграция оптимизатора MuSGD: Этот гибридный оптимизатор, вдохновленный передовыми методами обучения LLM от Moonshot AI, обеспечивает беспрецедентную стабильность обучения и более быструю сходимость.
  • Превосходное обнаружение мелких объектов: Внедрение функций потерь ProgLoss и STAL обеспечивает критический прирост точности для идентификации мельчайших деталей, что идеально подходит для анализа аэроснимков с дронов и сложных данных с IoT-датчиков.

Узнай больше о YOLO26

Для пользователей, интересующихся архитектурами на базе трансформеров или альтернативными парадигмами, документация Ultralytics также охватывает такие модели, как трансформерный детектор RT-DETR и модель с открытым словарем YOLO-World.

Комментарии