Перейти к содержанию

YOLOv7 против YOLO26: Эволюция обнаружения объектов в реальном времени

Область компьютерного зрения быстро развивается, и каждое новое поколение моделей расширяет границы возможного в анализе в реальном времени. Это всестороннее сравнение исследует различия между устаревшей YOLOv7 и современной YOLO26, анализируя их архитектуры, метрики производительности и идеальные сценарии развертывания. В то время как YOLOv7 представлял собой важную веху в 2022 году, YOLO26 внедряет прорывные инновации, такие как сквозная обработка и стратегии оптимизации, полученные из обучения больших языковых моделей (LLM).

Обзор модели

YOLOv7

Выпущенный в июле 2022 года, YOLOv7 представил концепцию «обучаемого набора бесплатных приемов» (trainable bag-of-freebies), оптимизируя процесс обучения для повышения точности без увеличения затрат на вывод. Он был сильно сфокусирован на архитектурных реформах, таких как расширенные эффективные сети агрегации слоев (E-ELAN) и методы масштабирования моделей.

Авторы: Чиен-Яо Ван, Алексей Бочковский и Хун-Юань Марк Ляо
Организация:Институт информатики, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv:2207.02696
GitHub:WongKinYiu/yolov7

Ultralytics YOLO26

YOLO26, выпущенный в начале 2026 года, представляет собой смену парадигмы в линейке YOLO. Он разработан для максимальной эффективности на периферийных устройствах и упрощенного развертывания. Ключевые инновации включают нативную сквозную архитектуру без NMS, которая устраняет необходимость в сложной постобработке, и удаление Distribution Focal Loss (DFL) для упрощения экспортируемости.

Авторы: Гленн Джочер и Цзин Цю
Организация:Ultralytics
Дата: 2026-01-14
Документация:Ultralytics YOLO26
GitHub:ultralytics/ultralytics

Узнайте больше о YOLO26

Техническое сравнение

В следующей таблице показан скачок производительности от YOLOv7 к YOLO26. В то время как YOLOv7 установил эталоны в свое время, YOLO26 предлагает превосходную скорость и эффективность, особенно для вывода на CPU.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Анализ производительности

YOLO26l превосходит по точности значительно более тяжелый YOLOv7x (55.0 против 53.1 mAP), используя при этом значительно меньше параметров (24.8M против 71.3M) и FLOPs (86.4B против 189.9B). Эта эффективность делает YOLO26 идеальным для сред с ограниченными ресурсами, где оптимизация модели имеет решающее значение.

Архитектурные различия

Архитектура YOLOv7

Архитектура YOLOv7 основана на E-ELAN (Extended Efficient Layer Aggregation Network), что позволяет сети изучать более разнообразные признаки, контролируя кратчайшие и длиннейшие градиентные пути. Она также использует масштабирование модели для моделей на основе конкатенации, одновременно регулируя глубину и ширину сети. Однако YOLOv7 по-прежнему полагается на детекционные головы на основе якорей и требует Non-Maximum Suppression (NMS) во время постобработки для фильтрации дублирующихся ограничивающих рамок. Этот шаг NMS может стать узким местом при развертывании, часто требуя пользовательской реализации для различных аппаратных бэкендов, таких как TensorRT или CoreML.

Архитектура YOLO26

YOLO26 представляет несколько радикальных изменений, разработанных для упрощения пользовательского опыта и повышения производительности:

  • Сквозной подход без NMS: Приняв нативную сквозную архитектуру (впервые примененную в YOLOv10), YOLO26 устраняет необходимость в NMS. Модель напрямую выдает окончательные detect, значительно сокращая задержку и упрощая конвейеры развертывания.
  • Удаление DFL: Удаление Distribution Focal Loss оптимизирует выходной слой, делая модель более совместимой с периферийными устройствами и форматами с низкой точностью, такими как INT8.
  • Оптимизатор MuSGD: Вдохновленный инновациями в обучении больших языковых моделей (LLM), таких как Kimi K2 от Moonshot AI, YOLO26 использует гибридный оптимизатор MuSGD. Он сочетает в себе импульс SGD с адаптивными свойствами оптимизатора Muon, что приводит к более стабильному обучению и более быстрой сходимости.
  • Оптимизация для малых объектов: Интеграция Progressive Loss Balancing (ProgLoss) и Small-Target-Aware Label Assignment (STAL) напрямую решает общие проблемы при detect малых объектов, делая YOLO26 особенно эффективным для аэрофотоснимков и приложений IoT.

Обучение и удобство использования

Простота использования

Одной из отличительных черт экосистемы Ultralytics является доступность. В то время как YOLOv7 требует клонирования определенного репозитория и управления сложными файлами конфигурации, YOLO26 интегрирован непосредственно в ultralytics пакет python. Это обеспечивает унифицированный API для обучения, валидации и развертывания.

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with a single line of code
results = model.train(data="coco8.yaml", epochs=100)

Универсальность

YOLOv7 в основном ориентирован на обнаружение объектов и оценку позы. В отличие от него, YOLO26 предлагает унифицированную платформу, поддерживающую более широкий спектр задач компьютерного зрения, включая:

  • Сегментация экземпляров: Со специализированными функциями потерь для точной маскировки.
  • Оценка позы: Используя оценку остаточного логарифмического правдоподобия (RLE) для точных ключевых точек.
  • Ориентированные ограничивающие рамки (OBB): Специализированная функция потерь угла для повернутых объектов.
  • Классификация: Для эффективной категоризации изображений.

Эффективность обучения

Процесс обучения YOLO26 высоко оптимизирован. Оптимизатор MuSGD обеспечивает более быструю сходимость, что означает, что пользователи часто могут достигать лучших результатов за меньшее количество эпох по сравнению со старыми оптимизаторами. Кроме того, меньший объем памяти, занимаемый моделями YOLO26, позволяет использовать большие размеры пакетов на том же оборудовании, что еще больше ускоряет цикл обучения. Это значительное преимущество по сравнению с моделями на основе трансформеров, которые обычно требуют значительного объема памяти CUDA.

Приложения в реальном мире

В чем превосходит YOLOv7

YOLOv7 остается мощной моделью для исследователей, интересующихся специфическими архитектурными свойствами сетей ELAN или тех, кто поддерживает устаревшие системы, построенные на архитектуре Darknet-стиля. Она служит отличным эталоном для академических сравнений.

В чем превосходит YOLO26

YOLO26 является рекомендуемым выбором для большинства современных приложений благодаря балансу производительности и простоте развертывания:

  • Периферийные вычисления: Благодаря ускорению инференса на CPU до 43%, YOLO26 идеально подходит для работы на Raspberry Pi, мобильных устройствах или локальных серверах без выделенных GPU.
  • Робототехника и автономные системы: Сквозная архитектура снижает изменчивость задержки, что критически важно для принятия решений в реальном времени в робототехнике. Улучшенное обнаружение малых объектов (с помощью STAL) помогает в навигации и избегании препятствий.
  • Коммерческое развертывание: Удаление NMS и DFL упрощает процесс экспорта в такие форматы, как ONNX, TensorRT и CoreML, обеспечивая согласованное поведение в различных средах развертывания.
  • Мониторинг сельского хозяйства: Высокая точность в обнаружении малых объектов делает YOLO26 отличным решением для таких задач, как идентификация вредителей или подсчет урожая по изображениям с дронов.

Миграция с YOLOv7

Пользователи, переходящие с YOLOv7 на YOLO26, найдут этот переход бесшовным благодаря API Ultralytics. Значительные улучшения в скорости и простоте экспорта обычно оправдывают обновление для производственных систем. Для тех, кто ищет другие современные альтернативы, YOLO11 — еще один надежный вариант, полностью поддерживаемый экосистемой Ultralytics.

Заключение

В то время как YOLOv7 был значительным вкладом в сообщество открытого исходного кода, YOLO26 представляет будущее эффективного компьютерного зрения. Устраняя критические узкие места, такие как NMS, и используя современные методы оптимизации из мира LLM, YOLO26 предлагает модель, которая не только быстрее и легче, но и значительно проще в обучении и развертывании.

Для разработчиков, ищущих надежное, хорошо поддерживаемое и универсальное решение, YOLO26 является превосходным выбором. Его интеграция в экосистему Ultralytics обеспечивает доступ к постоянным обновлениям, обширной документации и процветающему сообществу поддержки.

Узнайте больше о YOLO26


Комментарии