Перейти к содержанию

YOLOv10 YOLOv7: подробное исследование эволюции архитектуры

За последние несколько лет ситуация в области обнаружения объектов кардинально изменилась, и семейство YOLO You Only Look Once) неизменно лидирует по производительности в режиме реального времени. Двумя важными вехами в этой линейке являются YOLOv10, выпущенная в мае 2024 года, и YOLOv7, установившая стандарт в середине 2022 года. Хотя обе модели направлены на максимальное соотношение скорости и точности, для достижения этой цели они используют принципиально разные стратегии.

Это руководство содержит всестороннее техническое сравнение, которое поможет разработчикам, исследователям и инженерам выбрать подходящую архитектуру для своих приложений компьютерного зрения. Мы анализируем их архитектуры, показатели производительности и рабочие процессы развертывания, подчеркивая, почему современные итерации, поддерживаемые Ultralytics , включая YOLO11 и революционная YOLO26— предлагают наиболее надежный путь для производства ИИ.

YOLOv10: Революция без NMS

YOLOv10 представляет собой сдвиг парадигмы в области обнаружения в реальном времени за счет внедрения встроенной возможности сквозного обучения. В отличие от предыдущих версий, которые полагались на эвристическую постобработку, YOLOv10 необходимость в немаксимальном подавлении (NMS), что значительно сокращает задержку вывода и упрощает процесс развертывания.

Основные технические характеристики

YOLOv10 своей производительности благодаря стратегии Consistent Dual Assignments, которая сочетает в себе присвоение меток «один ко многим» для обеспечения полного контроля во время обучения с сопоставлением «один к одному» для эффективного вывода. Это позволяет модели пользоваться высокой точностью традиционных YOLO без вычислительной нагрузки NMS прогнозирования. Кроме того, в ней используется целостный дизайн, ориентированный на эффективность и точность, который оптимизирует различные компоненты, такие как магистраль и головка обнаружения, для уменьшения количества параметров и FLOP (операций с плавающей запятой в секунду).

Узнайте больше о YOLOv10

Идеальные варианты использования

  • Высокочастотная торговля и спортивная аналитика: там, где важна каждая миллисекунда задержки, конструкция NMS обеспечивает решающее преимущество в скорости.
  • Встроенные системы: благодаря сниженным накладным расходам подходит для устройств с ограниченными вычислительными ресурсами, таких как Raspberry Pi или модули NVIDIA .
  • Сложные сцены с большим количеством людей: удаление NMS избежать распространенной проблемы подавления действительных перекрывающихся обнаружений в плотных средах.

Предупреждение: Эффективность архитектур NMS

Удаление не максимального подавления (NMS) не только ускоряет вывод. Оно делает модель дифференцируемой от начала до конца, что потенциально позволяет улучшить оптимизацию во время обучения. Однако это также означает, что модель должна научиться подавлять дубликаты ячеек внутри, что требует сложных стратегий назначения, таких как те, что используются в YOLOv10 YOLO26.

YOLOv7: Мощность "Bag-of-Freebies"

Выпущен в июле 2022 года, YOLOv7 стал огромным шагом вперед, представив концепцию «обучаемого набора бесплатных элементов». Этот подход был направлен на оптимизацию процесса обучения и архитектуры для повышения точности без увеличения затрат на вывод.

Основные технические характеристики

YOLOv7 расширенную сеть эффективной агрегации слоев (E-ELAN), которая позволяет сети обучаться более разнообразным функциям за счет контроля длины градиентного пути. Она эффективно использует такие методы, как перепараметризация модели (RepConv), для объединения сложных модулей времени обучения в простые структуры времени вывода. Несмотря на высокую эффективность, YOLOv7 детектором на основе якорей, требующим NMS, что может быть узким местом в сценариях с ультранизкой задержкой по сравнению с более новыми моделями без якорей или сквозными моделями.

Узнайте больше о YOLOv7

Идеальные варианты использования

  • Общее назначение: отлично подходит для стандартных задач, где крайняя оптимизация не является критичной, но надежность имеет ключевое значение.
  • Исследовательские базовые показатели: остается популярным эталоном для научных работ, в которых сравниваются архитектурные усовершенствования.
  • Устаревшие развертывания: для систем, уже построенных на Darknet или более старых PyTorch , переход на YOLOv7 может оказаться YOLOv7 , чем переход на совершенно новую парадигму.

Сравнение производительности

При сравнении этих двух гигантов становятся очевидными компромиссы. YOLOv10 предлагает более высокую эффективность параметров и меньшую задержку благодаря удалению NMS, в то время как YOLOv7 надежную точность, которая определяла передовые технологии своего времени.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Анализ метрик

  • Точность против размера: YOLOv10 сопоставимых или лучших результатов mAP (средняя точность) со значительно меньшим количеством параметров. Например, YOLOv10L превосходит YOLOv7L по точности, имея примерно на 20% меньше параметров.
  • Скорость вывода: конструкция YOLOv10 NMS YOLOv10 ускорить постобработку, которая часто является скрытым препятствием в реальных конвейерах.
  • Эффективность использования памяти: Ultralytics , включая YOLOv10 , обычно требуют меньше CUDA во время обучения по сравнению со старыми реализациями или архитектурами с интенсивным использованием трансформаторов, такими как RT-DETR.

Преимущество Ultralytics

Одной из наиболее веских причин для использования этих моделей через Ultralytics является их беспроблемная интеграция и поддержка. Независимо от того, используете ли вы YOLOv7, YOLOv10 или новейшую версию YOLO26, опыт работы будет одинаковым.

  • Простота использования: простой Python позволяет разработчикам обучать, проверять и развертывать модели с минимальным количеством кода. Вы можете переключаться между YOLOv10 YOLOv7 одну строку в своем скрипте.
  • Ultralytics : Пользователи могут использовать Ultralytics для управления наборами данных, визуализации процессов обучения и экспорта моделей в один клик в такие форматы, как ONNX и TensorRT.
  • Универсальность: экосистема поддерживает широкий спектр задач, выходящих за рамки простого обнаружения, включая сегментацию экземпляров, оценку позы и OBB (ориентированная ограничивающая рамка), что гарантирует развитие вашего проекта по мере изменения требований.
  • Эффективность обучения: Ultralytics обеспечивает более быструю конвергенцию моделей, что позволяет сэкономить ценное GPU и снизить затраты на электроэнергию.
from ultralytics import YOLO

# Load a pretrained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with just one line
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for deployment
model.export(format="onnx")

Будущее: почему YOLO26 — лучший выбор

Хотя YOLOv7 YOLOv10 отличными моделями, в этой области все быстро меняется. Для разработчиков, начинающих новые проекты в 2026 году, рекомендуется выбрать YOLO26.

Выпущенная в январе 2026 года, YOLO26 основана на прорывной технологии YOLOv10 , NMS, YOLOv10 усовершенствована для еще большей скорости и стабильности.

  • Сквозной дизайн NMS: как и YOLOv10, YOLO26 изначально является сквозным, но с улучшенными функциями потери, которые стабилизируют обучение.
  • Ускорение CPU до 43%: благодаря удалению Distribution Focal Loss (DFL) и оптимизации архитектуры YOLO26 специально настроен для пограничных вычислений и устройств без мощных графических процессоров.
  • MuSGD Optimizer: гибрид SGD Muon, этот оптимизатор привносит инновации из области обучения LLM в компьютерное зрение, обеспечивая более быструю конвергенцию.
  • ProgLoss + STAL: усовершенствованные функции потери обеспечивают заметные улучшения в распознавании мелких объектов, что является важной функцией для таких отраслей, как сельское хозяйство и аэрофотосъемка.

Для тех, кто хочет обеспечить будущее своих приложений, переход на YOLO26 предлагает оптимальный баланс между передовыми исследованиями и практической, готовой к производству надежностью.

Заключение

Оба YOLOv10 и YOLOv7 закрепили свои места в истории компьютерного зрения. YOLOv7 надежным и проверенным выбором для общего обнаружения, а YOLOv10 представление об эффективности сквозных архитектур. Однако для достижения максимальной производительности, простоты использования и долгосрочной поддержки Ultralytics является лучшим вариантом для современной разработки искусственного интеллекта.

Дополнительная литература


Комментарии