Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv8 против YOLOv7#

Область компьютерного зрения постоянно развивается, и новые архитектуры расширяют границы возможного в обнаружении объектов в реальном времени. В этом глубоком обзоре мы сравним две крайне влиятельные модели: Ultralytics YOLOv8 и YOLOv7. Обе модели оказали значительное влияние на сообщество разработчиков и академические исследования, предлагая уникальные подходы к решению сложных задач компьютерного зрения.

Понимание структурных и методологических различий между этими двумя моделями критически важно для инженеров машинного обучения, стремящихся оптимизировать свои конвейеры развертывания. В то время как YOLOv7 представила мощный подход «bag-of-freebies», адаптированный для высокой пропускной способности, Ultralytics YOLOv8 сосредоточилась на создании целостной, простой в использовании экосистемы, которая балансирует высокую точность с низким потреблением памяти и универсальностью для решения множества задач.

Link to this sectionUltralytics YOLOv8: Универсальный стандарт экосистемы#

Выпущенная Ultralytics в начале 2023 года, YOLOv8 представляет собой серьезный архитектурный сдвиг по сравнению со своими предшественниками. Она была разработана с нуля, чтобы стать чем-то большим, чем просто детектором объектов в реальном времени; это единый фреймворк, способный «из коробки» справляться с широким спектром задач компьютерного зрения.

Link to this sectionАрхитектурные инновации#

В YOLOv8 представлена инновационная anchor-free (безякорная) голова детекции. Это фундаментально упрощает процесс обучения, устраняя необходимость вручную настраивать anchor boxes на основе конкретного распределения твоего собственного набора данных. Такой выбор дизайна делает модель очень надежной и более простой в адаптации для разных сред.

Кроме того, архитектура оснащена модулем C2f (Cross-Stage Partial bottleneck с двумя свертками) — структурным обновлением, которое улучшает градиентный поток и позволяет нейронной сети изучать более богатые представления признаков без резкого увеличения вычислительных затрат. Это делает модель высокоэффективной при выполнении инференса через стандартные фреймворки глубокого обучения, такие как PyTorch.

Узнай больше о YOLOv8

Эффективность памяти

Модели Ultralytics YOLO спроектированы для максимальной эффективности обучения. Обычно они требуют значительно меньше памяти CUDA во время тренировки по сравнению с архитектурами на базе Transformer или более тяжелыми CNN. Это позволяет тебе тренироваться с большими размерами батчей на потребительском оборудовании, ускоряя твой цикл разработки.

Link to this sectionYOLOv7: подход «Bag-of-Freebies»#

YOLOv7 была представлена в середине 2022 года и быстро стала популярным эталоном в академических кругах. Она была сильно сфокусирована на архитектурной репараметризации и оптимизации градиентного пути для расширения пределов обнаружения объектов в реальном времени на мощных GPU.

  • Авторы: Chien-Yao Wang, Alexey Bochkovskiy и Hong-Yuan Mark Liao
  • Организация: Институт информатики, Academia Sinica, Тайвань
  • Дата: 2022-07-06
  • Arxiv: 2207.02696
  • GitHub: WongKinYiu/yolov7

Link to this sectionАрхитектурные инновации#

YOLOv7 использует Extended Efficient Layer Aggregation Network (E-ELAN), которая позволяет модели постоянно изучать более разнообразные признаки. Она в значительной степени опирается на якорную парадигму и представляет обучаемый «bag-of-freebies» — набор методов оптимизации, которые повышают точность без увеличения стоимости инференса.

Хотя YOLOv7 демонстрирует отличные результаты на стандартных академических бенчмарках, таких как набор данных MS COCO, ее архитектура сильно оптимизирована для серверных ускорителей. Экспорт и развертывание этих моделей на периферийных устройствах иногда могут потребовать больше ручной настройки по сравнению с более современными, оптимизированными фреймворками.

Узнай больше о YOLOv7

Link to this sectionДетальное сравнение производительности#

При оценке этих моделей основным фактором является компромисс между скоростью, точностью и размером модели. В таблице ниже представлены показатели обеих моделей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Как видно из данных, YOLOv8x достигает наивысшей абсолютной точности (53.9 mAP), в то время как нано-вариант (YOLOv8n) обеспечивает исключительную скорость инференса и невероятно малый вес. Такое разнообразие делает YOLOv8 гораздо более адаптируемой к аппаратным средам с ограничениями.

Link to this sectionПреимущество Ultralytics: простота использования и экосистема#

В то время как YOLOv7 предоставляет хорошие «сырые» метрики обнаружения, Ultralytics YOLOv8 значительно превосходит ее с точки зрения опыта разработчика, интеграции в экосистему и возможностей многозадачности.

Link to this sectionНепревзойденная универсальность#

YOLOv7 — это прежде всего модель для детекции, с экспериментальными ветками для других задач. В отличие от нее, YOLOv8 нативно поддерживает детекцию объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB). Такой унифицированный подход означает, что твоя команда может изучить один API и использовать его для решения совершенно разных проектных задач.

Link to this sectionОптимизированное развертывание и интеграции#

Экспорт модели для продакшена часто может стать «узким местом». Пакет Ultralytics позволяет разработчикам экспортировать модели в такие форматы, как ONNX, TensorRT и CoreML, одной строкой кода на Python. Это позволяет избежать проблем с поддержкой операторов, которые иногда возникают при экспорте сложных якорных графов.

Более того, YOLOv8 легко интегрируется с инструментами MLOps. Отслеживаешь ли ты эксперименты с помощью Weights & Biases или тестируешь развертывание в Hugging Face Spaces, экосистема Ultralytics берет на себя всю тяжелую работу.

Link to this sectionПример кода: обучение и экспорт YOLOv8#

Следующий код демонстрирует простоту Python API от Ultralytics. Ты можешь пройти путь от инициализации модели до обучения и экспорта для развертывания на периферийных устройствах менее чем за десять строк кода.

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model for fast inference
model = YOLO("yolov8n.pt")

# Train the model on the COCO8 dataset
# The API handles data loading, augmentation, and logging automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the trained model to ONNX format for deployment
model.export(format="onnx")
Гибкость развертывания

Использование функции model.export() обеспечивает мгновенный мост к высокопроизводительным движкам инференса, позволяя тебе легко интегрировать YOLOv8 в мобильные приложения, встроенные системы или высоконагруженные облачные серверы.

Link to this sectionРеальные сценарии использования#

Архитектурные различия между двумя моделями диктуют их идеальные сценарии развертывания.

Когда выбирать YOLOv8:

  • Edge AI и IoT устройства: Наличие сверхбыстрых моделей Nano и Small делает YOLOv8 идеальной для оборудования с ограниченными вычислительными ресурсами, такого как умные камеры или дроны.
  • Многозадачные проекты: Если твоему конвейеру требуется отслеживание суставов человека (оценка позы) с одновременным картографированием препятствий (сегментация), YOLOv8 справляется с этим нативно.
  • От быстрого прототипирования к продакшену: Обширная документация Ultralytics и удобный Python API позволяют командам быстрее выводить продукты на рынок.

Когда рассматривать YOLOv7:

  • Академическое бенчмаркирование: Исследователи, изучающие эффекты методов репараметризации, часто используют YOLOv7 в качестве стандартного эталона, что отражено в ее популярности на Papers With Code.
  • Устаревшие серверные конвейеры: Если существующий конвейер с тяжелыми вычислениями уже строго оптимизирован под конкретные якорные выходы YOLOv7, поддержание его в краткосрочной перспективе может быть оправданным.

Link to this sectionВзгляд в будущее: новое поколение#

Хотя YOLOv8 остается универсальной мощной системой, ландшафт ИИ стремительно меняется. Командам, начинающим новые проекты, мы настоятельно рекомендуем изучить последние достижения в линейке Ultralytics.

Новейшее поколение, YOLO26, представляет собой вершину современных технологий компьютерного зрения. В ней реализован End-to-End NMS-Free Design, устраняющий постобработку Non-Maximum Suppression для более простого и быстрого развертывания. Благодаря удалению Distribution Focal Loss (DFL) и внедрению оптимизатора MuSGD, вдохновленного LLM, YOLO26 предлагает более стабильное обучение и до 43% более быстрый инференс на CPU. Ее передовые функции потерь ProgLoss + STAL значительно улучшают распознавание мелких объектов, делая ее лучшим выбором для современного периферийного вычисления и аэрофотосъемки.

Для пользователей, переходящих с более старых систем, высокопроизводительная YOLO11 и классическая YOLOv5 также остаются полностью поддерживаемыми в рамках единой экосистемы Ultralytics, гарантируя, что независимо от твоих аппаратных ограничений, у тебя есть оптимизированная высокопроизводительная модель, готовая к развертыванию.

Контрибьюторы

Комментарии