Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 против YOLOv5#

При создании современных конвейеров computer vision выбор правильной архитектуры обнаружения объектов имеет решающее значение для баланса между точностью, скоростью вывода и использованием ресурсов. В этом подробном сравнении мы рассматриваем две очень влиятельные модели в области компьютерного зрения: YOLOv7 и Ultralytics YOLOv5.

Анализируя их архитектурные различия, показатели производительности и идеальные сценарии развертывания, мы стремимся помочь разработчикам и исследователям выбрать лучшую модель для их конкретных требований.

Link to this sectionИстория и происхождение моделей#

Понимание происхождения этих моделей дает представление об их философиях проектирования и целевых вариантах использования.

Link to this sectionYOLOv5#

Выпущенная Гленном Джочером и командой Ultralytics 26 июня 2020 года, YOLOv5 произвела революцию в этой области, предоставив собственную реализацию PyTorch, в которой приоритет отдавался удобству использования без ущерба для производительности. Она быстро стала отраслевым стандартом благодаря невероятно оптимизированной экосистеме и надежной динамике обучения. Вы можете изучить исходный код в репозитории YOLOv5 на GitHub или получить доступ к модели напрямую через платформу Ultralytics.

Узнай больше о YOLOv5

Link to this sectionYOLOv7#

Представлена Чиен-Яо Ваном, Алексеем Бочковским и Хонг-Юань Марком Ляо из Института информационных наук Academia Sinica, Тайвань, 6 июля 2022 года. YOLOv7 была сильно сфокусирована на архитектурных инновациях, таких как Extended Efficient Layer Aggregation Networks (E-ELAN) и обучаемый «набор бесплатных дополнений» (bag-of-freebies), чтобы продвинуть современные достижения в области точности. Подробности можно найти в их официальной статье на Arxiv и в репозитории YOLOv7 на GitHub. Для простой интеграции ознакомьтесь с документацией Ultralytics YOLOv7.

Узнай больше о YOLOv7

Удобство экспериментов

Обе эти модели полностью интегрированы в пакет Ultralytics для Python, что позволяет тебе переключаться между ними, просто меняя строку модели в твоем коде!

Link to this sectionАрхитектурные инновации#

Link to this sectionАрхитектура Ultralytics YOLOv5#

YOLOv5 использует модифицированный бэкбон CSPDarknet53 в сочетании с неком Path Aggregation Network (PANet). Этот дизайн оптимизирован для быстрой feature extraction и эффективности использования памяти. В отличие от старых архитектур или тяжелых трансформеров, YOLOv5 требует значительно меньше памяти CUDA во время обучения, что позволяет использовать большие batch sizes на стандартных потребительских GPU. Кроме того, фреймворк Ultralytics изначально поддерживает широкий спектр задач, выходящих за рамки стандартных BBox, включая image segmentation и image classification.

Link to this sectionАрхитектура YOLOv7#

YOLOv7 представила несколько структурных репараметризаций и архитектуру E-ELAN, которая позволяет сети изучать более разнообразные признаки, не разрушая исходный путь градиента. Она также реализует вспомогательную голову для промежуточного контроля во время обучения. Хотя эти достижения обеспечивают высокий mAP, они часто привносят сложные тензорные структуры, которые могут сделать экспорт в форматы для граничных устройств (edge formats), такие как ONNX или TensorRT, несколько более сложным по сравнению с оптимизированными методами экспорта, встроенными в модели Ultralytics.

Link to this sectionАнализ производительности#

Сравнивая эти модели, разработчики должны найти баланс между mAPval, скоростью вывода и вычислительной сложностью (FLOPs). В таблице ниже показана производительность обеих архитектур, оцененная на наборе данных COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionОсновные выводы#

  • Предел точности: YOLOv7x достигает самой высокой общей точности в 53.1 mAPval, что делает ее крайне конкурентоспособной для сценариев, где максимизация производительности обнаружения является основной целью.
  • Скорость и эффективность: Ultralytics YOLOv5n — это чудо эффективности, предлагающее молниеносную inference latency (1.12 мс на T4 TensorRT) с крошечным объемом памяти всего 2.6 млн параметров. Это делает ее непревзойденным выбором для сильно ограниченных граничных развертываний.
  • Баланс производительности: Серия YOLOv5 предоставляет исключительный градиент моделей. YOLOv5l предлагает отличную золотую середину, немного уступая YOLOv7l по точности, но предлагая высокозрелый конвейер развертывания.

Link to this sectionПреимущества экосистемы Ultralytics#

Архитектура модели — это только половина уравнения; экосистема вокруг нее определяет её реальную жизнеспособность. Именно здесь модели Ultralytics действительно сияют.

Простота использования: Ultralytics предоставляет унифицированный, крайне интуитивный API на Python. Ты можешь обучать, проверять и развертывать модели с минимальным количеством шаблонного кода, опираясь на обширную официальную документацию. Хорошо поддерживаемая экосистема: Активная разработка гарантирует постоянные обновления, исправления ошибок и бесшовную интеграцию с современными инструментами отслеживания, такими как Weights & Biases. Эффективность обучения: Используя оптимизированные загрузчики данных и умное кэширование, YOLOv5 значительно сокращает время обучения. Кроме того, готовые к использованию предварительно обученные веса ускоряют трансферное обучение (transfer learning) в различных областях.

Link to this sectionПример кода: Оптимизированное обучение#

С пакетом Ultralytics запуск процесса обучения практически идентичен независимо от того, какую архитектуру ты выберешь.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model (can easily swap to "yolov7.pt")
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX format for deployment
success = model.export(format="onnx")

Link to this sectionИдеальные варианты использования#

Link to this sectionКогда выбирать YOLOv7#

  • Академическое бенчмаркирование: Идеально подходит для исследователей, которым необходимо сравнивать новые методы с хорошо задокументированным стандартом 2022 года.
  • Облачная обработка на мощных GPU: При развертывании на мощном серверном оборудовании, где достижение максимально высокого mAP в плотных сценах перевешивает простоту экспорта.

Link to this sectionКогда стоит выбрать YOLOv5#

  • Развертывание в продакшене: Идеально для коммерческих приложений, требующих высокой стабильности, понятных вариантов развертывания моделей и широкой кроссплатформенной совместимости.
  • Граничные устройства (Edge Devices): Меньшие варианты (YOLOv5n и YOLOv5s) работают исключительно хорошо на мобильных телефонах и встроенных системах.
  • Многозадачные требования: Если твоему проекту нужно эволюционировать от простого обнаружения к pose estimation или сегментации с использованием единого фреймворка.
Изучение других архитектур

Ищешь более свежие итерации? Попробуй изучить Ultralytics YOLOv8 или Ultralytics YOLO11 для дальнейших достижений в области обнаружения без якорей (anchor-free) и многозадачного обучения.

Link to this sectionСледующее поколение: Ultralytics YOLO26#

Хотя YOLOv5 и YOLOv7 занимают важные места в истории компьютерного зрения, ландшафт постоянно меняется. Выпущенная в январе 2026 года, Ultralytics YOLO26 представляет собой абсолютный передний край технологий обнаружения объектов, превосходя предыдущие поколения по всем показателям.

Узнай больше о YOLO26

YOLO26 представляет несколько меняющих парадигму функций:

  • Полностью сквозной дизайн без NMS: Основываясь на концепциях, заложенных в предыдущих итерациях, YOLO26 является нативно сквозным (end-to-end). Это полностью устраняет необходимость в постобработке Non-Maximum Suppression (NMS), устраняя узкие места задержки и радикально упрощая логику развертывания.
  • Оптимизатор MuSGD: Вдохновленный Kimi K2 от Moonshot AI, этот революционный оптимизатор объединяет стабильность стандартного SGD с ускоренным импульсом Muon, принося передовые инновации в обучении больших языковых моделей (LLM) непосредственно в компьютерное зрение.
  • Улучшенная скорость CPU: Стратегически удалив Distribution Focal Loss (DFL), YOLO26 достигает до 43% более быстрого вывода на CPU, что делает её безоговорочным лидером для развертывания на граничных и маломощных IoT-устройствах.
  • ProgLoss + STAL: Эти продвинутые функции потерь дают огромные улучшения в распознавании мелких объектов, что критически важно для аэрофотосъемки и прецизионной робототехники.
  • Улучшения для конкретных задач: Включает потери семантической сегментации для создания масок, оценку остаточного логарифмического правдоподобия (RLE) для отслеживания поз (Pose tracking) и специализированные угловые потери для решения сложных проблем с границами Oriented Bounding Box (OBB).

Link to this sectionЗаключение#

И YOLOv5, и YOLOv7 предлагают надежные решения для обнаружения объектов в реальном времени. YOLOv7 остается сильным выбором для обеспечения максимальной точности на мощном вычислительном оборудовании, в то время как YOLOv5 выделяется как идеальный инструмент для разработчиков, предлагая исключительный баланс скорости, эффективности и первоклассную экосистему.

Однако для разработчиков, стремящихся подготовить свои конвейеры к будущему и достичь максимального сочетания скорости, простоты и современной точности, мы настоятельно рекомендуем перейти на Ultralytics YOLO26. Она воплощает легендарную простоту использования платформы Ultralytics, предлагая при этом прорывные архитектурные инновации.

Контрибьюторы

Комментарии