Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX против YOLOv7#

Эволюция обнаружения объектов в реальном времени обусловлена постоянными прорывами в архитектуре. Двумя значимыми вехами на этом пути стали YOLOX и YOLOv7. Выпущенные с разницей в год, обе модели предложили новые подходы к стандартной парадигме обнаружения объектов, значительно улучшив баланс между скоростью и точностью.

Эта страница содержит глубокий технический анализ YOLOX и YOLOv7, сравнивая их архитектуры, показатели производительности и идеальные сценарии использования, чтобы помочь тебе выбрать подходящий инструмент для внедрения решений компьютерного зрения.

Link to this sectionYOLOX: Пионер обнаружения без использования анкоров#

Представленный исследователями Megvii в июле 2021 года, YOLOX стал значительным сдвигом, отказавшись от традиционных конструкций на основе анкоров (якорей). Сократив разрыв между академическими исследованиями и промышленным применением, YOLOX упростил детекторную голову и улучшил общую производительность.

Ключевые детали модели:

Link to this sectionАрхитектурные инновации#

В YOLOX представлен подход без использования анкоров (anchor-free), что радикально сократило количество параметров проектирования и необходимость эвристической настройки для пользовательских наборов данных. В нем реализована разделенная (decoupled) голова, отделяющая задачи классификации и регрессии, что улучшило скорость сходимости и точность. Кроме того, YOLOX использует продвинутые стратегии аугментации данных, такие как MixUp и Mosaic, для повышения надежности модели.

Узнать больше о YOLOX

Преимущество отсутствия якорей (anchor-free)

Исключив анкор-боксы, YOLOX снижает вычислительные затраты на расчет IoU (Intersection over Union) между прогнозами и истинными значениями во время обучения, что приводит к снижению требований к памяти CUDA и ускорению времени обучения.

Link to this sectionYOLOv7: Обучаемый "набор бесплатных улучшений" (Trainable Bag-of-Freebies)#

Выпущенный в июле 2022 года исследователями из Института информационных наук (Academia Sinica, Тайвань), YOLOv7 еще больше раздвинул границы обнаружения объектов в реальном времени. Он представил концепцию «обучаемого набора бесплатных улучшений» (trainable bag-of-freebies), установив новые эталонные показатели на наборе данных MS COCO сразу после выпуска.

Ключевые детали модели:

  • Авторы: Chien-Yao Wang, Alexey Bochkovskiy и Hong-Yuan Mark Liao
  • Организация: Институт информатики, Academia Sinica, Тайвань
  • Дата: 2022-07-06
  • Научная статья: arXiv:2207.02696
  • Исходный код: WongKinYiu YOLOv7 GitHub
  • Документация: Ultralytics YOLOv7 Docs

Link to this sectionАрхитектурные инновации#

Архитектура YOLOv7 построена вокруг сети E-ELAN (Extended Efficient Layer Aggregation Network), которая позволяет модели непрерывно изучать более разнообразные признаки, не нарушая градиентный путь. Кроме того, в YOLOv7 используются методы репараметризации моделей, позволяющие упростить сложные многоветвевые обучающие сети до более быстрых однопутных сетей во время инференса.

Узнай больше о YOLOv7

Link to this sectionСравнение производительности#

При оценке этих моделей для реальных задач важно понимать их производительность в разных масштабах. В таблице ниже сравниваются стандартные метрики для разных размеров YOLOX и YOLOv7.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Link to this sectionАнализ#

  • Точность: YOLOv7, как правило, достигает более высокого mAP по сравнению с аналогичными моделями YOLOX. Например, YOLOv7x достигает 53.1 mAP по сравнению с 51.1 у YOLOXx.
  • Скорость: Хотя обе модели высоко оптимизированы для работы на GPU с использованием TensorRT, архитектура E-ELAN в YOLOv7 обеспечивает чуть большую пропускную способность для высокопроизводительных приложений, хотя YOLOX сохраняет отличную задержку на небольших edge-устройствах.
  • Универсальность: YOLOv7 расширил свой арсенал за пределы ограничивающих рамок (bounding boxes), предоставляя встроенные веса для сегментации экземпляров и оценки позы, что делает его более универсальным, чем базовый репозиторий YOLOX.

Link to this sectionПрименение в реальных условиях#

Выбор между этими моделями часто сводится к специфике твоей среды развертывания.

Link to this sectionПериферийные вычисления и IoT#

Для ограниченных в ресурсах edge-устройств, таких как Raspberry Pi или старые мобильные процессоры, YOLOX-Nano и YOLOX-Tiny очень привлекательны. Их минимальное количество параметров и отсутствие анкоров упрощают развертывание в условиях низкого энергопотребления для таких задач, как базовое отслеживание движения или умные дверные звонки.

Link to this sectionВидеоаналитика высокой четкости#

Для обработки потоков высокого разрешения в задачах промышленного обнаружения дефектов или плотного мониторинга трафика YOLOv7 превосходит конкурентов. Его надежная агрегация признаков позволяет сохранять высокую точность, даже когда объекты частично перекрыты или сильно различаются по масштабу.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLOX и YOLOv7 зависит от требований твоего проекта, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда выбирать YOLOX#

YOLOX — сильный выбор для:

  • Исследований безъякорного обнаружения: академических исследований, использующих чистую безъякорную архитектуру YOLOX как базу для экспериментов с новыми головами детекции или функциями потерь.
  • Сверхлегких Edge-устройств: развертывания на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый вес варианта YOLOX-Nano (0.91 млн параметров).
  • Изучения назначения меток SimOTA: исследовательских проектов, анализирующих стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.

Link to this sectionКогда выбирать YOLOv7#

YOLOv7 рекомендуется для:

  • Академического бенчмаркинга: воспроизведение результатов уровня state-of-the-art 2022 года или изучение эффектов E-ELAN и методов trainable bag-of-freebies.
  • Исследований репараметризации: изучение плановых репараметризованных сверток и стратегий составного масштабирования моделей.
  • Существующих кастомных конвейеров: проектов с сильно модифицированными конвейерами, построенными вокруг специфической архитектуры YOLOv7, которые нельзя легко переработать.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionПреимущество Ultralytics#

Хотя YOLOX и YOLOv7 являются мощными исследовательскими реализациями, переход от исследовательского репозитория к масштабируемой производственной среде может быть пугающим. Именно здесь на помощь приходит Ultralytics Platform.

Модели Ultralytics предоставляют единый Python API, рассматривая обучение, валидацию и развертывание модели как оптимизированные, стандартизированные задачи. Ты избегаешь проблем с управлением сложными сторонними зависимостями или пользовательскими операторами на C++, характерными для старых архитектур.

Более того, модели Ultralytics YOLO требуют значительно меньше памяти CUDA во время обучения по сравнению с детекторами на основе Transformer, такими как RT-DETR. Это позволяет использовать бóльшие размеры пакетов (batch sizes), стабилизируя обучение и ускоряя сходимость на собственных наборах данных.

Поддерживаемые интеграции

Ultralytics нативно поддерживает экспорт моделей в отраслевые стандарты, такие как ONNX, OpenVINO и CoreML, с помощью простого логического флага, что значительно упрощает процесс развертывания модели.

Link to this sectionПример кода: Обучение с Ultralytics#

Экосистема Ultralytics позволяет тебе легко загружать, обучать и запускать инференс, используя YOLOv7 или более новые архитектуры, всего за несколько строк кода.

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on a custom dataset (e.g., COCO8)
# The API handles data loading, augmentation, and memory management automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image
predictions = model("path/to/image.jpg")
predictions[0].show()

Link to this sectionБудущее: Ultralytics YOLO26#

Хотя YOLOv7 и YOLOX представляют собой важные исторические шаги, состояние технологий быстро меняется. Выпущенная в январе 2026 года, Ultralytics YOLO26 внедряет революционные парадигмы, превосходящие предыдущие модели.

Узнай больше о YOLO26

  • End-to-End NMS-Free Design: YOLO26 natively eliminates Non-Maximum Suppression (NMS) post-processing. This drastically reduces latency bottlenecks and guarantees deterministic execution times across varied hardware setups.
  • До 43% быстрее инференс на CPU: За счет удаления функции потерь Distribution Focal Loss (DFL) и оптимизации глубины сети, YOLO26 глубоко адаптирована для edge-устройств без выделенного GPU.
  • Оптимизатор MuSGD: Вдохновленный продвинутыми методами обучения LLM, оптимизатор MuSGD (гибрид SGD и Muon) обеспечивает исключительную стабильность обучения и более быструю сходимость.
  • Улучшенное обнаружение мелких объектов: Интеграция функций потерь ProgLoss + STAL дает значительные улучшения в распознавании мелких, удаленных объектов — что критически важно для картографирования с дронов и охранного наблюдения.
  • Нативная поддержка задач: YOLO26 комплексно поддерживает ориентированные ограничивающие рамки (OBB), сегментацию экземпляров и оценку позы нативно в рамках одного и того же упрощенного API.

Для любого современного разработчика, начинающего новый проект в области компьютерного зрения сегодня, оценка Ultralytics YOLO26 на платформе — это рекомендуемый путь для достижения наилучшего баланса скорости, точности и простоты развертывания. Для тех, кто переходит с предыдущих поколений, таких как YOLO11 или YOLOv8, переход требует изменения только строки модели, что мгновенно открывает доступ к превосходным возможностям.

Контрибьюторы

Комментарии