Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 против DAMO-YOLO#

Ландшафт детектирования объектов в реальном времени постоянно меняется, и исследователи с инженерами стремятся найти оптимальный баланс между скоростью и точностью. В этом техническом сравнении мы подробно рассмотрим две примечательные архитектуры 2022 года: YOLOv7 и DAMO-YOLO. Обе модели представили сообществу компьютерного зрения новые концепции, затрагивающие различные проблемы обучения моделей, архитектурного проектирования и развертывания.

Link to this sectionИстория создания моделей и технические подробности#

Прежде чем углубляться в архитектуры, важно понять истоки этих двух моделей. Обе были разработаны ведущими исследовательскими группами и представили передовые методологии, расширяющие границы детектирования объектов в реальном времени.

Link to this sectionДетали YOLOv7#

Созданная как продолжение семейства YOLO, модель YOLOv7 представила концепцию обучаемого "набора полезных приемов" (bag-of-freebies) для значительного повышения точности без увеличения затрат на инференс.

Узнай больше о YOLOv7

Link to this sectionПодробности DAMO-YOLO#

Разработанная исследователями Alibaba Group, модель DAMO-YOLO сосредоточилась на поиске нейронной архитектуры (NAS) и передовых методах дистилляции знаний для создания высокоэффективных моделей под различное оборудование.

Узнай больше о DAMO-YOLO

Link to this sectionАрхитектурные инновации#

Link to this sectionYOLOv7: Анализ путей градиента и репараметризация#

YOLOv7 делает упор на Extended Efficient Layer Aggregation Networks (E-ELAN). Авторы спроектировали E-ELAN, анализируя пути градиента сети, чтобы обеспечить непрерывное обучение без деградации исходного пути. Кроме того, YOLOv7 эффективно использует репараметризацию модели во время инференса, бесшовно объединяя слои для уменьшения FLOPs и ускорения выполнения. Это делает ее высокоэффективной для инференса в реальном времени на современных GPU.

Link to this sectionDAMO-YOLO: Поиск нейронной архитектуры и RepGFPN#

DAMO-YOLO отличается активным использованием Neural Architecture Search (NAS) в условиях ограничений по задержке. Она применяет фреймворк MAE-NAS для поиска оптимальных бекбонов, адаптированных под конкретное оборудование, такое как мобильные устройства или специализированные ускорители. В качестве «шеи» сети она вводит эффективную RepGFPN (Rep-parameterized Generalized Feature Pyramid Network) и использует дизайн ZeroHead для минимизации вычислительной нагрузки в головах предсказания.

Различия в дистилляции

В то время как YOLOv7 полагается на сильные внутренние архитектурные оптимизации, DAMO-YOLO сильно зависит от сложного многоэтапного процесса дистилляции знаний. Для нее требуется обучение большой учительской модели, чтобы передать знания маленькой студенческой модели, что может быть вычислительно затратным на этапе обучения.

Link to this sectionСравнение производительности и метрик#

При сравнении этих моделей крайне важно учитывать mAP (средняя точность), скорость инференса и сложность модели.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Таблица выше демонстрирует, что YOLOv7 хорошо масштабируется в областях с высокой точностью (YOLOv7x), тогда как DAMO-YOLO предоставляет высокооптимизированные компактные модели для сред с ограниченными ресурсами.

Link to this sectionЭффективность обучения и требования к памяти#

Главное различие между двумя архитектурами заключается в методологиях обучения. Зависимость DAMO-YOLO от дистилляции означает, что обучение новой модели с нуля или дообучение на пользовательском датасете компьютерного зрения часто требует значительно больше VRAM и времени GPU-вычислений.

Напротив, модели, интегрированные в экосистему Ultralytics, такие как YOLOv7 и более поздние версии, сильно оптимизированы с учетом требований к памяти. Они позволяют тебе использовать большие размеры батчей на потребительском оборудовании без ошибок переполнения памяти, упрощая процесс отслеживания экспериментов и итераций.

Link to this sectionПреимущество Ultralytics#

Хотя обе модели, YOLOv7 и DAMO-YOLO, обладают привлекательными функциями, развертывание моделей в экосистеме Ultralytics обеспечивает непревзойденный опыт разработчика.

  • Простота использования: Пакет Ultralytics для Python предлагает унифицированный и простой API. Ты можешь быстро переключаться между архитектурами моделей, запускать циклы обучения или выполнять инференс с помощью нескольких строк кода.
  • Поддерживаемая экосистема: Ultralytics обеспечивает частые обновления, гарантируя нативную совместимость с последними релизами PyTorch и драйверами CUDA. Это также упрощает экспорт моделей в такие форматы, как ONNX, TensorRT и OpenVINO.
  • Универсальность: В отличие от DAMO-YOLO, которая является строго детектором объектов, экосистема Ultralytics поддерживает множество задач «из коробки». Модели из семейства Ultralytics могут выполнять стандартное детектирование с помощью BBox, оценку позы, сегментацию экземпляров и ориентированные BBox (OBB).

Link to this sectionПример кода: Быстрый старт#

Вот как легко ты можешь загрузить, обучить и запустить инференс, используя модели Ultralytics:

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model (or newer models like yolo26n.pt)
model = YOLO("yolov7.pt")

# Train the model on the COCO8 dataset with automated hyperparameter handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")
Экспорт моделей

С Ultralytics экспорт твоих обученных весов в различные форматы с аппаратным ускорением (такие как TensorRT или CoreML) выполняется через один аргумент в команде экспорта, что экономит часы настройки сложных скриптов.

Link to this sectionСледующее поколение: YOLO26#

Хотя YOLOv7 остается сильной архитектурой, область стремительно развивается. Для новых развертываний рекомендуемым стандартом является Ultralytics YOLO26 (выпущенная в январе 2026 года), превосходящая предыдущие поколения почти по всем метрикам.

  • Сквозной дизайн без NMS: Впервые представленный в YOLOv10, YOLO26 нативно исключает постобработку NMS. Это обеспечивает детерминированный инференс с ультранизкой задержкой, что критически важно для робототехники и технологий беспилотного вождения.
  • Оптимизатор MuSGD: Вдохновленный передовыми методами обучения LLM (такими как Kimi K2 от Moonshot AI), этот гибридный оптимизатор сочетает SGD и Muon для обеспечения стабильного обучения и более быстрой сходимости на различных датасетах.
  • До 43% быстрее инференс на CPU: Стратегически удалив Distribution Focal Loss (DFL), модель YOLO26 значительно повышает производительность на платформах граничных вычислений и CPU.
  • ProgLoss + STAL: Эти продвинутые функции потерь дают существенные улучшения в обнаружении мелких объектов, делая YOLO26 исключительно подходящей для аэрофотосъемки и детального наблюдения.

Узнай больше о YOLO26

Link to this sectionИдеальные варианты использования#

Link to this sectionКогда выбирать DAMO-YOLO#

  • Академические исследования в NAS: Если твоя организация активно инвестирует в изучение методологий поиска нейронной архитектуры.
  • Сверхжесткие ограничения по задержке на специфическом оборудовании: Если у тебя есть ресурсы для проведения исчерпывающего поиска NAS, чтобы найти адаптированный бекбон для кастомного AI-чипа-ускорителя.

Link to this sectionКогда выбирать YOLOv7#

  • Существующие GPU-пайплайны: Для команд, поддерживающих унаследованные производственные пайплайны, глубоко оптимизированные под архитектуру E-ELAN модели YOLOv7 на высокопроизводительном оборудовании NVIDIA.

Link to this sectionЗачем переходить на современные модели Ultralytics (YOLO11 / YOLO26)#

Для подавляющего большинства корпоративных приложений — от розничной аналитики и умного производства до здравоохранения — современные модели Ultralytics не имеют аналогов. Интеграция с платформой Ultralytics предоставляет полный ML-пайплайн, предлагая простоту использования, превосходную документацию, мощную поддержку сообщества и многозадачность. Независимо от того, отслеживаешь ли ты запасы на Raspberry Pi или запускаешь тяжелую аналитику в облаке, модели вроде YOLO26 предлагают идеальный баланс производительности для будущего компьютерного зрения.

Комментарии