Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet против YOLOv9#

Ландшафт компьютерного зрения формируется благодаря постоянным прорывам в проектировании нейронных сетей. Поиск правильного баланса между вычислительной эффективностью и точностью обнаружения имеет решающее значение при выборе модели. EfficientDet от Google установила высокую планку в 2019 году, представив масштабируемые архитектуры, в то время как YOLOv9, выпущенная в 2024 году, расширила границы обнаружения объектов с использованием программируемой градиентной информации (PGI).

Это руководство содержит комплексное техническое сравнение этих двух моделей и представляет современный фреймворк Ultralytics YOLO26, который предлагает надежное комплексное решение, оптимизированное для производственных сред.

Link to this sectionАрхитектуры моделей и инновации#

Понимание базовых механизмов работы EfficientDet и YOLOv9 необходимо для определения их оптимальных сценариев использования.

Link to this sectionEfficientDet: compound scaling и BiFPN#

Разработанная в Google Research, EfficientDet фокусируется на систематическом масштабировании и эффективном слиянии признаков. Она использует EfficientNet в качестве основы и внедряет новую архитектуру сети признаков.

  • Авторы: Минсин Тан, Руомин Пан и Куок В. Ле
  • Организация: Google
  • Дата: 20 ноября 2019 г.
  • Ссылки: Arxiv, GitHub

Ключевые архитектурные особенности: EfficientDet в значительной степени полагается на двунаправленную пирамидальную сеть признаков (BiFPN), которая позволяет легко и быстро объединять признаки разных масштабов. Наряду с этим, она использует метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину сети. Несмотря на высокую точность для своего времени, EfficientDet сильно привязана к устаревшим средам TensorFlow, что усложняет современные конвейеры развертывания.

Узнай больше об EfficientDet

Link to this sectionYOLOv9: Решение проблемы информационного узкого места#

Разработанная исследователями Academia Sinica, YOLOv9 решает проблему деградации информации при прохождении данных через глубокие нейронные сети.

  • Авторы: Chien-Yao Wang и Hong-Yuan Mark Liao
  • Организация: Институт информатики, Academia Sinica
  • Дата: 21 февраля 2024 г.
  • Ссылки: Arxiv, GitHub, Docs

Ключевые архитектурные особенности: YOLOv9 внедряет программируемую градиентную информацию (PGI) для обеспечения вспомогательного контроля, гарантируя, что критически важные данные сохраняются для надежного обновления весов сети. Она также оснащена обобщенной эффективной сетью агрегации слоев (GELAN) для максимизации эффективности параметров. Несмотря на эти достижения, YOLOv9 по-прежнему требует подавления немаксимумов (NMS) во время постобработки, что увеличивает задержку.

Узнай больше о YOLOv9

Link to this sectionСравнение производительности#

При оценке этих моделей анализ эмпирических данных помогает определить, какая архитектура обеспечивает наилучший компромисс для твоих специфических аппаратных требований.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Link to this sectionКритический анализ#

YOLOv9 обеспечивает качественный скачок в скорости. Например, YOLOv9e достигает 55.6% mAP с задержкой TensorRT в 16.77 мс. В резком контрасте, EfficientDet-d7 предлагает более низкий mAP в 53.7%, но страдает от огромной задержки (128.07 мс), что делает крайне сложным ее развертывание для видеопотоков в реальном времени.

Экспорт моделей для производства

Экспорт твоей архитектуры в оптимизированные форматы, такие как TensorRT или OpenVINO, радикально сокращает время вывода по сравнению с запуском в чистом PyTorch.

Link to this sectionСценарии использования и рекомендации#

Выбор между EfficientDet и YOLOv9 зависит от требований твоего конкретного проекта, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда стоит выбрать EfficientDet#

EfficientDet — отличный выбор, если:

  • Конвейеры Google Cloud и TPU: Системы с глубокой интеграцией в Google Cloud Vision API или инфраструктуру TPU, где EfficientDet имеет встроенную оптимизацию.
  • Исследования составного масштабирования: Академическое тестирование, сфокусированное на изучении эффектов сбалансированного масштабирования глубины, ширины и разрешения сети.
  • Мобильного развертывания через TFLite: Проектов, которые требуют экспорта в TensorFlow Lite специально для Android или встраиваемых устройств на базе Linux.

Link to this sectionКогда стоит выбрать YOLOv9#

YOLOv9 рекомендуется для:

  • Исследований информационных узких мест: Академические проекты по изучению архитектур Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).
  • Изучения оптимизации потока градиентов: Исследования, направленные на понимание и смягчение потери информации в глубоких слоях сети во время обучения.
  • Бенчмаркинга обнаружения высокой точности: Сценарии, где высокие показатели производительности YOLOv9 в бенчмарке COCO необходимы в качестве точки отсчета для архитектурных сравнений.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionПреимущество Ultralytics: выбор YOLO26#

Хотя YOLOv9 и EfficientDet проложили путь, разработчикам, ищущим по-настоящему современный, готовый к производству фреймворк, стоит рассмотреть модели Ultralytics YOLO, в частности недавно выпущенную YOLO26.

Платформа Ultralytics предлагает непревзойденную простоту использования, сочетая мощные локальные скрипты обучения с облачным интерфейсом. YOLO26 представляет собой масштабную переработку дизайна моделей, делая устаревшие архитектуры неактуальными для многих коммерческих приложений.

Link to this sectionТехнические преимущества YOLO26#

  • Комплексный дизайн без NMS: YOLO26 полностью устраняет «узкие места» постобработки. Благодаря удалению подавления немаксимумов графы развертывания становятся унифицированными и работают значительно быстрее на чипах Edge AI.
  • До 43% более быстрый вывод на CPU: Оптимизирована специально для встроенных устройств, что делает ее существенно быстрее как YOLOv9, так и EfficientDet, когда GPU недоступны.
  • Оптимизатор MuSGD: Интегрируя инновации LLM в Vision AI, этот гибридный оптимизатор стабилизирует обучение, позволяя моделям сходиться быстрее с меньшими ресурсами.
  • Низкие требования к памяти: В отличие от архитектур, перегруженных трансформерами, или неоптимизированных CNN, YOLO26 минимизирует потребление памяти CUDA во время обучения, позволяя использовать большие размеры пакетов (batch size) на потребительском оборудовании.
  • ProgLoss + STAL: Улучшенная архитектура функции потерь радикально повышает точность обнаружения мелких объектов, делая YOLO26 идеальной для аэросъемки и сетей IoT.
  • Удаление DFL: Упрощенный структурный дизайн обеспечивает беспрепятственную конвертацию в форматы для мобильного развертывания.

Узнай больше о YOLO26

Другие надежные варианты в экосистеме Ultralytics включают YOLO11 и YOLOv8, которые также обеспечивают универсальность многозадачности, такую как сегментация экземпляров и оценка позы.

Link to this sectionУпрощенное обучение с помощью Python SDK#

Модели Ultralytics отдают приоритет опыту разработчика. Обучение современной модели сводится всего к нескольким строкам Python.

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train with optimized memory usage and built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance easily
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

Link to this sectionПрименение в реальных условиях#

Выбор между этими архитектурами сильно зависит от цели твоего развертывания.

  • Устаревшие облачные развертывания: EfficientDet была популярна для автономной пакетной обработки в облаке, где требовалась высокая точность и отсутствовали строгие требования к работе в реальном времени.
  • Академические исследования: YOLOv9 остается интересным выбором для исследователей, расширяющих теоретические границы CNN и анализирующих градиентные потоки через слои сети.
  • Периферийные вычисления и IoT: YOLO26 доминирует в реальных приложениях. Ее конвейер без NMS и возможности ориентированных ограничивающих рамок (OBB) делают ее превосходным вариантом для анализа дорожного движения в умных городах, мониторинга запасов в розничной торговле и инспекций с помощью дронов, предлагая непревзойденный баланс высокой точности и скорости вывода.
Участники

Комментарии