Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 против EfficientDet#

Выбор оптимальной нейронной сети для обнаружения объектов — это критически важное решение, определяющее успех современных систем компьютерного зрения. Две заметные архитектуры, которые существенно повлияли на эту область, — это YOLOv10 и EfficientDet. Хотя обе нацелены на повышение точности при минимизации вычислительных затрат, они используют совершенно разные архитектурные подходы для достижения этих целей.

Это подробное руководство погружает в их уникальные конструкции, методологии обучения и особенности развертывания, помогая разработчикам и ML-инженерам принимать решения на основе данных для приложений компьютерного зрения с ИИ. Мы рассмотрим, как они работают на оборудовании, начиная от встроенных edge AI устройств и заканчивая мощными облачными GPU.

Link to this sectionYOLOv10: первопроходец без NMS#

Созданная для расширения границ задержки в реальном времени, модель YOLOv10 устранила одно из самых стойких «узких мест» в семействе YOLO: немаксимальное подавление (NMS). Исключив этот шаг постобработки, модель достигает высокой предсказуемости задержки, что критически важно для автономных транспортных средств и высокоскоростной робототехники.

Link to this sectionАрхитектурные инновации#

YOLOv10 вводит согласованные двойные назначения для обучения без NMS. В процессе обучения модель использует как назначения меток «один-ко-многим», так и «один-к-одному», что позволяет сети изучать богатые представления, при этом выдавая один лучший ограничивающий прямоугольник (bbox) для каждого объекта во время инференса. Архитектура также включает целостный дизайн, ориентированный на эффективность и точность, оптимизируя классификационную голову и уменьшая вычислительную избыточность, характерную для предыдущих версий.

Link to this sectionПодробности о модели#

Упрощенное развертывание

Поскольку YOLOv10 исключает шаг NMS, ее по своей сути проще экспортировать в такие форматы, как ONNX format и NVIDIA TensorRT, не полагаясь на пользовательские плагины времени выполнения для фильтрации bbox.

Преимущества:

  • Предсказуемый инференс: Устранение NMS обеспечивает стабильное время инференса независимо от количества объектов в кадре.
  • Меньшее использование памяти: По сравнению с моделями на основе Transformer, такими как RT-DETR, YOLOv10 требует значительно меньше памяти как во время обучения, так и при инференсе.
  • Отличный баланс скорости и точности: Специально оптимизирована для сценариев с низкой задержкой без ущерба для метрик производительности.

Недостатки:

Узнай больше о YOLOv10

Link to this sectionEfficientDet: масштабируемость и баланс#

Представленная Google Brain, модель EfficientDet подходит к обнаружению объектов через призму систематического масштабирования сети. Она построена на основе бэкенда EfficientNet для классификации изображений и вводит новый механизм слияния признаков.

Link to this sectionАрхитектурные инновации#

Основой EfficientDet является Bi-directional Feature Pyramid Network (BiFPN), которая обеспечивает простое и быстрое многомасштабное слияние признаков. В отличие от традиционных FPN, которые суммируют признаки только сверху вниз, BiFPN вводит двунаправленные кросс-масштабные соединения и обучаемые веса для оценки важности различных входных признаков. Кроме того, EfficientDet использует метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину для всех сетей — бэкенда, сети признаков и сетей предсказания bbox/классов.

Link to this sectionПодробности о модели#

Преимущества:

  • Высокая эффективность: Отличное соотношение параметров к точности, что делает меньшие варианты от -d0 до -d2 очень легковесными.
  • Принципиальное масштабирование: Составное масштабирование позволяет легко выбирать размер модели, соответствующий твоему вычислительному бюджету.

Недостатки:

  • Интеграция с устаревшими фреймворками: Оригинальная реализация сильно полагается на старые версии TensorFlow, что может усложнить современные конвейеры развертывания.
  • Более медленное обучение: Обучение EfficientDet «с нуля» крайне медленное и требует тщательной настройки гиперпараметров по сравнению с быстрой сходимостью архитектур YOLO.
  • Скорость инференса: Несмотря на эффективность по параметрам, сложные операции BiFPN часто приводят к более медленной скорости инференса в реальных условиях на стандартном оборудовании по сравнению с высокооптимизированными моделями YOLO.

Узнай больше об EfficientDet

Link to this sectionПроизводительность и бенчмарки#

Истинная проверка этих моделей заключается в их эмпирической производительности на стандартных бенчмарках, таких как датасет COCO. Таблица ниже иллюстрирует критические различия в количестве параметров, операциях с плавающей запятой (FLOPs) и задержке инференса на GPU NVIDIA T4.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Как показано выше, YOLOv10 сохраняет значительное преимущество в «чистой» скорости инференса. Например, YOLOv10-S достигает 46.7 mAP при задержке TensorRT всего 2.66 мс, тогда как EfficientDet-d3 достигает схожих 47.5 mAP, но затрачивает почти 20 мс, что делает YOLOv10 значительно более подходящей для потокового видео в реальном времени или скоростных производственных конвейеров.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLOv10 и EfficientDet зависит от твоих конкретных требований к проекту, ограничений при развертывании и предпочтений в экосистеме.

Link to this sectionКогда стоит выбрать YOLOv10#

YOLOv10 — отличный выбор для:

  • Детекции в реальном времени без NMS: Приложения, которым полезна сквозная (end-to-end) детекция без использования Non-Maximum Suppression, что снижает сложность развертывания.
  • Сбалансированного соотношения скорости и точности: Проекты, требующие оптимального баланса между скоростью вывода и точностью детекции для различных масштабов моделей.
  • Приложений с постоянной задержкой: Сценарии развертывания, где критически важна предсказуемость времени вывода, например, в робототехнике или автономных системах.

Link to this sectionКогда стоит выбрать EfficientDet#

EfficientDet рекомендуется для:

  • Конвейеры Google Cloud и TPU: Системы с глубокой интеграцией в Google Cloud Vision API или инфраструктуру TPU, где EfficientDet имеет встроенную оптимизацию.
  • Исследования составного масштабирования: Академическое тестирование, сфокусированное на изучении эффектов сбалансированного масштабирования глубины, ширины и разрешения сети.
  • Мобильного развертывания через TFLite: Проектов, которые требуют экспорта в TensorFlow Lite специально для Android или встраиваемых устройств на базе Linux.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionСовременный стандарт: встречай Ultralytics YOLO26#

Хотя YOLOv10 представила революционную парадигму без NMS, а EfficientDet продемонстрировала принципиальное масштабирование, ландшафт компьютерного зрения продолжает развиваться. Для разработчиков, начинающих новые проекты сегодня, Ultralytics YOLO26 представляет собой бесспорный современный стандарт. Выпущенная в январе 2026 года, она объединяет лучшее из обоих миров в отшлифованном и готовом к производству пакете в рамках платформы Ultralytics.

Link to this sectionПочему YOLO26 превосходит конкурентов#

  1. End-to-End дизайн без NMS: YOLO26 нативно использует архитектуру без NMS, впервые предложенную в YOLOv10, упрощая развертывание и ускоряя инференс.
  2. До 43% быстрее инференс на CPU: Для устройств, где нет специализированных ускорителей, YOLO26 специально оптимизирована для эффективной работы на стандартных CPU.
  3. Улучшенный оптимизатор MuSGD: Вдохновленная инновациями в обучении LLM, YOLO26 использует гибрид SGD и Muon для невероятно стабильного обучения и быстрой сходимости, что значительно повышает эффективность обучения по сравнению с EfficientDet.
  4. ProgLoss + STAL: Эти улучшенные функции потерь обеспечивают значительный прирост в распознавании мелких объектов, что было традиционно слабым местом как для YOLOv10, так и для EfficientDet.
  5. Удаление DFL: Удалив Distribution Focal Loss, модель YOLO26 легко экспортируется практически в любой аппаратный формат, включая OpenVINO и CoreML.

Более того, YOLO26 обеспечивает непревзойденную универсальность. В то время как EfficientDet и YOLOv10 являются моделями сугубо для обнаружения, YOLO26 легко справляется с ориентированными bbox, классификацией изображений и сегментацией экземпляров, используя тот же интуитивно понятный Python-пакет Ultralytics.

Хорошо поддерживаемая экосистема

Как YOLO11, так и YOLOv8 остаются полностью поддерживаемыми в экосистеме Ultralytics. Для наилучшего сочетания производительности, стабильности и долгосрочной поддержки мы рекомендуем использовать официально поддерживаемые модели Ultralytics.

Link to this sectionПростота использования с Ultralytics#

Хорошо поддерживаемая экосистема, предоставляемая Ultralytics, обеспечивает гладкий опыт для разработчика. Обучение модели, ее валидация и экспорт в TensorRT интеграцию занимают всего несколько строк кода.

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model (or upgrade to YOLO26 natively)
model = YOLO("yolov10n.pt")

# Train the model efficiently on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference and immediately visualize results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export for rapid deployment
model.export(format="engine", quantize=16)

Link to this sectionЗаключение#

При сравнении YOLOv10 и EfficientDet выбор сильно зависит от предпочтений в фреймворке и ограничений по скорости. EfficientDet предлагает структурированный подход к масштабированию моделей в экосистеме TensorFlow. Однако YOLOv10 обеспечивает превосходную производительность в реальном времени, меньшее использование памяти и более простой путь развертывания благодаря своей архитектуре без NMS.

Для достижения наилучшего баланса производительности, простоты использования и многозадачной универсальности настоятельно рекомендуется перейти на платформу Ultralytics и использовать YOLO26. Она берет инновации без NMS из YOLOv10, применяет современные методы обучения, такие как оптимизатор MuSGD, и упаковывает всё это в надежный open-source фреймворк, поддерживаемый огромным мировым сообществом.

Контрибьюторы

Комментарии