Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 против EfficientDet#

Выбор правильной архитектуры нейронной сети имеет решающее значение для успеха любого приложения компьютерного зрения. В этом техническом руководстве рассматриваются компромиссы, показатели производительности и архитектурные инновации двух известных моделей: передовой Ultralytics YOLO26 и хорошо зарекомендовавшей себя EfficientDet от Google.

Независимо от того, ориентировано ли твое развертывание на высокопроизводительные облачные серверы или на Edge AI устройства с ограниченной задержкой, понимание различий между этими архитектурами обеспечит оптимальный баланс скорости, точности и эффективности.

Link to this sectionАрхитектурный обзор: YOLO26#

Авторы: Гленн Джочер и Цзин Цю Организация: Ultralytics Дата: 2026-01-14 GitHub: Ultralytics GitHub Документация: Официальная документация YOLO26

Выпущенная в начале 2026 года, YOLO26 представляет собой новейшую эволюцию в семействе YOLO, специально разработанную для обеспечения непревзойденного пользовательского опыта и топовой средней точности (mAP). Спроектированная с нуля для современного оборудования, она предлагает исключительную универсальность в задачах детекции объектов, сегментации экземпляров, классификации изображений и оценки позы.

YOLO26 внедряет несколько революционных функций, которые значительно улучшают как стабильность обучения, так и скорость инференса:

  • End-to-End дизайн без NMS: Развивая идеи, заложенные в YOLOv10, YOLO26 является нативно end-to-end решением, полностью исключающим необходимость в постпроцессинге Non-Maximum Suppression (NMS). Это упрощает логику развертывания и значительно снижает вариативность задержки.
  • До 43% быстрее инференс на CPU: Благодаря глубоким архитектурным оптимизациям модель достигает беспрецедентной скорости инференса на стандартных процессорах, что делает ее очень подходящей для IoT и встроенных сред.
  • Удаление DFL: Функция Distribution Focal Loss была удалена, что привело к упрощению процесса экспорта и повышению совместимости с маломощными периферийными устройствами с использованием таких инструментов, как ONNX.
  • Оптимизатор MuSGD: Вдохновленный процедурами обучения LLM от Moonshot AI Kimi K2, этот гибрид SGD и Muon привносит инновации обучения больших языковых моделей непосредственно в компьютерное зрение, обеспечивая более быструю сходимость и более стабильные режимы обучения.
  • ProgLoss + STAL: Эти продвинутые функции потерь дают заметные улучшения в распознавании мелких объектов, что является критическим фактором для приложений, связанных с аэросъемкой с дронов и робототехникой.
Упрощенный экспорт

Благодаря удалению DFL и архитектуре без NMS, экспорт моделей YOLO26 в форматы, удобные для периферийных устройств, такие как NVIDIA TensorRT или Intel OpenVINO, практически не требует разработки пользовательских плагинов.

Узнай больше о YOLO26

Link to this sectionАрхитектурный обзор: EfficientDet#

Авторы: Мингсин Тан, Руоминг Панг и Куок В. Ле Организация: Google Research Дата: 2019-11-20 Arxiv: Статья EfficientDet GitHub: Репозиторий Google AutoML

Представленная Google, EfficientDet активно использует экосистему TensorFlow и была разработана вокруг концепции составного масштабирования (compound scaling). Ее архитектура масштабирует базовую сеть, сеть признаков и сети предсказания боксов/классов одновременно в зависимости от ограничений ресурсов.

Ключевые инновации EfficientDet включают:

  • BiFPN (двунаправленная сеть пирамиды признаков): Механизм, который позволяет легко и быстро выполнять слияние признаков на разных масштабах, позволяя сети лучше понимать объекты разного размера.
  • Составное масштабирование: Эвристический метод равномерного масштабирования разрешения, глубины и ширины, создающий семейство моделей от d0 (самая маленькая) до d7 (самая большая).

Хотя EfficientDet остается надежным выбором для строгой детекции ограничивающих рамок, ей в целом не хватает современной многозадачной универсальности (такой как нативные OBB задачи) и оптимизированной, унифицированной экосистемы Python, которую ожидают современные разработчики.

Узнай больше об EfficientDet

Link to this sectionСравнение производительности и метрик#

Чтобы определить границу Парето скорости и точности, мы провели бенчмаркинг обеих архитектур в стандартных средах с использованием датасета COCO. В следующей таблице выделены различия в размерах моделей, точности и задержке, измеренных на инстансе AWS EC2 P4d.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Как показано выше, YOLO26 устанавливает превосходный баланс производительности. Модель YOLO26x достигает высочайшей точности (57.5 mAP), значительно превосходя самую тяжелую EfficientDet-d7. Кроме того, модели YOLO26 демонстрируют существенно меньшие требования к памяти и гораздо более высокую скорость инференса на GPU (до 1.7 мс на TensorRT), что подчеркивает преимущества дизайна без NMS.

Link to this sectionЭффективность обучения и преимущество экосистемы#

Главное различие между двумя архитектурами заключается в их средах разработки. EfficientDet глубоко интегрирована в экосистему Google AutoML и TensorFlow, что, хотя и мощно, может привести к крутой кривой обучения и жестким конфигурациям для пользовательских наборов данных, таких как DOTAv1.

Напротив, Ultralytics предлагает невероятно хорошо поддерживаемую экосистему, построенную на PyTorch. Использование памяти во время обучения строго оптимизировано, что позволяет инженерам обучать надежные модели, не требуя чрезмерных выделений VRAM, характерных для сетей на базе Transformer.

Интеграция унифицированной платформы

Через платформу Ultralytics разработчики получают доступ к полноценному MLOps рабочему процессу. Это включает в себя бесшовную разметку данных, автоматическую настройку гиперпараметров и облачное обучение в один клик, что значительно ускоряет путь от прототипирования к производству.

Link to this sectionПример реализации#

Простота использования, предоставляемая API Ultralytics, означает, что ты можешь обучить и проверить передовую модель YOLO26 всего за несколько строк кода.

from ultralytics import YOLO

# Initialize the End-to-End NMS-Free YOLO26 model
model = YOLO("yolo26n.pt")

# Train using the innovative MuSGD optimizer on a custom dataset
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Train on GPU
)

# Export natively to TensorRT for ultra-low latency deployment
model.export(format="engine")

Link to this sectionИдеальные варианты использования#

Когда использовать YOLO26:

  • Edge-вычисления и мобильные устройства: Благодаря инференсу на CPU, который до 43% быстрее, и отсутствию накладных расходов NMS, YOLO26 отлично работает на устройствах со строго ограниченным бюджетом вычислений, таких как Raspberry Pi или мобильные телефоны.
  • Многозадачность: Когда один конвейер требует ограничивающих рамок, масок сегментации и отслеживания, универсальность YOLO26 не имеет равных.
  • Дроны и аэросъемка: Комбинация ProgLoss и STAL значительно улучшает обнаружение экстремально мелких объектов с больших высот.

Когда использовать EfficientDet:

  • Устаревшие конвейеры TensorFlow: Если твоя инфраструктура сильно привязана к поддержке только TensorFlow SavedModels или требует специфических конвейеров TensorFlow Serving, EfficientDet обеспечивает нативную совместимость.
  • TPU с ограниченными ресурсами: EfficientDet была сильно оптимизирована для специализированных тензорных процессоров Google (TPU).

Link to this sectionИзучение других альтернатив#

Хотя это руководство в значительной степени фокусируется на парадигме YOLO26 против EfficientDet, более широкая экосистема Ultralytics содержит другие невероятные архитектуры. Если твое приложение сильно опирается на трансформеры, RT-DETR предлагает обнаружение на основе трансформеров в реальном времени. В качестве альтернативы, если ты поддерживаешь устаревшие системы, YOLO11 остается полностью поддерживаемой и высокоэффективной. Для более широкого обзора посети Центр сравнения моделей Ultralytics.

В конечном итоге, для любого современного конвейера компьютерного зрения, создаваемого сегодня, колоссальная скорость, простота использования и передовая точность YOLO26 делают ее бесспорной рекомендацией как для исследователей, так и для разработчиков.

Контрибьюторы

Комментарии