Link to this sectionEfficientDet против PP-YOLOE+#

Ландшафт компьютерного зрения сильно изменился благодаря постоянному развитию моделей обнаружения объектов. Двумя значимыми вехами на этом пути стали EfficientDet от Google и PP-YOLOE+ от Baidu. Хотя обе архитектуры были разработаны для достижения баланса между вычислительной эффективностью и точностью обнаружения, они подходят к этой задаче с принципиально разных точек зрения.

Это подробное руководство анализирует их архитектуры, методологии обучения и сценарии развертывания в реальных условиях, чтобы помочь тебе выбрать оптимальную нейронную сеть для твоего следующего приложения компьютерного зрения.

Link to this sectionАрхитектурные инновации и подходы к проектированию#

Понимание базовой архитектуры этих моделей критически важно для их эффективного развертывания в производственных средах, будь то периферийные устройства или облачные серверы.

Link to this sectionEfficientDet: Сила составного масштабирования#

Разработанный Google Research, EfficientDet представил смену парадигмы, рассматривая масштабирование модели не как вспомогательный процесс, а как математически обоснованный метод составного масштабирования.

Авторы: Mingxing Tan, Ruoming Pang и Quoc V. Le
Организация: Google Research
Дата: 2019-11-20
Arxiv: 1911.09070
GitHub: google/automl
Документация: Документация EfficientDet

Узнай больше об EfficientDet

Основная инновация EfficientDet заключается в его Bi-directional Feature Pyramid Network (BiFPN). В отличие от традиционных FPN, которые только суммируют признаки сверху вниз, BiFPN вводит обучаемые веса для осуществления кросс-масштабного слияния признаков как сверху вниз, так и снизу вверх. Это позволяет сети интуитивно понимать важность различных входных признаков. В сочетании с основой EfficientNet, EfficientDet одновременно масштабирует разрешение, глубину и ширину, создавая семейство моделей (от d0 до d7), которые удовлетворяют различным вычислительным бюджетам.

Масштабирование EfficientDet

При развертывании EfficientDet тщательно учитывай целевое оборудование. Хотя d0 подходит для мобильных устройств, масштабирование до d7 требует значительного объема памяти GPU и вычислительной мощности.

Link to this sectionPP-YOLOE+: Расширяя границы PaddlePaddle#

Основываясь на успехах своих предшественников, PP-YOLOE+ была разработана командой PaddlePaddle в Baidu для обеспечения передовой производительности, специально оптимизированной для высокопроизводительных серверных развертываний.

Авторы: Авторы PaddlePaddle
Организация: Baidu
Дата: 02.04.2022
Arxiv: 2203.16250
GitHub: PaddlePaddle/PaddleDetection
Документация: Конфигурация PP-YOLOE+

Узнай больше о PP-YOLOE+

PP-YOLOE+ оснащена основой CSPRepResNet, которая использует сети Cross Stage Partial в сочетании с методами репараметризации для улучшения извлечения признаков без увеличения задержки вывода. Её ET-head (Efficient Task-aligned head) значительно улучшает согласованность между задачами классификации и локализации. Кроме того, в ней используется дизайн без якорей (anchor-free) в сочетании с динамическим назначением меток (TAL), что упрощает процесс обучения и улучшает обобщение на разнообразных наборах данных.

Link to this sectionПоказатели производительности и бенчмарки#

При выборе модели для вывода в реальном времени оценка баланса между mean Average Precision (mAP) и вычислительной скоростью имеет первостепенное значение. В приведенной ниже таблице представлены основные показатели производительности для обоих семейств моделей.

Модель	размер ^{(пиксели)}	mAP^val 50-95	Скорость ^{CPU ONNX (мс)}	Скорость ^{T4 TensorRT10 (мс)}	параметры ^(М)	FLOPs ^(Б)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

Как видно, PP-YOLOE+ обычно достигает более высоких пиков точности при эквивалентном количестве параметров, особенно в своих более крупных вариантах (l и x). Она хорошо оптимизирована для пропускной способности GPU, что делает её отличным кандидатом для серверных развертываний пакетной обработки. Напротив, более мелкие модели EfficientDet обеспечивают высокоэффективное соотношение параметров к FLOP, что может быть преимуществом в средах с жесткими ограничениями памяти.

Link to this sectionИдеальные варианты использования и стратегии развертывания#

Выбор между этими архитектурами часто сильно зависит от твоего существующего технологического стека и оборудования развертывания.

Когда выбирать EfficientDet:

Рабочие процессы AutoML: Если ты активно инвестируешь в экосистему Google и полагаешься на возможности автоматизированного поиска архитектур.
Периферийные устройства с ограниченными ресурсами: Модели нижнего уровня (d0, d1) обеспечивают предсказуемую производительность на мобильных CPU, где объем параметров является жестким ограничением.

Когда выбирать PP-YOLOE+:

Высокопроизводительные серверы GPU: Сценарии, требующие максимальной пропускной способности на оборудовании NVIDIA, такие как обработка сотен одновременных видеопотоков для умного городского видеонаблюдения.
Экосистема PaddlePaddle: Если твоя команда разработчиков уже использует платформу глубокого обучения от Baidu, интеграция PP-YOLOE+ будет бесшовной.

Link to this sectionПреимущество Ultralytics: представляем YOLO26#

Хотя EfficientDet и PP-YOLOE+ являются грозными моделями, быстрый темп инноваций в ИИ требует решений, которые предлагают как передовую производительность, так и непревзойденную простоту использования. Именно здесь Ultralytics YOLO26 превосходит остальных, утверждая себя в качестве главного выбора для современных приложений компьютерного зрения.

Выпущенная в 2026 году, YOLO26 полностью меняет представление об обнаружении объектов в реальном времени, внедряя нативный End-to-End NMS-Free Design. Исключая постобработку Non-Maximum Suppression — постоянное узкое место в старых моделях, — YOLO26 предлагает значительно более простое развертывание и снижает джиттер задержки вывода.

Кроме того, YOLO26 специально оптимизирована для периферийных развертываний. Удаление Distribution Focal Loss (DFL) упрощает процесс экспорта в такие форматы, как ONNX и TensorRT, обеспечивая до 43% более быстрый вывод на CPU по сравнению с предыдущими поколениями. Это делает её абсолютной мощью для IoT-устройств с питанием от батареи.

Стабильность обучения с MuSGD

YOLO26 включает инновационный оптимизатор MuSGD, гибрид SGD и Muon. Вдохновленный достижениями в обучении LLM, этот оптимизатор гарантирует высокую стабильность обучения и быструю сходимость, экономя ценные вычислительные часы GPU.

Разработчики также могут использовать передовые функции потерь YOLO26, включая ProgLoss + STAL, которые демонстрируют значительные улучшения в распознавании мелких объектов — критическое требование для аэрофотосъемки и приложений точного земледелия.

Link to this sectionБесшовное развертывание с Ultralytics#

Истинная сила Ultralytics заключается в единой экосистеме. В отличие от моделей, требующих сложных, специализированных скриптов обучения, YOLO26 предлагает невероятно оптимизированный API. Обучение модели на твоем собственном наборе данных требует всего несколько строк кода Python:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run an inference on a new image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

Независимо от того, требуется ли тебе стандартное обнаружение или специализированные задачи, такие как сегментация экземпляров и оценка позы, YOLO26 поддерживает их нативно с помощью многомасштабных прототипов и Residual Log-Likelihood Estimation (RLE) в рамках одного и того же удобного фреймворка.

Link to this sectionИзучение других примечательных моделей#

Если ты оцениваешь архитектуры для конкретных корпоративных требований, стоит также рассмотреть предыдущее поколение Ultralytics YOLO11, которое остается надежной, проверенной в производстве «рабочей лошадкой». Для приложений, где желательны архитектуры на основе трансформеров, RT-DETR предлагает интересную альтернативу, хотя она обычно требует больших накладных расходов памяти CUDA во время обучения по сравнению с высокоэффективными вариантами YOLO.

В заключение, в то время как EfficientDet предлагает принципиальное масштабирование, а PP-YOLOE+ обеспечивает отличную пропускную способность GPU в рамках своего специфического фреймворка, Ultralytics YOLO26 предоставляет наиболее сбалансированное, универсальное и дружелюбное к разработчикам решение из доступных сегодня. Его нативно сквозная архитектура и широкие возможности интеграции делают его рекомендуемым фундаментом для vision AI следующего поколения.

Участники

GLglenn-jocher¹⁴ SEsergiuwaxmann¹

Создано 27 янв. 2025 г.Обновлено 3 недели назад