Link to this sectionEfficientDet против YOLOv7#
Выбор наиболее эффективной архитектуры нейронной сети имеет решающее значение для успеха любой инициативы в области компьютерного зрения. Поскольку спрос на высокопроизводительные решения на базе ИИ растет, сравнение таких признанных моделей, как EfficientDet и YOLOv7, становится необходимым для разработчиков, стремящихся оптимизировать точность и вычислительную эффективность.
Этот подробный технический анализ исследует архитектурные нюансы, показатели производительности и идеальные сценарии развертывания для обеих моделей. Кроме того, мы покажем, почему интегрированная экосистема, предоставляемая Ultralytics — кульминацией которой является современная Ultralytics YOLO26 — предлагает превосходную альтернативу для современных задач компьютерного зрения.
Link to this sectionПонимание EfficientDet#
EfficientDet была разработана для максимизации точности при систематическом управлении вычислительными затратами в различных ресурсных ограничениях. Она достигла этого благодаря новому подходу к масштабированию и объединению признаков.
Подробности EfficientDet:
Авторы: Mingxing Tan, Ruoming Pang и Quoc V. Le
Организация: Google
Дата: 2019-11-20
Arxiv: EfficientDet: Scalable and Efficient Object Detection
GitHub: Репозиторий Google AutoML
Link to this sectionАрхитектура и инновации#
По своей сути EfficientDet использует двунаправленную пирамидальную сеть признаков (BiFPN). В отличие от традиционных FPN, BiFPN позволяет легко и быстро объединять многомасштабные признаки за счет введения обучаемых весов для определения важности различных входных признаков. Это сочетается с методом составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину бэкбона, сети признаков и сетей предсказания рамок/классов одновременно.
Link to this sectionСильные и слабые стороны#
EfficientDet обладает высокой масштабируемостью. Ее меньшие варианты (d0-d2) чрезвычайно эффективны с точки зрения параметров, что делает их подходящими для сред со строгими ограничениями памяти. Более крупные варианты (например, d7) расширяют границы средней точности (mAP) для высокопроизводительной офлайн-обработки.
Тем не менее, EfficientDet сильно зависит от устаревших реализаций TensorFlow и сложных конвейеров AutoML. Эта унаследованная инфраструктура делает ее крайне сложной для интеграции в современные рабочие процессы, ориентированные на PyTorch. Кроме того, она страдает от значительной задержки вывода на периферийных устройствах при масштабировании до вариантов с более высокой точностью.
Link to this sectionПонимание YOLOv7#
YOLOv7, представленная в 2022 году, совершила огромный скачок в скорости и точности для приложений реального времени, установив новую базовую линию для широко популярного семейства YOLO на тот момент.
Подробности YOLOv7:
Авторы: Chien-Yao Wang, Alexey Bochkovskiy и Hong-Yuan Mark Liao
Организация: Institute of Information Science, Academia Sinica, Taiwan
Дата: 2022-07-06
Arxiv: YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
GitHub: Официальный репозиторий YOLOv7
Link to this sectionАрхитектура и инновации#
YOLOv7 представила расширенную сеть агрегации эффективных слоев (E-ELAN). Это архитектурное улучшение повышает обучающую способность сети, не разрушая исходный градиентный путь, что позволяет модели эффективно изучать более разнообразные признаки. Кроме того, она реализует «обучаемый набор бесплатных методов» (trainable bag-of-freebies), используя такие техники, как плановая репараметризация и динамическое назначение меток для повышения точности без увеличения стоимости вывода.
Link to this sectionСильные и слабые стороны#
YOLOv7 превосходно работает в сценариях реального времени, таких как видеоаналитика и высокоскоростная роботизированная навигация. Она исключительно хорошо масштабируется на серверных GPU и предлагает нативную реализацию PyTorch, что делает ее доступной для академических исследователей.
Несмотря на впечатляющую скорость, YOLOv7 по-прежнему полагается на немаксимальное подавление (NMS) для постобработки, что может вызывать переменные задержки в переполненных сценах. Кроме того, потребление памяти во время обучения заметно больше, чем у новых поколений, что требует более мощного оборудования для обработки больших размеров пакетов (batch sizes).
Link to this sectionСравнение производительности и метрик#
При сравнении этих моделей важно изучить компромиссы между точностью, скоростью вывода и размером параметров. Ниже представлена подробная оценка различных конфигураций EfficientDet и YOLOv7.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
В то время как EfficientDet-d7 достигает наивысшего mAP, она требует почти 128 мс на GPU T4. В резком контрасте, YOLOv7x достигает сопоставимых 53.1 mAP при невероятно быстрых 11.57 мс, демонстрируя огромный поколенческий скачок в вычислительной эффективности для развертываний в реальном времени.
Link to this sectionСценарии использования и рекомендации#
Выбор между EfficientDet и YOLOv7 зависит от конкретных требований твоего проекта, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда стоит выбрать EfficientDet#
EfficientDet — отличный выбор, если:
- Конвейеры Google Cloud и TPU: Системы с глубокой интеграцией в Google Cloud Vision API или инфраструктуру TPU, где EfficientDet имеет встроенную оптимизацию.
- Исследования составного масштабирования: Академическое тестирование, сфокусированное на изучении эффектов сбалансированного масштабирования глубины, ширины и разрешения сети.
- Мобильного развертывания через TFLite: Проектов, которые требуют экспорта в TensorFlow Lite специально для Android или встраиваемых устройств на базе Linux.
Link to this sectionКогда выбирать YOLOv7#
YOLOv7 рекомендуется для:
- Академического бенчмаркинга: воспроизведение результатов уровня state-of-the-art 2022 года или изучение эффектов E-ELAN и методов trainable bag-of-freebies.
- Исследований репараметризации: изучение плановых репараметризованных сверток и стратегий составного масштабирования моделей.
- Существующих кастомных конвейеров: проектов с сильно модифицированными конвейерами, построенными вокруг специфической архитектуры YOLOv7, которые нельзя легко переработать.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionПреимущество Ultralytics#
Выбор правильной архитектуры выходит за рамки просто сухих метрик; он включает в себя оценку всего жизненного цикла машинного обучения. Экосистема Ultralytics предоставляет непревзойденный опыт для разработчика, значительно снижая барьер входа для надежных развертываний ИИ.
- Простота использования: Ultralytics предоставляет высокоунифицированный Python API. Ты можешь обучать, проверять и экспортировать модели всего в несколько строк кода, избавляясь от необходимости управлять сложными, фрагментированными кодовыми базами, типичными для EfficientDet.
- Хорошо поддерживаемая экосистема: получая пользу от быстрых обновлений, обширной документации и активного сообщества, Ultralytics обеспечивает совместимость с новейшими фреймворками развертывания, такими как TensorRT и OpenVINO.
- Требования к памяти: используя высокооптимизированные загрузчики данных PyTorch и упрощенные структуры сетей, модели Ultralytics YOLO требуют значительно меньше памяти CUDA во время обучения по сравнению с многоветвевыми сетями и моделями, перегруженными трансформерами.
- Универсальность: в отличие от старых архитектур, жестко привязанных к детекции ограничивающими рамками, модели Ultralytics — это многозадачные системы, поддерживающие сегментацию экземпляров, оценку позы и ориентированные ограничивающие рамки (OBB).
Link to this sectionЭффективность обучения с Ultralytics#
Следующий код демонстрирует простоту обучения современной модели с использованием пакета Ultralytics Python, что резко контрастирует с настройкой устаревших конвейеров TensorFlow.
from ultralytics import YOLO
# Load the highly recommended YOLO26 model
model = YOLO("yolo26s.pt")
# Train the model automatically handling hyperparameter tuning and augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the model to TensorRT for deployment
model.export(format="engine")Link to this sectionНовый стандарт: YOLO26#
Хотя YOLOv7 и EfficientDet заложили основу для современного компьютерного зрения, ландшафт радикально изменился с появлением Ultralytics YOLO26 в январе 2026 года. Разработанная как для экстремальной точности, так и для непревзойденной производительности на периферии, YOLO26 является окончательной рекомендацией для всех новых проектов в области компьютерного зрения.
Link to this sectionКлючевые инновации YOLO26#
- End-to-end дизайн без NMS: основываясь на достижениях YOLOv10, YOLO26 является нативно end-to-end решением. Полностью устраняя постобработку немаксимального подавления (NMS), она обеспечивает меньшую и более стабильную задержку, что критически важно для систем, где важна безопасность, например, в автономном вождении.
- До 43% быстрее при выводе на CPU: благодаря удалению Distribution Focal Loss (DFL), YOLO26 отличается кардинально упрощенным процессом экспорта и беспрецедентной скоростью на периферийных устройствах, таких как Raspberry Pi, что делает ее безоговорочным лидером периферийных вычислений.
- Оптимизатор MuSGD: YOLO26 включает революционный оптимизатор MuSGD — гибрид SGD и Muon, вдохновленный инновациями в обучении LLM от Moonshot AI. Это приводит к удивительно стабильной динамике обучения и гораздо более высокой скорости сходимости.
- ProgLoss + STAL: интеграция Progressive Loss и Scale-Targeted Alignment Loss значительно улучшает способность модели обнаруживать крошечные объекты, решая огромную проблему для дронов и систем охранной сигнализации.
- Специфические для задач улучшения: YOLO26 — это не просто детектор. Она включает функцию семантической сегментации и мультимасштабные прототипы для безупречной сегментации, Residual Log-Likelihood Estimation (RLE) для сверхточной оценки позы и специализированную потерю угла для решения неоднозначностей границ OBB.
Link to this sectionИзучение альтернативных моделей#
Хотя YOLO26 представляет собой вершину современных технологий, экосистема Ultralytics поддерживает множество моделей, адаптированных для различных вариантов использования.
Для разработчиков, управляющих устаревшими системами, которые все еще требуют традиционного безъякорного масштабирования, YOLO11 остается надежным и хорошо поддерживаемым вариантом в рамках платформы Ultralytics. Кроме того, для сценариев, явно требующих архитектур на основе трансформеров, RT-DETR предлагает детектирование в реальном времени с использованием vision transformers, преодолевая разрыв между высокоуровневыми механизмами внимания и скоростью выполнения в реальном времени.
В заключение, хотя EfficientDet дает академическое понимание составного масштабирования, а YOLOv7 предлагает хорошую базовую производительность в реальном времени, современные предприятия лучше всего справляются с задачами, переходя на платформу Ultralytics. Используя YOLO26, команды могут обеспечить максимальную производительность, минимальные трудности при обучении и подготовить свои ИИ-развертывания к будущему.