Link to this sectionYOLOv9 против YOLOv5#
Область компьютерного зрения переживает стремительный рост, а детектирование объектов служит основой для бесчисленных промышленных и исследовательских приложений. Выбор подходящей архитектуры часто требует тщательной оценки среднего значения точности (mAP), скорости инференса и потребления памяти. В этом сравнении мы рассматриваем две крайне влиятельные модели: YOLOv9, известную своими архитектурными прорывами в сохранении градиентной информации, и Ultralytics YOLOv5 — проверенный в боях отраслевой стандарт, известный своей невероятной простотой использования и непревзойденной универсальностью при развертывании.
Link to this sectionАрхитектурные инновации и техническое происхождение#
Понимание базовых механизмов работы этих двух моделей дает критически важный контекст для оценки их профилей производительности.
Link to this sectionYOLOv9: программируемая градиентная информация#
Разработанная исследователями Чиен-Яо Ваном и Хонг-Юань Марком Ляо из Института информационных наук Academia Sinica на Тайване, YOLOv9 была выпущена 21 февраля 2024 года. Модель представляет две прорывные концепции для устранения «узкого места» информации, типичного для глубоких нейронных сетей: программируемую градиентную информацию (PGI) и обобщенную сеть агрегации эффективных слоев (GELAN).
Используя PGI, YOLOv9 гарантирует, что жизненно важная информация сохраняется на протяжении всего процесса прямого распространения, что ведет к высокоточным обновлениям градиентов. Тем временем архитектура GELAN максимизирует эффективность параметров, позволяя модели достигать передовой точности с удивительно низкими вычислительными затратами. Ты можешь изучить технические детали в официальной статье YOLOv9 на Arxiv или посмотреть репозиторий YOLOv9 на GitHub.
Link to this sectionUltralytics YOLOv5: производственный стандарт#
Созданная Гленном Джочером и выпущенная Ultralytics 26 июня 2020 года, YOLOv5 совершила революцию в доступности компьютерного зрения. Будучи одной из первых моделей детектирования объектов, построенных нативно на фреймворке PyTorch, она обошла сложности старого C-фреймворка Darknet. YOLOv5 использует высокооптимизированный бэкбон CSPNet и «шею» PANet, уделяя приоритетное внимание плавному балансу между скоростью и точностью.
Однако ее главное достижение — интеграция в более широкую экосистему Ultralytics. YOLOv5 сильно оптимизирована для быстрой эффективности обучения и сред с низким объемом памяти, что делает ее невероятно стабильной для развертывания на периферийных устройствах (edge).
При оценке моделей для периферийных устройств помни, что модели Ultralytics YOLO обычно требуют значительно меньше памяти GPU как во время обучения, так и во время инференса по сравнению с тяжелыми архитектурами на базе Transformer.
Link to this sectionАнализ производительности: скорость против точности#
При проектировании конвейера компьютерного зрения разработчикам необходимо взвесить компромиссы между точностью и задержкой. В следующей таблице проиллюстрированы различия в производительности на стандартном датасете COCO.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Link to this sectionАнализ компромиссов#
YOLOv9 устанавливает абсолютное доминирование в «сырой» точности. YOLOv9e раздвигает границы mAP до 55,6%, используя слои GELAN для сохранения мелкозернистых деталей. Это делает ее исключительным выбором для медицинской визуализации или сценариев, требующих строгой точности при работе с мелкими объектами.
Напротив, YOLOv5 сияет своей высокой скоростью развертывания и аппаратной гибкостью. YOLOv5n (Nano) знаменита своей легкостью, выполняя инференс всего за 1,12 мс на GPU T4 через TensorRT. Если ты развертываешь решение на ограниченных устройствах IoT, мобильных телефонах или Raspberry Pi, то объем памяти YOLOv5 делает ее чрезвычайно надежной.
Link to this sectionПреимущества экосистемы Ultralytics#
Важный фактор при выборе модели — окружающая программная экосистема. Хотя YOLOv9 предоставляет лучшие исследовательские бенчмарки, использование обеих моделей через современный Python API от Ultralytics устраняет разрыв, предлагая разработчикам единый и оптимизированный опыт.
Link to this sectionПростота использования и экспорт#
Ultralytics абстрагирует сложные инженерные препятствия. Такие функции, как автоматическая аугментация данных и настройка гиперпараметров, работают «из коробки». Перенос моделей в продакшн столь же тривиален благодаря встроенным командам экспорта для конвертации моделей в форматы ONNX, OpenVINO или TFLite.
Link to this sectionУниверсальность задач#
Хотя обе модели отлично справляются с детектированием объектов, современные модели Ultralytics созданы для решения множества задач компьютерного зрения. Более широкий фреймворк обеспечивает нативную поддержку классификации изображений, сегментации экземпляров, оценки позы и ориентированных ограничивающих рамок (OBB), позволяя разработчикам решать несколько задач зрения без переключения кодовых баз.
Link to this sectionСценарии использования и рекомендации#
Выбор между YOLOv9 и YOLOv5 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда стоит выбрать YOLOv9#
YOLOv9 — отличный выбор для:
- Исследований информационных узких мест: Академические проекты по изучению архитектур Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).
- Изучения оптимизации потока градиентов: Исследования, направленные на понимание и смягчение потери информации в глубоких слоях сети во время обучения.
- Бенчмаркинга обнаружения высокой точности: Сценарии, где высокие показатели производительности YOLOv9 в бенчмарке COCO необходимы в качестве точки отсчета для архитектурных сравнений.
Link to this sectionКогда стоит выбрать YOLOv5#
YOLOv5 рекомендуется для:
- Проверенных производственных систем: существующих развертываний, где ценятся долгая история стабильности YOLOv5, обширная документация и огромная поддержка сообщества.
- Обучения с ограниченными ресурсами: сред с ограниченными ресурсами GPU, где эффективный конвейер обучения YOLOv5 и более низкие требования к памяти являются преимуществом.
- Обширной поддержки форматов экспорта: проектов, требующих развертывания во многих форматах, включая ONNX, TensorRT, CoreML и TFLite.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionПример реализации#
Прелесть экосистемы Ultralytics в том, что ты можешь переключаться между моделью YOLOv5 и YOLOv9, просто изменив строку весов.
from ultralytics import YOLO
# Load a pretrained YOLOv9 model (swap to "yolov5s.pt" to use YOLOv5)
model = YOLO("yolov9c.pt")
# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on new images
predictions = model.predict("https://ultralytics.com/images/zidane.jpg")
# Export to ONNX for seamless deployment
model.export(format="onnx")Link to this sectionИзучение более новых архитектур#
Хотя YOLOv5 и YOLOv9 — отличные модели с уникальными преимуществами, область продолжает развиваться. Пользователям, изучающим новые проекты, также стоит оценить последние итерации от Ultralytics.
- YOLO11: мощная, доработанная эволюция линейки YOLOv8, предлагающая отличный баланс скорости и точности для всех задач компьютерного зрения.
- YOLO26: выпущенная в 2026 году, YOLO26 — лучшая рекомендация для современных конвейеров. Она представляет дизайн без NMS (End-to-End NMS-Free), полностью устраняя «бутылочное горлышко» постобработки. Благодаря удалению DFL (Distribution Focal Loss удален для упрощения экспорта и лучшей совместимости с периферийными/маломощными устройствами), она достигает на 43% более быстрого инференса на CPU. Стабильность обучения значительно повышена за счет нового оптимизатора MuSGD, а ProgLoss + STAL обеспечивают улучшенные функции потерь с заметными улучшениями в распознавании мелких объектов, что критически важно для IoT, робототехники и аэрофотосъемки, делая ее самой надежной архитектурой как для периферийного, так и для облачного развертывания.
Для команд, управляющих большими датасетами и сложными конвейерами развертывания, использование платформы Ultralytics предлагает решение без написания кода (no-code), чтобы без усилий обучать, отслеживать и развертывать эти передовые модели.