YOLO11 против YOLOv5: всестороннее техническое сравнение архитектур Ultralytics
Выбор подходящей архитектуры нейронной сети — важнейшее решение для любого проекта в области компьютерного зрения. По мере развития искусственного интеллекта совершенствуются и инструменты, доступные разработчикам и исследователям. Это подробное руководство представляет собой глубокое техническое сравнение двух знаковых моделей из экосистемы Ultralytics: легендарной YOLOv5 и передовой YOLO11.
Независимо от того, разворачиваешь ли ты легковесные модели для приложений периферийного ИИ или обрабатываешь потоковое видео высокого разрешения на облачных GPU, понимание архитектурных нюансов, метрик производительности и идеальных сценариев использования этих моделей поможет тебе сделать выбор, основанный на данных, с учетом твоих специфических ограничений при развертывании.
Происхождение моделей и технические детали
Обе модели отражают стремление Ultralytics к сотрудничеству в рамках открытого исходного кода, высокой производительности и непревзойденной простоте использования, что делает их крайне востребованными в мировом сообществе машинного обучения.
Подробности о YOLO11
- Авторы: Гленн Джочер и Цзин Цю
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub: ultralytics/ultralytics
- Документация: Документация YOLO11
Подробности о YOLOv5
- Автор: Гленн Джочер (Glenn Jocher)
- Организация: Ultralytics
- Дата: 2020-06-26
- GitHub: ultralytics/yolov5
- Документация: Документация YOLOv5
Архитектурные различия
Эволюция от YOLOv5 к YOLO11 привнесла несколько серьезных архитектурных изменений, направленных на оптимизацию точности и эффективности параметров.
YOLOv5 стала первопроходцем в экосистеме PyTorch, представив высокооптимизированный бэкбон CSPNet (Cross Stage Partial Network) и нек PANet (Path Aggregation Network). Она опиралась на обнаружение на основе якорей (anchor-based), требующее предопределенных якорных рамок для предсказания границ объектов. Несмотря на высокую эффективность, настройка этих якорей для пользовательских наборов данных компьютерного зрения могла быть затруднительной.
В отличие от нее, YOLO11 переходит к более современной парадигме обнаружения без якорей (anchor-free). Это исключает необходимость ручной настройки якорных рамок, упрощая процесс обучения и улучшая обобщающую способность на различных наборах данных, таких как COCO dataset. Кроме того, YOLO11 оснащена разделенной «головой» (decoupled head), что означает обработку задач классификации и регрессии ограничивающих рамок в отдельных ветвях. Такое разделение значительно ускоряет сходимость и среднюю точность (mAP), особенно в сложных сценариях обнаружения объектов.
Метрики производительности и бенчмарки
В таблице ниже представлены ключевые показатели для моделей разных размеров. Модели Ultralytics славятся своими требованиями к памяти: во время обучения они обычно потребляют меньше памяти CUDA по сравнению с тяжелыми альтернативами на базе Transformer, что значительно снижает порог вхождения для оборудования.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Как видишь, YOLO11 достигает оптимального баланса производительности, неизменно демонстрируя более высокие показатели mAP при сопоставимом количестве параметров по сравнению с аналогами из линейки YOLOv5.
Методологии обучения и удобство использования
Один из ключевых принципов философии Ultralytics — исключительная простота использования, поддерживаемая хорошо развитой экосистемой и широким сообществом.
YOLOv5 исторически опиралась на надежные скрипты интерфейса командной строки (CLI) (train.py, detect.py) для выполнения задач. Хотя они мощные, их прямая интеграция в собственные Python-приложения часто требовала обходных путей.
YOLO11 произвела революцию в этом, представив оптимизированный пакет ultralytics для Python. Этот унифицированный API позволяет выполнять все действия, от обучения до экспорта моделей в такие форматы, как ONNX, OpenVINO и TensorRT, «из коробки».
Для работы в режиме «без кода» ты можешь использовать Ultralytics Platform, чтобы размечать данные, обучать модели в облаке и беспрепятственно развертывать их на периферийных устройствах.
Сравнение кода
Сегодня обучение модели Ultralytics невероятно эффективно. Вот как можно обучить YOLO11 с помощью встроенного Python API:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Export the model to ONNX for deployment
model.export(format="onnx")Для устаревших систем, использующих YOLOv5, обучение через CLI выглядит так:
# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt
python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.ptИдеальные варианты использования и реальные приложения
Обе модели обладают уникальными сильными сторонами, адаптированными под разные рабочие среды.
Когда использовать YOLOv5
Несмотря на появление нового поколения, YOLOv5 остается мощным инструментом. Мы настоятельно рекомендуем её для:
- Интеграции с устаревшими системами: среды, глубоко интегрированные со специфическими тензорными структурами или конвейерами развертывания YOLOv5, которые сложно переработать.
- Академических базовых показателей: исследователям, которым нужны устоявшиеся, проверенные временем базовые показатели для воспроизводимых академических исследований в области анализа медицинских изображений.
Когда использовать YOLO11
YOLO11 — идеальный выбор для современных производственных конвейеров благодаря своей невероятной универсальности:
- Среды с многозадачностью: в отличие от YOLOv5, которая является преимущественно детектором (с последующим добавлением сегментации), YOLO11 «из коробки» поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и обнаружение Oriented Bounding Box (OBB).
- High-Density Video Analytics: Ideal for intelligent traffic systems or retail inventory management where extracting maximum precision from complex scenes is critical.
Взгляд в будущее: архитектура YOLO26
Хотя YOLO11 является исключительным стандартом, рубеж компьютерного зрения продолжает быстро продвигаться вперед. Разработчикам, ищущим абсолютную вершину эффективности, следует также обратить внимание на новейшую Ultralytics YOLO26 (выпущена в январе 2026 года).
YOLO26 представляет собой колоссальный шаг вперед, специально разработанный как для оптимизации на периферии, так и для масштабирования на уровне предприятия. Ключевые инновации включают:
- Комплексный дизайн без NMS: YOLO26 является нативно комплексным (end-to-end), устраняя необходимость в постобработке с помощью Non-Maximum Suppression (NMS) для более быстрого и простого развертывания.
- Удаление DFL: Distribution Focal Loss была удалена для упрощения экспорта модели и повышения совместимости с маломощными устройствами.
- Оптимизатор MuSGD: инновационный гибрид SGD и Muon, который приносит стабильность обучения LLM в компьютерное зрение для более быстрой сходимости.
- До 43% более быстрый инференс на CPU: сильно оптимизировано для IoT-развертываний и устройств без выделенных GPU.
- ProgLoss + STAL: существенно улучшенные функции потерь, которые дают заметные улучшения в распознавании мелких объектов, что жизненно важно для аэрофотосъемки с дронов.
Резюме
Выбор между YOLO11 и YOLOv5 в конечном итоге зависит от стадии жизненного цикла твоего проекта. Наследие YOLOv5 неоспоримо: она предлагает экстремальную стабильность и колоссальную поддержку сообщества. Однако для любого нового проекта мы настоятельно рекомендуем YOLO11 вместо более старых поколений. Она сочетает в себе передовую точность, исключительно элегантный Python API и меньшие затраты памяти при обучении, закрепляя позицию Ultralytics в авангарде инноваций в области ИИ. Для тех, кто раздвигает границы еще дальше, изучение современной YOLO26 на Ultralytics Platform позволит достичь непревзойденных результатов.