YOLO11 vs YOLOv5: Всестороннее техническое сравнение архитектур Ultralytics
Выбор правильной архитектуры нейронной сети является ключевым решением для любой инициативы в области компьютерного зрения. По мере развития ландшафта искусственного интеллекта развиваются и инструменты, доступные разработчикам и исследователям. Это всестороннее руководство содержит углубленное техническое сравнение двух знаковых моделей из экосистемы Ultralytics: широко известной YOLOv5 и передовой YOLO11.
Независимо от того, развертываете ли вы легковесные модели для приложений граничного ИИ или обрабатываете видеопотоки высокого разрешения на облачных GPU, понимание архитектурных нюансов, метрик производительности и идеальных вариантов использования этих моделей обеспечит вам принятие обоснованного выбора для ваших конкретных ограничений развертывания.
Происхождение модели и технические подробности
Обе модели отражают приверженность Ultralytics открытому сотрудничеству, надежной производительности и беспрецедентной простоте использования, что делает их весьма популярными в мировом сообществе машинного обучения.
Детали YOLO11
- Авторы: Гленн Джочер и Цзин Цю
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub: ultralytics/ultralytics
- Документация: Документация YOLO11
Подробности о YOLOv5
- Автор: Гленн Джочер
- Организация: Ultralytics
- Дата: 26.06.2020
- GitHub: ultralytics/yolov5
- Документация: Документация YOLOv5
Архитектурные различия
Эволюция от YOLOv5 к YOLO11 представляет несколько глубоких архитектурных изменений, разработанных для оптимизации точности и эффективности параметров.
YOLOv5 был первопроходцем в экосистеме PyTorch, представив высокооптимизированный бэкбон CSPNet (Cross Stage Partial Network) и шейку PANet (Path Aggregation Network). Он полагался на якорное обнаружение, которое требовало предопределенных якорных боксов для предсказания границ объектов. Хотя это было очень эффективно, настройка этих якорей для пользовательских наборов данных компьютерного зрения могла быть трудоемкой.
В отличие от этого, YOLO11 переходит к более современной, безъякорной парадигме обнаружения. Это устраняет необходимость в ручной настройке якорных боксов, оптимизируя процесс обучения и улучшая обобщающую способность на различных наборах данных, таких как набор данных COCO. Кроме того, YOLO11 имеет разделенную голову, что означает, что задачи классификации и регрессии ограничивающих рамок обрабатываются в отдельных ветвях. Такое разделение значительно улучшает скорость сходимости и среднюю точность (mAP), особенно для сложных сценариев обнаружения объектов.
Метрики производительности и тесты
В таблице ниже сопоставляются ключевые метрики для различных размеров моделей. Модели Ultralytics известны своими требованиями к памяти, обычно потребляя меньше памяти CUDA во время обучения по сравнению с тяжелыми альтернативами на основе трансформеров, что значительно снижает аппаратный барьер для входа.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Как видно, YOLO11 достигает весьма благоприятного баланса производительности, последовательно обеспечивая более высокие показатели mAP при сопоставимом количестве параметров по сравнению со своими аналогами YOLOv5.
Методологии обучения и удобство использования
Ключевой принцип философии Ultralytics заключается в исключительной простоте использования, поддерживаемой хорошо развитой экосистемой и обширной поддержкой сообщества.
YOLOv5 исторически полагался на надежные скрипты интерфейса командной строки (CLI) (train.py, detect.py) для выполнения. Хотя эти скрипты мощны, их прямая интеграция в пользовательские приложения на python часто требовала обходных решений.
YOLO11 революционизировал это, представив оптимизированный ultralytics Пакет python. Этот унифицированный API обрабатывает все, от обучения до экспорт моделей такие форматы, как ONNX, OpenVINOи TensorRT нативно.
Оптимизированное развертывание с платформой Ultralytics
Для полностью беcкодовой работы разработчики могут использовать платформу Ultralytics для аннотирования данных, обучения моделей в облаке и их бесшовного развертывания на периферийных устройствах.
Сравнение кода
Обучение модели Ultralytics сегодня невероятно эффективно. Вот как вы можете обучить YOLO11, используя его нативный Python API:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Export the model to ONNX for deployment
model.export(format="onnx")
Для устаревших систем, использующих YOLOv5, обучение через CLI выглядит так:
# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt
python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.pt
Идеальные варианты использования и практические применения
Обе модели обладают отличительными сильными сторонами, адаптированными к различным операционным средам.
Когда применять YOLOv5
Несмотря на появление нового поколения, YOLOv5 остается мощным инструментом. Он настоятельно рекомендуется для:
- Интеграция с устаревшими системами: Среды, глубоко интегрированные со специфическими tensor структурами YOLOv5 или конвейерами развертывания, которые не могут быть легко рефакторизированы.
- Academic Baselines: Исследователи, которым нужны устоявшиеся, давние эталоны для воспроизводимых академических исследований в области анализа медицинских изображений.
Когда применять YOLO11
YOLO11 представляет собой идеальный выбор для современных производственных конвейеров благодаря своей невероятной универсальности:
- Многозадачные среды: В отличие от YOLOv5, который в основном является детектором (с последующими дополнениями для сегментации), YOLO11 изначально поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и обнаружение ориентированных ограничивающих рамок (OBB) "из коробки".
- Видеоаналитика высокой плотности: Идеально подходит для интеллектуальных транспортных систем или управления запасами в розничной торговле, где извлечение максимальной точности из сложных сцен имеет решающее значение.
Взгляд в будущее: Архитектура YOLO26
Хотя YOLO11 является исключительным стандартом, граница компьютерного зрения продолжает быстро развиваться. Разработчикам, ищущим абсолютную вершину эффективности, также следует рассмотреть новейший Ultralytics YOLO26 (выпущенный в январе 2026 года).
YOLO26 представляет собой значительный шаг вперед, специально разработанный как для оптимизации на периферийных устройствах, так и для корпоративного масштаба. Ключевые инновации включают:
- Сквозная архитектура без NMS: YOLO26 изначально является сквозной, устраняя постобработку методом Non-Maximum Suppression (NMS) для более быстрого и простого развертывания.
- Удаление DFL: Distribution Focal Loss была удалена для упрощенного экспорта модели и улучшенной совместимости с маломощными устройствами.
- Оптимизатор MuSGD: Новаторский гибрид SGD и Muon, привносящий стабильность обучения LLM в компьютерное зрение для более быстрой сходимости.
- До 43% более быстрый инференс на CPU: Значительно оптимизирован для развертываний IoT и устройств без выделенных GPU.
- ProgLoss + STAL: Значительно улучшенные функции потерь, обеспечивающие заметные улучшения в распознавании мелких объектов, что крайне важно для аэрофотосъемки с дронов.
Обзор
Выбор между YOLO11 и YOLOv5 в конечном итоге зависит от стадии жизненного цикла вашего проекта. Наследие YOLOv5 неоспоримо, предлагая исключительную стабильность и мощную поддержку сообщества. Однако для любого нового проекта YOLO11 настоятельно рекомендуется по сравнению со старыми поколениями. Он сочетает в себе передовую точность, исключительно элегантный Python API и более низкие накладные расходы на память при обучении, закрепляя позицию Ultralytics в авангарде инноваций в области ИИ. Для тех, кто стремится расширить границы еще дальше, изучение передового YOLO26 на Ultralytics Platform принесет беспрецедентные результаты.