YOLOv5 против YOLO26: Поколенческий скачок в обнаружении объектов в реальном времени.
Эволюция компьютерного зрения определяется постоянным стремлением к созданию более быстрых, точных и доступных моделей. Сравнивая Ultralytics YOLOv5 с передовой Ultralytics YOLO26, мы видим смену парадигмы, которая преодолевает разрыв между надежными устаревшими системами и передовыми решениями современного развертывания ИИ.
Это руководство предоставляет всесторонний технический анализ обеих архитектур, подчеркивая их метрики производительности, структурные различия и идеальные сценарии развертывания.
Обзоры моделей
YOLOv5: Рабочая лошадка индустрии
Выпущенный в 2020 году, YOLOv5 произвёл революцию в доступности обнаружения объектов. Мигрировав архитектуру нативно в фреймворк PyTorch, он предоставил разработчикам беспрецедентный опыт "от нуля до героя".
- Авторы: Гленн Джокер
- Организация:Ultralytics
- Дата: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- Документация:Документация YOLOv5
YOLOv5 заложил основу для активно поддерживаемой экосистемы Ultralytics. Он представил агрессивные методы аугментации данных, эффективные циклы обучения и высокооптимизированные пути экспорта в периферийные форматы, такие как CoreML и ONNX. Его простота использования и низкие требования к памяти во время обучения сделали его основным инструментом для стартапов и исследователей по всему миру.
YOLO26: Стандарт Vision AI следующего поколения
Перенесемся в январь 2026 года: Ultralytics YOLO26 представляет собой вершину ИИ для зрения в реальном времени. Он нативно интегрирует уроки, извлеченные из промежуточных поколений, таких как YOLOv8 и YOLO11, одновременно внедряя значительные прорывы, вдохновленные обучением больших языковых моделей (LLM).
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 2026-01-14
- GitHub:https://github.com/ultralytics/ultralytics
- Документация:Документация YOLO26
YOLO26 устанавливает новый стандарт баланса производительности, предлагая передовую точность и будучи специально разработанным для доминирования в сценариях периферийных вычислений.
Другие модели Ultralytics
Если вы мигрируете со старой кодовой базы, вам также может быть интересно сравнить YOLOv5 с YOLO11 — моделью предыдущего поколения, которая представила первоначальную поддержку различных задач, таких как оценка позы (Pose Estimation) и ориентированные ограничивающие рамки (OBB).
Архитектурные прорывы в YOLO26
В то время как YOLOv5 полагается на детекционные головы на основе якорей и стандартные функции потерь, YOLO26 полностью перерабатывает внутреннюю механику для устранения узких мест развертывания.
- Сквозная архитектура без NMS: Наиболее существенное отличие — это изначально сквозная архитектура YOLO26. В отличие от YOLOv5, который требует ручного подавления немаксимумов (NMS) для фильтрации избыточных ограничивающих рамок, YOLO26 полностью исключает этот этап постобработки. Это обеспечивает детерминированную задержку инференса и значительно упрощает интеграцию в C++ или встраиваемое оборудование.
- Удаление DFL: YOLO26 удаляет Distribution Focal Loss (DFL). Это архитектурное решение значительно упрощает экспорт модели и повышает совместимость с маломощными периферийными устройствами и микроконтроллерами, которые часто испытывают трудности со сложными операторами.
- MuSGD Optimizer: Вдохновленный Kimi K2 от Moonshot AI, YOLO26 использует оптимизатор MuSGD, гибрид SGD и Muon. Это переносит стабильность и быструю сходимость, наблюдаемые при обучении LLM, в компьютерное зрение, что приводит к снижению потребления памяти и ускорению циклов обучения по сравнению с моделями, интенсивно использующими трансформеры.
- ProgLoss + STAL: YOLO26 использует сложные функции ProgLoss и STAL, значительно улучшая его способность detect мелкие и плотные объекты — историческую проблему для YOLOv5.
Сравнение производительности
При сравнении моделей на наборе данных COCO YOLO26 демонстрирует значительные улучшения в точности (mAP), одновременно сокращая количество параметров и увеличивая скорость инференса на CPU.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Примечание: YOLO26 Nano (YOLO26n) достигает впечатляющего mAP в 40.9 по сравнению с 28.0 mAP у YOLOv5n, при этом обеспечивая до 43% более быструю инференцию на CPU благодаря удалению DFL и отсутствию NMS в головной части.
Универсальность и поддержка задач
YOLOv5 в первую очередь известен своим detect объектов. Хотя более поздние обновления представили базовую segmentation, YOLO26 был разработан с нуля как унифицированный многозадачный движок.
YOLO26 изначально поддерживает:
- Сегментация экземпляров: С использованием многомасштабных прототипов, специфичных для задачи, и функции потерь семантической сегментации.
- Оценка позы: Использование оценки остаточного логарифмического правдоподобия (RLE) для высокоточного detect ключевых точек.
- Ориентированные ограничивающие рамки (OBB): Включает специализированную функцию потерь угла для решения проблем разрыва границ, что критически важно для анализа спутниковых изображений.
- Классификация изображений: Стандартная категоризация изображений целиком.
Интеграция в экосистему
Обе модели выигрывают от платформы Ultralytics, обеспечивая бесшовную аннотацию данных, автоматическую настройку гиперпараметров и развертывание в облаке в один клик. Однако YOLO26 в полной мере использует современные структуры API.
Примеры использования и кода
Ultralytics Python API делает переключение между моделями невероятно простым. Поскольку обе модели используют одну и ту же хорошо поддерживаемую экосистему, обновление устаревшего конвейера YOLOv5 до YOLO26 требует лишь изменения файла весов.
Пример на Python
from ultralytics import YOLO
# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")
# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=32, # YOLO26's low memory footprint allows larger batch sizes
)
# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
Пример CLI
Вы можете развернуть YOLO26 непосредственно через командную строку, используя интеграцию с TensorRT для максимальной пропускной способности GPU:
# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine
# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4
Идеальные варианты использования
Когда стоит выбрать YOLO26
Для любого современного проекта компьютерного зрения YOLO26 является бесспорной рекомендацией.
- Периферийный ИИ и IoT: Его на 43% более быстрый вывод на CPU и удаление DFL делают его идеальным для развертывания на Raspberry Pi или мобильных устройствах.
- Высокоскоростные конвейеры: Архитектура без NMS обеспечивает стабильную, предсказуемую задержку, что критически важно для автономной робототехники и систем охранной сигнализации реального времени.
- Сложные сценарии: Если ваше приложение требует отслеживания (track) мелких объектов (например, мониторинг дронами) или вращающихся объектов (OBB), расширенные функции потерь YOLO26 (ProgLoss + STAL) обеспечивают значительное преимущество в точности.
Когда следует выбирать YOLOv5
- Устаревшие системы: Если ваша производственная среда имеет жестко закодированные зависимости от специфической генерации якорей YOLOv5 или логики парсинга NMS, миграция может потребовать короткого периода рефакторинга.
- Конкретные академические эталоны: Исследователи часто используют YOLOv5 в качестве классического эталона для демонстрации исторического развития архитектур detect объектов.
Обзор
Переход от YOLOv5 к YOLO26 — это не просто итеративное обновление; это фундаментальный скачок в том, как обучаются и развертываются модели object detect. Используя оптимизатор MuSGD, отказываясь от сложной постобработки благодаря NMS-free архитектуре и значительно ускоряя скорости CPU, Ultralytics YOLO26 обеспечивает бескомпромиссный баланс скорости и точности.
Хотя YOLOv5 всегда будет помниться как модель, которая демократизировала ИИ для компьютерного зрения, разработчики, стремящиеся создавать надежные, готовые к производству и перспективные приложения, должны уверенно строить их на основе YOLO26.