YOLOv5 против YOLO26: Эволюция обнаружения объектов в реальном времени
Эволюция обнаружения объектов ознаменовалась значительным скачком в скорости, точности и простоте использования. В этом сравнении подробно рассматриваются YOLOv5, легендарной модели, которая сделала Vision AI доступной для всех, и YOLO26, новейшей передовой архитектуре от Ultralytics для обеспечения эффективности нового поколения и сквозной производительности.
Обе модели представляют собой поворотные моменты в истории компьютерного зрения. В то время как YOLOv5 стандарт удобства использования и принятия сообществом в 2020 году, YOLO26 переопределяет ландшафт в 2026 году с помощью сквозной архитектуры NMS, оптимизации, вдохновленной LLM, и непревзойденной CPU .
YOLOv5: фаворит сообщества
YOLOv5 был выпущен в июне 2020 года компанией Ultralytics, что ознаменовало переход к разработке PyTorch. Он прославился не только своей производительностью, но и беспрецедентной простотой использования, сделав передовые технологии компьютерного зрения доступными для разработчиков и исследователей по всему миру.
- Авторы: Гленн Джокер
- Организация:Ultralytics
- Дата: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- Документация:https://docs.ultralytics.com/models/yolov5/
Архитектура и сильные стороны
YOLOv5 оптимизированную архитектуру, ориентированную на «пользовательский опыт» ИИ. В ней использовались магистраль CSP-Darknet53 и шея Path Aggregation Network (PANet), что улучшило распространение функций в разных масштабах.
Ключевые особенности включают:
- Мозаичное увеличение данных: метод обучения, который объединяет четыре изображения в одно, значительно улучшая способность модели detect объекты и обобщать их в новых контекстах.
- Автоматическое обучение анкорных рамок: модель автоматически определяет оптимальные размеры анкорных рамок для вашего набора данных перед началом обучения.
- Простота развертывания: встроенная поддержка экспорта в такие форматы, как ONNX, CoreMLи TFLite сделали его незаменимым для мобильных и периферийных приложений.
YOLO26: новый стандарт эффективности
Выпущенная в январе 2026 года, YOLO26 основана на наследии своих предшественников, но в ней внедрены радикальные архитектурные изменения. Она разработана как окончательная модель «edge-first», в которой приоритетом является скорость CPU без ущерба для точности, достигнутой в последние годы.
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 2026-01-14
- GitHub:https://github.com/ultralytics/ultralytics
- Документы:ultralytics
Революционные функции
YOLO26 объединяет в себе несколько передовых инноваций, которые отличают его от классической YOLOv5 :
- Встроенная сквозная обработка (NMS): в отличие от YOLOv5, который требует использования алгоритма Non-Maximum Suppression (NMS) для фильтрации перекрывающихся рамок во время постобработки, YOLO26 имеет встроенную сквозную обработку. Это устраняет разброс задержек, вызванный NMS, обеспечивая стабильное время вывода, что крайне важно для систем управления в реальном времени в робототехнике и автономном вождении.
- Оптимизатор MuSGD: Вдохновленный стабильностью обучения больших языковых моделей (LLM), таких как Kimi K2 от Moonshot AI, YOLO26 использует гибридный оптимизатор, сочетающий SGD Muon. Это привносит свойства сходимости LLM в задачи зрительного восприятия.
- Удаление DFL: благодаря удалению Distribution Focal Loss (распределенная фокальная потеря) структура модели упрощается, что приводит к более чистому экспорту и лучшей совместимости с периферийными устройствами с низким энергопотреблением и ускорителями, такими как Coral Edge TPU.
- ProgLoss + STAL: Новые функции потерь (ProgLoss и STAL) обеспечивают значительное улучшение распознавания мелких объектов, что традиционно является слабым местом многих детекторов реального времени.
Баланс производительности
YOLO26 достигает замечательного баланса, обеспечивая до 43% более быстрое CPU по сравнению с предыдущими поколениями, сохраняя при этом более высокую точность. Это делает его идеальным для устройств, где GPU ограничены или недоступны.
Техническое сравнение: показатели производительности
В следующей таблице показаны различия в производительности между YOLOv5 YOLO26. Хотя YOLOv5 эффективной моделью, YOLO26 демонстрирует более высокую эффективность и точность во всех масштабах модели.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Примечание: Резкое увеличение скорости YOLO26 на CPU ONNX) обусловлено его оптимизированной архитектурой и удалением сложных этапов постобработки.
Методологии обучения и экосистема
Одним из основных преимуществ выбора Ultralytics является общая экосистема. Переход с YOLOv5 YOLO26 проходит без проблем, поскольку обе модели поддерживаются ultralytics Python и Ultralytics Platform.
Простота использования и API
Обе модели используют унифицированный API, который упрощает весь жизненный цикл ИИ. Независимо от того, используете ли вы CLI Python, синтаксис остается интуитивно понятным.
from ultralytics import YOLO
# Load a model (YOLOv5 or YOLO26)
model = YOLO("yolo26n.pt") # Switch to 'yolov5s.pt' seamlessly
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate performance
metrics = model.val()
Эффективность обучения
YOLOv5 установил планку эффективного обучения, внедрив такие функции, как «AutoBatch», для максимального GPU . YOLO26 идет еще дальше с помощью оптимизатора MuSGD. Стабилизируя динамику обучения, YOLO26 часто сходится быстрее, требуя меньшего количества эпох для достижения максимальной точности. Это означает более низкие затраты на облачные вычисления и более быстрые циклы итераций для исследователей.
Кроме того, сниженные требования YOLO26 к памяти позволяют использовать более крупные пакеты данных на потребительском оборудовании по сравнению с архитектурами, в которых широко используются трансформаторы, такими как RT-DETR.
Приложения в реальном мире
Выбор между этими моделями часто зависит от аппаратного обеспечения и конкретных требований к использованию.
Периферийные вычисления и IoT
Для приложений, работающих на Raspberry Pi или мобильных телефонах, YOLO26 является явным победителем. Благодаря ускоренной на 43 % CPU и удалению NMS , он NMS невероятную отзывчивость при выполнении таких задач, как интеллектуальное управление парковкой или сканирование инвентаря с помощью портативных устройств. Удаление Distribution Focal Loss (DFL) также упрощает преобразование в целочисленное квантование для микроконтроллеров.
Робототехника и автономные системы
В робототехнике ключевую роль играет стабильность задержки. Сквозной дизайн YOLO26 NMS гарантирует детерминированное время вывода, позволяя избежать переменного времени обработки, которое вводится NMS перегруженности сцены. Такая надежность имеет решающее значение для систем автономной навигации и предотвращения столкновений.
Поддержка устаревших систем
YOLOv5 остается надежным выбором для устаревших систем, в которых конвейер развертывания уже жестко определен вокруг YOLOv5 (например, определенные tensor , ожидаемые старыми битовыми потоками FPGA). Благодаря массовой поддержке сообщества и многолетним испытаниям в реальных условиях, решения практически для любых крайних случаев легко доступны на форумах и в GitHub.
Универсальность: за пределами обнаружения
В то время как YOLOv5 для поддержки сегментации в более поздних версиях (v7.0), YOLO26 был создан с нуля как многозадачный обучающийся алгоритм.
- Сегментация экземпляров: YOLO26 включает в себя усовершенствования для конкретных задач, такие как потеря семантической сегментации и многомасштабные прото-модули, что повышает качество масок для таких задач, как анализ медицинских изображений.
- Оценка позы: благодаря оценке остаточной логарифмической вероятности (RLE) YOLO26 обеспечивает превосходную точность определения ключевых точек для оценки позы человека в спортивной аналитике.
- Ориентированные ограничительные рамки (OBB): для аэрофотоснимков и спутниковых данных специализированная угловая потери YOLO26 решает проблемы с границами, часто возникающие при обнаружении повернутых объектов, что делает его превосходным для задач OBB.
Заключение
Как YOLOv5 YOLO26 являются примером Ultralytics сделать ИИ простым, быстрым и точным. YOLOv5 остается классическим, надежным инструментом, широко используемым в отрасли. Однако для новых проектов в 2026 году YOLO26 предлагает привлекательный путь обновления.
Благодаря конструкцииNMS, оптимизатору MuSGD и исключительной CPU , YOLO26 — это не просто постепенное обновление, а настоящий прорыв в области передовых технологий искусственного интеллекта. Объединив функции обнаружения, сегментации, определения позы и классификации в единую эффективную платформу, Ultralytics разработчикам лучшие инструменты для решения задач компьютерного зрения завтрашнего дня уже сегодня.
Для разработчиков, заинтересованных в изучении других современных архитектур, YOLO11 также предлагает отличную производительность, хотя YOLO26 остается лучшим выбором благодаря балансу скорости и функций нового поколения.