YOLOv6.0 против YOLOv10: эволюция обнаружения объектов в реальном времени
Область обнаружения объектов характеризуется быстрыми инновациями, где архитектурные прорывы постоянно переопределяют границы скорости и точности. Двумя важными вехами на этом пути являются YOLOv6.YOLOv6, модель, разработанная для промышленного применения, и YOLOv10, академический прорыв, ориентированный на сквозную эффективность.
В то время как YOLOv6. YOLOv6 делал акцент на пропускной способности на специализированном оборудовании за счет квантования и TensorRT , YOLOv10 парадигмальный сдвиг, устранив Non-Maximum Suppression (NMS) для снижения задержки. В этом сравнении рассматриваются их технические архитектуры, показатели производительности и идеальные варианты использования, чтобы помочь разработчикам выбрать подходящий инструмент для своих проектов в области компьютерного зрения.
Сравнение метрик производительности
В следующей таблице показаны различия в производительности двух архитектур для различных масштабов моделей. Хотя YOLOv6. YOLOv6 демонстрирует высокие результаты, новые оптимизации архитектуры в YOLOv10 обеспечивают более высокое соотношение точности и параметров.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv6.0: промышленная рабочая лошадка
YOLOv6.YOLOv6 был разработан с единственной целью: максимально увеличить пропускную способность в промышленных средах. Разработанный Meituan, ведущей платформой электронной коммерции в Китае, он ориентирован на развертывание на специальном GPU .
Авторы: Чуй Ли, Лулу Ли, Ифэй Гэн и др.
Организация: Meituan
Дата: 13.01.2023
Arxiv: YOLOv6 .0: полномасштабная перезагрузка
GitHub: YOLOv6 Meituan YOLOv6
Архитектура и сильные стороны
YOLOv6 базовую структуру в стиле VGG, известную как EfficientRep, которая очень удобна для моделей доступа GPU . Его ключевая инновация заключается в глубокой интеграции с Quantization-Aware Training (QAT) и дистилляцией. Это позволяет модели сохранять высокую точность даже при квантовании до INT8, что является критически важной функцией для развертывания на периферийных устройствах с аппаратными ускорителями, такими как NVIDIA TensorRT.
Обновление «v3.0» внедрило двунаправленное слияние (BiFusion) в шее, улучшив интеграцию функций по всем масштабам. Это делает его особенно эффективным для обнаружения объектов разного размера в замусоренных промышленных сценах, таких как сегментация упаковок или автоматический контроль качества.
Промышленная оптимизация
YOLOv6 значительной степени YOLOv6 для парадигмы «Rep» (репараметризация). Во время обучения модель использует многоветвленные блоки для лучшего потока градиента, но во время вывода они объединяются в одноветвленные свертки 3x3. Это приводит к более быстрому выводу на графических процессорах, но может увеличить использование памяти на этапе обучения.
Недостатки: Использование механизмов на основе якорей и традиционных NMS означает, что YOLOv6 часто имеют переменную задержку в зависимости от количества обнаруженных объектов. Кроме того, CPU его CPU в целом менее оптимизирована по сравнению с более новыми архитектурами, разработанными для мобильных ЦП.
YOLOv10: Пионер сквозных решений
YOLOv10 значительно отличается от традиционной YOLO , устраняя узкое место последующей обработки. Созданная исследователями из Университета Цинхуа, она внедрила последовательную стратегию двойного назначения, чтобы устранить необходимость в немаксимальном подавлении (NMS).
Авторы: Ао Ван, Хуэй Чен, Лихао Лю и др.
Организация: Университет Цинхуа
Дата: 23.05.2024
Arxiv: YOLOv10: Real-Time End-to-End Object Detection
GitHub: YOLOv10 Tsinghua YOLOv10
Архитектура и сильные стороны
Отличительной особенностью YOLOv10 является его конструкция NMS. Традиционные детекторы генерируют избыточные прогнозы, которые необходимо фильтровать, что отнимает ценное время на вывод. YOLOv10 сопоставление «один ко многим» для тщательного контроля во время обучения, но переключается на сопоставление «один к одному» для вывода. Это гарантирует, что модель выдает ровно одну рамку на каждый объект, что значительно снижает разброс задержки.
Кроме того, YOLOv10 целостную конструкцию, ориентированную на эффективность и точность. Он использует легкие классификационные головки и пространственно-канальное декуплированное понижающее дискретизирование для уменьшения вычислительных затрат (FLOP) без ущерба для средней точности (mAP). Это делает его очень универсальным и подходящим для применения в различных областях, от автономного вождения до наблюдения в реальном времени.
Слабые стороны: Будучи в первую очередь академическим исследовательским проектом, YOLOv10 не обладать надежными инструментами корпоративного уровня, которые имеются в коммерчески поддерживаемых фреймворках. Несмотря на инновационность архитектуры, пользователи могут столкнуться с проблемами долгосрочного обслуживания и интеграции в сложные конвейеры CI/CD по сравнению с моделями, имеющими специальные группы поддержки.
Преимущества Ultralytics: Почему стоит выбрать YOLO26?
Хотя YOLOv6. YOLOv6 и YOLOv10 важные шаги в истории компьютерного зрения, модель Ultralytics остается лучшим выбором для разработчиков, стремящихся к максимальной производительности, простоте использования и поддержке экосистемы.
Выпущенный в январе 2026 года, YOLO26 объединяет в себе лучшие характеристики своих предшественников и одновременно предлагает революционные оптимизации для современного развертывания.
Основные преимущества YOLO26
- Сквозной дизайн NMS: основываясь на наследии YOLOv10, YOLO26 является сквозным по своей сути. Он полностью исключает NMS , обеспечивая детерминированную задержку и упрощенную логику развертывания.
- Оптимизация Edge-First: благодаря удалению Distribution Focal Loss (DFL) YOLO26 упрощает график модели для экспорта. Это приводит к ускорению CPU до 43%, что делает его бесспорным лидером в области пограничных вычислений на таких устройствах, как Raspberry Pi или мобильные телефоны.
- Оптимизатор MuSGD: Вдохновленный стабильностью обучения больших языковых моделей (LLM), YOLO26 использует оптимизатор MuSGD (гибрид SGD Muon). Это обеспечивает более быструю сходимость и более стабильное обучение, сокращая время и вычислительные затраты, необходимые для достижения оптимальной точности.
- Усовершенствованные функции потери: интеграция ProgLoss и STAL обеспечивает заметные улучшения в распознавании небольших объектов, что является критически важной функцией для съемки с дронов и удаленного наблюдения.
Непревзойденная поддержка экосистемы
Выбор Ultralytics не просто выбор архитектуры модели, это доступ к комплексной платформе разработки.
- Простота использования: Ultralytics является отраслевым стандартом благодаря своей простоте. Переключение между моделями или задачами (такими как оценка позы или OBB) требует минимальных изменений в коде.
- Эффективность обучения: Ultralytics славятся своей эффективностью использования памяти. В отличие от тяжелых моделей на основе трансформаторов, которые требуют огромного GPU , YOLO26 оптимизирована для эффективной работы на оборудовании потребительского класса.
- Универсальность: в отличие от конкурентов, которые часто сосредотачиваются исключительно на ограничительных прямоугольниках, Ultralytics из коробки поддерживает сегментацию экземпляров, классификацию и ориентированные ограничительные прямоугольники.
Обеспечьте будущее своих проектов
Использование Ultralytics гарантирует, что ваш проект останется совместимым с будущими усовершенствованиями. Когда выходит новая архитектура, такая как YOLO26, вы можете обновить свой производственный конвейер, просто изменив название модели в скрипте, без перезаписи циклов обучения или загрузчиков данных.
Пример кода: Беспрерывное обучение
Python Ultralytics Python объединяет эти модели в едином интерфейсе. Независимо от того, экспериментируете ли вы с возможностями YOLOv10 NMS YOLOv10 с сырой скоростью YOLO26, рабочий процесс остается неизменным.
from ultralytics import YOLO
# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a dataset (e.g., COCO8) with efficient settings
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Use GPU 0
)
# Run inference with NMS-free speed
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for simplified edge deployment
model.export(format="onnx")
Заключение
При сравнении YOLOv6-3.0 и YOLOv10, выбор часто зависит от конкретных аппаратных ограничений. YOLOv6. YOLOv6 остается сильным конкурентом для устаревших систем, в которые вложено много средств в TensorRT специализированные графические процессоры. YOLOv10 современный архитектурный подход, который упрощает постобработку и уменьшает количество параметров при аналогичной точности.
Однако для разработчиков, которые требуют лучшего из обоих миров — передовой архитектуры NMS в сочетании с надежной, поддерживаемой экосистемой — рекомендуется решениеUltralytics . Его превосходная CPU , усовершенствованный оптимизатор MuSGD и бесшовная интеграция с Ultralytics делают его наиболее универсальным и перспективным выбором для реальных приложений искусственного интеллекта.
Пользователям, заинтересованным в изучении других высокоэффективных моделей, мы также рекомендуем обратить внимание на YOLO11 для задач общего назначения в области компьютерного зрения или YOLO для обнаружения объектов с открытым словарем.