YOLOv10 YOLOv8: достижения в области архитектуры обнаружения объектов в реальном времени
Область обнаружения объектов в реальном времени постоянно развивается, а новые архитектуры расширяют границы скорости, точности и эффективности. В этом техническом сравнении подробно рассматриваются YOLOv10, академического прорыва, направленного на устранение немаксимального подавления (NMS), и Ultralytics YOLOv8, надежной платформы, соответствующей отраслевым стандартам и предназначенной для решения различных задач в области машинного зрения.
Анализируя архитектурные различия, показатели производительности и методологии обучения, разработчики могут принимать обоснованные решения при выборе модели для приложений компьютерного зрения, от периферийного развертывания до высокопроизводительного облачного инференса.
Сравнение метрик производительности
В следующей таблице представлено подробное сравнение ключевых показателей производительности. Обратите внимание, что YOLOv10 конкурентоспособной задержки за счет удаления этапа NMS , в то время как YOLOv8 сбалансированный профиль, подходящий для более широкого спектра задач, выходящих за рамки простого обнаружения.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv10: Пионер сквозных решений
YOLOv10 был представлен исследователями из Университета Цинхуа с основной целью устранения зависимости от немаксимального подавления (NMS) во время постобработки. Традиционные YOLO прогнозируют несколько ограничивающих рамок для одного объекта и полагаются на NMS отфильтровывания дубликатов. YOLOv10 последовательную стратегию двойного назначения во время обучения, что позволяет модели напрямую прогнозировать одну лучшую рамку для каждого объекта.
Архитектура и инновации
- ОбучениеNMS: благодаря использованию двойных меток — «один ко многим» для тщательного контроля и «один к одному» для эффективного вывода —YOLOv10 задержку вывода, вызванную NMS.
- Комплексный дизайн эффективности: архитектура включает в себя легкие классификационные головки и пространственно-канальное декуплированное понижающее дискретизирование для снижения вычислительных затрат (FLOP) без потери точности.
- Свертки с большим ядром: целенаправленное использование сверток с большим ядром по глубине улучшает рецептивное поле, помогая в обнаружении небольших объектов.
Метаданные:
- Авторы: Ao Wang, Hui Chen, Lihao Liu, и др.
- Организация:Университет Цинхуа
- Дата: 2024-05-23
- Arxiv:arXiv:2405.14458
- GitHub:THU-MIG/yolov10
Ultralytics YOLOv8: надежный отраслевой стандарт
Ultralytics YOLOv8 представляет собой зрелую, готовую к производству платформу, разработанную с учетом универсальности и простоты использования. Несмотря на то, что она использует стандартный NMS, ее высокооптимизированная архитектура и интеграция в Ultralytics делают ее предпочтительным выбором для разработчиков, которым требуется стабильность, поддержка многозадачности и беспроблемное развертывание.
Основные архитектурные преимущества
- Единая структура: в отличие от многих академических моделей, ограниченных обнаружением, YOLOv8 поддерживает сегментацию экземпляров, оценку позы, OBB и классификацию в рамках одной кодовой базы.
- Обнаружение без анкоров: отход от подходов, основанных на анкорах, для прямого прогнозирования центров объектов, упрощение процесса обучения и улучшение обобщения по различным наборам данных.
- Мозаичное дополнение: усовершенствованное дополнение данных в режиме реального времени повышает устойчивость к заслонениям и изменяющимся условиям освещения.
- Оптимизированная экосистема: пользователи получают преимущества от Ultralytics (ранее HUB) для управления наборами данных, обучения моделей и экспорта в форматы TensorRT, CoreML и ONNX одним щелчком мыши.
Метаданные:
- Авторы: Гленн Джокер, Аюш Чаурасия и Цзин Цю
- Организация:Ultralytics
- Дата: 2023-01-10
- GitHub:ultralytics/ultralytics
- Документация:Документация YOLOv8
Будущее сквозного обнаружения
В то время как YOLOv10 в области обнаружения NMS, недавно выпущенный YOLO26 основан на этой технологии. YOLO26 является нативным сквозным решением, в котором устранены NMS Distribution Focal Loss (DFL), что позволяет ускорить CPU до 43 %. Он интегрирует оптимизатор MuSGD и функции ProgLoss, обеспечивая превосходную стабильность и обнаружение мелких объектов по сравнению с YOLOv8 YOLOv10.
Варианты использования и реальные применения
Выбор между этими моделями часто зависит от конкретных ограничений среды развертывания.
Идеальные сценарии для YOLOv10
YOLOv10 особенно хорошо YOLOv10 для приложений, в которых задержка постобработки является узким местом.
- Анализ сцены с большим количеством объектов: в сценариях с плотными кластерами объектов, таких как обнаружение пешеходов, удаление NMS «пропуск» действительных обнаружений, которые значительно перекрываются.
- Устройства с низким энергопотреблением: уменьшенное количество FLOP и параметров помогает в развертывании на устройствах с ограниченными вычислительными возможностями, таких как Raspberry Pi или Jetson Nano, где важна каждая миллисекунда обработки.
Идеальные сценарии для Ultralytics YOLOv8
YOLOv8 лучшим выбором для комплексных решений в области искусственного интеллекта, требующих надежности и многозадачности.
- Комплексная промышленная инспекция: возможность сегментации позволяет точно обозначить дефекты, а не просто обвести их рамкой, что крайне важно для контроля качества в производстве.
- Спортивная аналитика: благодаря встроенной поддержке оценки позы YOLOv8 track движения track и ключевые точки скелета для биомеханического анализа.
- Аналитика розничной торговли: мощные возможности отслеживания объектов, интегрированные в Ultralytics , делают его идеальным инструментом для мониторинга потока покупателей и запасов товаров.
Простота использования и экосистема
Одним из наиболее значительных преимуществ выбора Ultralytics , такой как YOLOv8 или более новая YOLO26), является окружающая экосистема.
Простой Python : разработчики могут загружать, обучать и развертывать модели с помощью всего нескольких строк кода.
from ultralytics import YOLO # Load a model model = YOLO("yolov8n.pt") # Train model.train(data="coco8.yaml", epochs=100)Обширная документация: в документации Ultralytics представлены подробные руководства по всем вопросам, от настройки гиперпараметров до экспорта моделей для iOS Android.
- Эффективность использования памяти: Ultralytics оптимизированы для более низкого использования CUDA во время обучения по сравнению со многими альтернативами на основе Transformer, такими как RT-DETR, что позволяет использовать более крупные пакеты данных на стандартных потребительских графических процессорах.
Заключение
Обе архитектуры имеют свои преимущества. YOLOv10 является отличным академическим вкладом, демонстрирующим потенциал обнаружения NMS и обеспечивающим высокую эффективность для конкретных задач, связанных только с обнаружением.
Ultralytics YOLOv8 выделяется как универсальный и многофункциональный выбор, подкрепленный поддерживаемой экосистемой, которая упрощает весь жизненный цикл машинного обучения. Он остается лучшим выбором для разработчиков, которым необходимо быстро перейти от прототипа к производству по целому ряду задач, включая сегментацию и оценку позы.
Для тех, кто ищет абсолютную новейшую производительность, YOLO26 является лучшим выбором. Он сочетает в себе преимущества YOLOv10 , такие как сквозное решение NMS YOLOv10 надежностью, поддержкой многозадачности и простотой использования Ultralytics . Благодаря инновациям, таким как оптимизатор MuSGD и усовершенствованные функции потери, YOLO26 обеспечивает современный баланс скорости и точности для 2026 года.
Дополнительная литература
- Изучите новейшую модель SOTA: YOLO26
- Узнайте о трансформаторах реального времени: RT-DETR
- Понимание метрик: IoU mAP IoU
- Руководство по эффективному обучению: примеры советов по обучению