Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 против YOLOv8#

Эволюция обнаружения объектов в реальном времени ознаменовалась быстрой чередой прорывных архитектур, каждая из которых стремилась раздвинуть границы точности, скорости вывода и вычислительной эффективности. В этом подробном техническом руководстве мы сравниваем два важных этапа в развитии компьютерного зрения: YOLOv10 и Ultralytics YOLOv8. В то время как YOLOv8 установил высокоуниверсальный и готовый к производству стандарт, YOLOv10 привнес архитектурные изменения, направленные именно на устранение «узких мест» при постобработке.

Понимание отличительных преимуществ, архитектур и метрик производительности этих моделей имеет решающее значение для разработчиков и исследователей, стремящихся внедрить современные решения в области ИИ компьютерного зрения в реальных сценариях.

Link to this sectionТехнические характеристики и авторство#

Чтобы эффективно оценить эти модели, полезно понимать их происхождение и основную направленность соответствующих исследовательских групп.

Link to this sectionYOLOv10: сквозная (end-to-end) эффективность#

Разработанная исследователями из Университета Цинхуа, модель YOLOv10 была создана для решения проблемы вычислительных затрат, возникающих из-за этапов постобработки в предыдущих поколениях.

Узнай больше о YOLOv10

Link to this sectionUltralytics YOLOv8: универсальный стандарт#

Выпущенная в начале 2023 года, YOLOv8 быстро стала отраслевым стандартом благодаря своей надежной архитектуре и непревзойденной интеграции в более широкую экосистему машинного обучения.

  • Авторы: Гленн Джочер, Аюш Чаурасия и Цзин Цю
  • Организация: Ultralytics
  • Дата: 2023-01-10
  • GitHub: ultralytics/ultralytics

Узнай больше о YOLOv8

Link to this sectionАрхитектурные инновации#

Обе модели привносят значительные улучшения в традиционную архитектуру YOLO, хотя и затрагивают немного разные аспекты конвейера.

Link to this sectionАрхитектура YOLOv10#

Отличительной особенностью YOLOv10 является стратегия обучения без NMS. Традиционно детекторы объектов полагаются на Non-Maximum Suppression (NMS) при выводе, чтобы отфильтровать перекрывающиеся ограничивающие рамки. Этот шаг может привести к задержке и усложняет развертывание end-to-end. YOLOv10 использует согласованное двойное назначение во время обучения, что позволяет модели изначально предсказывать одну точную ограничивающую рамку для каждого объекта. Кроме того, она использует целостный дизайн модели, основанный на эффективности и точности, оптимизируя различные компоненты для значительного сокращения количества FLOPs и параметров.

Link to this sectionАрхитектура YOLOv8#

YOLOv8 представила детектирующую голову без привязок (anchor-free), отойдя от подходов своих предшественников, основанных на якорях. Это сокращает количество предсказаний рамок и ускоряет операции NMS. Кроме того, YOLOv8 включает модуль C2f (Cross-Stage Partial bottleneck с двумя свертками), который улучшает градиентный поток и позволяет сети изучать более богатые представления признаков без значительного увеличения вычислительных затрат. Структура с разделенной «головой» отделяет задачи определения объекта (objectness), классификации и регрессии, что приводит к более быстрой сходимости и более высокой общей точности.

Link to this sectionПроизводительность и бенчмарки#

При развертывании моделей на периферийных устройствах или облачных серверах компромисс между скоростью и точностью имеет первостепенное значение. В таблице ниже представлено прямое сравнение двух моделей разных размеров.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Примечание: Пустые ячейки указывают на метрики, официально не заявленные при идентичных условиях тестирования.

Как видно из данных, YOLOv10 демонстрирует исключительную эффективность использования параметров, часто соответствуя или превосходя mAP своих аналогов YOLOv8 при использовании меньшего количества параметров и FLOPs. Однако YOLOv8 остается невероятно конкурентоспособной, предлагая высокооптимизированную интеграцию TensorRT, которая гарантирует минимальную задержку вывода на современных GPU.

Аппаратное ускорение

При работе с производственными средами использование таких форматов, как ONNX или TensorRT, может значительно увеличить скорость вывода. И YOLOv8, и YOLOv10 поддерживают беспрепятственный экспорт в эти высокооптимизированные форматы графов.

Link to this sectionЭкосистема, эффективность обучения и универсальность#

Выбор модели выходит за рамки теоретических бенчмарков; опыт разработчика и окружающая экосистема не менее важны.

Link to this sectionПреимущество Ultralytics#

Одной из ключевых сильных сторон YOLOv8 является ее тесная интеграция в экосистему Ultralytics. Эта среда обеспечивает опыт «от новичка до профи», характеризующийся весьма интуитивным API на Python и обширной документацией. В отличие от ориентированных на исследования репозиториев, которые могут потребовать сложной настройки среды, модели Ultralytics славятся своей простотой использования.

Более того, YOLOv8 обладает врожденной универсальностью. В то время как YOLOv10 строго оптимизирована для обнаружения объектов, платформа Ultralytics позволяет разработчикам легко переключаться между задачами обнаружения объектов, сегментации экземпляров, классификации изображений, оценки позы и ориентированных ограничивающих рамок (OBB) в рамках одной и той же структуры библиотеки и API.

Link to this sectionТребования к памяти и обучение#

Модели Ultralytics YOLO разработаны с упором на эффективность обучения. Как правило, они потребляют меньше памяти во время обучения и вывода по сравнению со сложными моделями Transformer, что позволяет тебе обучать современные модели на потребительском оборудовании или стандартных облачных инстансах, не выходя за пределы памяти CUDA. Автоматическая настройка гиперпараметров и аугментация данных обеспечивают быструю сходимость.

Вот практический пример того, как просто обучить и проверить модель с помощью Python API от Ultralytics:

from ultralytics import YOLO

# Load a pretrained model (YOLOv8 recommended for general tasks)
model = YOLO("yolov8n.pt")

# Train the model on the COCO8 dataset with automatic memory management
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Run inference on a test image
predictions = model("https://ultralytics.com/images/zidane.jpg")
predictions[0].show()

Link to this sectionСледующее поколение: YOLO26#

Хотя YOLOv8 и YOLOv10 представляют собой выдающиеся вехи, область машинного обучения постоянно развивается. Для разработчиков, начинающих новые проекты, мы настоятельно рекомендуем использовать YOLO26, новейшую флагманскую модель от Ultralytics, выпущенную в январе 2026 года.

YOLO26 объединяет лучшие архитектурные достижения прошлых лет в единую, высокооптимизированную среду. Она наследует дизайн без NMS, впервые примененный в таких моделях, как YOLOv10, упрощая конвейеры развертывания и снижая изменчивость задержки. Кроме того, YOLO26 представляет оптимизатор MuSGD — гибрид, вдохновленный стабильностью обучения LLM, который обеспечивает более быструю и устойчивую сходимость.

Основные улучшения в YOLO26 включают:

  • До 43% быстрее вывод на CPU: оптимизирована для периферийных устройств за счет удаления Distribution Focal Loss (DFL).
  • ProgLoss + STAL: передовые функции потерь, которые значительно улучшают распознавание мелких объектов, что критически важно для изображений с дронов и датчиков IoT.
  • Улучшения для конкретных задач: специализированные архитектуры для сегментации, оценки позы и OBB, обеспечивающие высочайшую производительность во всех доменах компьютерного зрения.

Link to this sectionИдеальные варианты использования и стратегии развертывания#

При выборе между этими архитектурами учитывай конкретные потребности твоей среды развертывания:

  • Выбирай YOLOv10, если: ты работаешь над чистым конвейером обнаружения объектов, где критически важно выжать максимум эффективности параметров, и хочешь поэкспериментировать с ранними реализациями архитектур без NMS.
  • Выбирай Ultralytics YOLOv8, если: тебе нужна максимально стабильная, готовая к производству модель, поддерживаемая надежной платформой Ultralytics. Это идеальный выбор, если твой проект требует выполнения нескольких задач (например, обнаружение объектов, а затем их сегментация) с использованием унифицированной и простой в обслуживании кодовой базы.
  • Выбирай YOLO26 (рекомендуется), если: тебе нужен идеальный баланс между современной точностью, нативной эффективностью без NMS и максимально возможной скоростью на CPU и периферийном оборудовании.

Если ты изучаешь более широкий ландшафт, тебе также может быть интересно сравнить эти модели с YOLO11 или ознакомиться с конкретными интеграциями для периферийного развертывания, такими как Intel OpenVINO, для дальнейшего ускорения твоих приложений компьютерного зрения. Благодаря унифицированным инструментам, предоставляемым Ultralytics, развертывание надежных решений компьютерного зрения стало доступнее, чем когда-либо.

Контрибьюторы

Комментарии