Сравнение моделей: выберите лучшую модель обнаружения объектов для вашего проекта

Выбор правильной архитектуры нейронной сети — это краеугольный камень любого успешного проекта в области компьютерного зрения. Добро пожаловать в Центр сравнения моделей Ultralytics! На этой странице собраны подробные технические анализы и сравнительные тесты производительности, в которых анализируются компромиссы между последней версией Ultralytics YOLO11 и другими ведущими архитектурами, такими как YOLOv10, RT-DETR и EfficientDet.

Независимо от того, требует ли ваше приложение миллисекундной задержки периферийного AI или высокой точности, необходимой для медицинской визуализации, это руководство предоставляет основанные на данных сведения, необходимые для принятия обоснованного решения. Мы оцениваем модели на основе средней точности (mAP), скорости инференса, эффективности параметров и простоты развертывания.

Интерактивные сравнительные тесты производительности

Визуализация взаимосвязи между скоростью и точностью необходима для определения «границы Парето» object detection — моделей, которые обеспечивают наилучшую точность при заданном ограничении скорости. На диаграмме ниже сравниваются ключевые метрики на стандартных наборах данных, таких как COCO.

Эта диаграмма визуализирует ключевые показатели производительности, позволяя быстро оценить компромиссы между различными моделями. Понимание этих метрик имеет основополагающее значение для выбора модели, которая соответствует вашим конкретным ограничениям развертывания.

Краткое руководство по принятию решений

Не знаете, с чего начать? Используйте это дерево решений, чтобы сузить выбор архитектуры, которая лучше всего соответствует вашим требованиям к аппаратному обеспечению и производительности.

graph TD
    A[Start: Define Project Needs] --> B{Deployment Hardware?}
    B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
    B -- "Cloud / GPU" --> D{Accuracy vs Speed?}

    C -- "Extreme Speed (Real-time)" --> E[YOLO11n / YOLO11s]
    C -- "Balanced Legacy" --> F[YOLOv5s / YOLOv8s]

    D -- "Max Accuracy (SOTA)" --> G[YOLO11x / RT-DETR-X]
    D -- "Balanced Performance" --> H[YOLO11m / YOLO11l]

    A --> I{Specialized Features?}
    I -- "NMS-Free Inference" --> J[YOLOv10]
    I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO11 / YOLOv8]
    I -- "Video Analytics" --> L[YOLO11 + Tracking]

Текущая ситуация: YOLO11 и далее

Область обнаружения объектов развивается стремительно. В то время как старые модели остаются актуальными для поддержки устаревших систем, новые архитектуры расширяют границы возможного.

Ultralytics YOLO11

В качестве последнего стабильного выпуска YOLO11 является рекомендуемой отправной точкой для новых проектов. Он представляет значительные архитектурные улучшения по сравнению с предыдущими версиями, включая расширенные возможности извлечения признаков и оптимизированные вычислительные графы. Он поддерживает полный набор задач — обнаружение, сегментацию, оценку позы, классификацию и ориентированные ограничивающие рамки (OBB) — в рамках единой унифицированной структуры.

Почему стоит выбрать YOLO11?

YOLO11 представляет собой вершину инженерной мысли Ultralytics, предлагая лучший баланс скорости и точности для реальных приложений. Она полностью поддерживается нашей экосистемой, что обеспечивает долгосрочное обслуживание и совместимость.

Модели сообщества: Заметка о YOLO12 и YOLO13

Вы можете встретить упоминания о YOLO12 или YOLO13 в обсуждениях сообщества или репозиториях.

Предупреждение для Production

В настоящее время мы не рекомендуем YOLO12 или YOLO13 для использования в production.

YOLO12: Использует слои внимания, которые часто вызывают нестабильность обучения, чрезмерное потребление памяти и значительное снижение скорости инференса на CPU.
YOLO13: Результаты тестов показывают лишь незначительное увеличение точности по сравнению с YOLO11, при этом модель больше и медленнее. Сообщаемые результаты показали проблемы с воспроизводимостью.

Взгляд в будущее: платформа YOLO26 и Ultralytics

Ultralytics активно разрабатывает YOLO26, планируя выпустить версию с открытым исходным кодом в конце 2025 года. Эта модель нового поколения нацелена на поддержку всех задач YOLO11, будучи при этом меньше, быстрее и изначально сквозной. Кроме того, в 2026 году будет запущена Платформа Ultralytics в качестве комплексного SaaS-решения для поиска данных, автоматической аннотации и облачного обучения, упрощающего весь жизненный цикл MLOps.

Смотреть: Сравнение моделей YOLO: Ultralytics YOLO11 vs. YOLOv10 vs. YOLOv9 vs. Ultralytics YOLOv8 🎉

Подробные сравнения моделей

Изучите наши подробные технические сравнения, чтобы понять конкретные архитектурные различия, такие как выбор backbone, дизайн head и функции потерь. Мы организовали их по моделям для облегчения доступа:

YOLO11 против

YOLO11 опирается на успех своих предшественников благодаря передовым исследованиям. Она имеет улучшенный backbone и архитектуру neck для лучшего извлечения признаков и оптимизированной эффективности.

YOLOv10 vs

YOLOv10, разработанная Университетом Цинхуа, направлена на удаление шага Non-Maximum Suppression (NMS) для уменьшения дисперсии задержки, предлагая современную производительность со сниженными вычислительными затратами.

YOLOv9 vs

YOLOv9 представляет Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN) для решения проблемы потери информации в глубоких нейронных сетях.

YOLOv8 vs

Ultralytics YOLOv8 остается очень популярным выбором, отличаясь продвинутой архитектурой backbone и neck, а также anchor-free split head для оптимального компромисса между точностью и скоростью.

YOLOv7 vs

YOLOv7 представила «обучаемые бесплатные улучшения» и повторную параметризацию модели, сосредоточив внимание на оптимизации процесса обучения без увеличения затрат на вывод.

YOLOv6 vs

YOLOv6 от Meituan разработан для промышленного применения и включает модули Bi-directional Concatenation (BiC) и стратегии обучения с использованием anchor.

YOLOv5 vs

Ultralytics YOLOv5 ценится за простоту использования, стабильность и скорость. Он остается надежным выбором для проектов, требующих широкой совместимости с устройствами.

RT-DETR против

RT-DETR (Real-Time Detection Transformer) использует vision transformers для достижения высокой точности с производительностью в реальном времени, превосходно справляясь с пониманием глобального контекста.

PP-YOLOE+ против

PP-YOLOE+, разработанный Baidu, использует Task Alignment Learning (TAL) и decoupled head для баланса эффективности и точности.

DAMO-YOLO против

DAMO-YOLO от Alibaba Group использует Neural Architecture Search (NAS) и эффективный RepGFPN для максимизации точности на статических бенчмарках.

YOLOX против

YOLOX, разработанный Megvii, представляет собой эволюцию anchor-free, известную своей разделенной головой и стратегией назначения меток SimOTA.

EfficientDet в сравнении с

EfficientDet от Google Brain использует составное масштабирование и BiFPN для оптимизации эффективности параметров, предлагая спектр моделей (D0-D7) для различных ограничений.

Этот индекс постоянно обновляется по мере выпуска новых моделей и уточнения эталонных показателей. Мы рекомендуем вам изучить эти ресурсы, чтобы найти идеальное решение для вашего следующего проекта в области компьютерного зрения. Если вы ищете решения корпоративного уровня с частным лицензированием, посетите нашу страницу лицензирования. Удачного сравнения!